总结 样本类别分布不均衡处理(处理过拟合和欠拟合问题) 过抽样(上采样):通过增加分类中少数类样本的数量来实现样本均衡 from imblearn.over_sampling import SMOTE 欠抽样(下采样):通过减少分类中多数类样本的数量来实现样本均衡 (可能造成样本数据大量丢失) fr ...
分类:
其他好文 时间:
2020-07-28 00:04:11
阅读次数:
85
SPOS 2019-arxiv-Single Path One-Shot Neural Architecture Search with Uniform Sampling Institute:MEGVII、THU、HKUST Author:Zichao Guo、Xiangyu Zhang、Jian ...
分类:
其他好文 时间:
2020-07-26 22:58:05
阅读次数:
90
numpy、tensorflow手写SkipGram(没有negative sampling)和cbow: http://www.claudiobellei.com/2018/01/07/backprop-word2vec-python/ 这两种实现都需要动手算梯度,手动实现梯度下降,且不没有使用n ...
分类:
其他好文 时间:
2020-07-10 18:47:16
阅读次数:
53
定义:假设有很多组采样点,每组采样点都拟合一次模型,得到若干组模型。选定某个特征值(非训练集),根据训练出的多个模型会产生多个预测值。这些预测值的平均值和真实值之间的差值代表模型的偏差(bias);预测值的方差(variance)代表模型的方差。 用图表表示如下: ...
分类:
其他好文 时间:
2020-07-08 19:46:42
阅读次数:
55
校招在即,准备准备一些面试可能会用到的东西吧。希望这次面试不会被挂。 基本概念 说到机器学习模型的误差,主要就是bias和variance。 Bias:如果一个模型的训练错误大,然后验证错误和训练错误都很大,那么这个模型就是高bias。可能是因为欠拟合,也可能是因为模型是弱分类器。 Variance ...
分类:
编程语言 时间:
2020-06-24 19:43:11
阅读次数:
67
今天早上系统突然挂掉,查看数据库发现数据库内存使用完了,然后看trace日志发现: os thread scheduling delay history: (sampling every 1.000000 secs) 0.000000 secs at [ 08:58:05 ] NOTE: sched ...
分类:
系统相关 时间:
2020-06-24 19:29:27
阅读次数:
122
1. 主要计算参数公式weight?x+bias 2. 举例代码from keras.layers import Conv2D, MaxPooling2D, GlobalAveragePooling2Dfrom keras.layers import Dropout, Flatten, Densef ...
分类:
其他好文 时间:
2020-05-25 19:56:04
阅读次数:
351
word2vec简介 word2vec工具主要包含两个模型:跳字模型(skip gram)和连续词袋模型(CBOW),以及两种高效训练的方法:负采样(negative sampling)和层序softmax(hierarchical softmax)。word2vec词向量可以较好地表达不同词之间的 ...
分类:
编程语言 时间:
2020-05-19 18:20:51
阅读次数:
58
ondemand 简述: 1、采样时间:sampling_rate,单位us 2、cpu usage是仅统计最新1us的一个smaple周期,以%体现cpu busy程度。 3、一般情况下,next频率f = fmin + busy% * (fmax-fmin);如果busy% > up_thres ...
分类:
其他好文 时间:
2020-05-18 20:48:02
阅读次数:
82
PCM脉冲编码调制是Pulse Code Modulation的缩写。未经压缩的音频数据裸流。 模拟信号数字化必须经过三个过程,即抽样、量化和编码。 一、抽样(Sampling) 抽样是把模拟信号以其信号带宽2倍以上的频率提取样值,变为在时间轴上离散的抽样信号的过程。 二、量化(quantizing ...
分类:
其他好文 时间:
2020-05-18 11:56:24
阅读次数:
135