行列断区法全称为行列断区转3D分析选号法,同样是由刘大军全新科学演绎并首次公开。简单地说,双色球红球号码33个,可以分为6行6列,如下图。 纵向看,33个红球分为6列,前三列每个列均含6个红球,后三列每个列均含5个红球。 经过统计每期开奖号码的红球,会发现一个有趣的现象: 开奖号码中的6个红球绝大多 ...
分类:
编程语言 时间:
2019-09-01 17:03:48
阅读次数:
84
1. 监督学习--分类 机器学习肿分类和预测算法的评估: a. 准确率 b.速度 c. 强壮行 d.可规模性 e. 可解释性 2. 什么是决策树/判定树(decision tree)? 3. 熵(entropy)概念: 变量的不确定越大,熵也就越大。 4. 决策树归纳算法(ID3) 5. 其他算法及 ...
分类:
编程语言 时间:
2019-06-25 11:57:46
阅读次数:
191
hadoop的基本概念伪分布式hadoop集群安装hdfs、MapReduce演示互联网正在从IT走向DT时代。大数据应用分析1、统计类的分析2、推荐类的分析3、机器学习(分类,聚类)4、人工智能、预测(算法)一、什么是hadoop官网:http://hadoop.apache.orghadoop是apache旗下的一套开源软件平台。是一个可靠的、可扩展的、可分布式计算的开源软件。apacheha
分类:
其他好文 时间:
2019-04-19 12:11:49
阅读次数:
176
分类与预测 分类主要是预测分类标号(离散属性),预测是建立连续值函数模型,预测给定自变量的因变量的值。 常用的分类与预测算法 | 算法名称 | 算法简介 | | : | : | | 回归分析 | 回归分析是确定预测属性(数值型)与其他变量间相互依赖的定量关系最常用的统计学方法。包括线性回归,非线性回 ...
分类:
其他好文 时间:
2019-04-16 01:19:20
阅读次数:
138
用户画像:通过算法聚合成一类实现用户信息标签化。 构建用户画像 ① 用户画像信息:基本属性,购买能力,行为特征,兴趣爱好,心理特征,社交网络 ② 行为建模:文本挖掘,自然语言处理,机器学习,预测算法,聚类算法 ③ 数据收集:网络日志数据,用户行为数据,网站交易数据 作用:了解用户的行为习惯,个性化营 ...
分类:
其他好文 时间:
2019-02-13 19:33:42
阅读次数:
176
GBDT又叫梯度提升决策树,它也属于Boosting框架。GBDT核心原理如下: 如图所示,用GBDT预测年龄,第一轮,预测到年龄为20,它和真实值之间的残差为10,第二轮,GBDT开始预测上一轮的残差10,预测结果为6,这一轮 的残差为4,第三轮,以年龄4为预测目标,预测来的值为3,和真实值之间相 ...
分类:
编程语言 时间:
2019-01-11 15:13:33
阅读次数:
288
算法概述 随机森林,顾名思义就是由很多决策树融合在一起的算法,它属于Bagging框架的一种算法。 随机森林的“森林”,它的弱模型是由决策树算法训练的(CART算法),CART算法即能做回归也能做分类,“随机”是指构造的模型有一定的随机性。 每一颗决策树模型的训练是通过自助采样法(Boostrap抽 ...
分类:
编程语言 时间:
2019-01-06 11:55:32
阅读次数:
355
模型融合算法概念 它不是具体的指某一个算法,而是一种把多个弱模型融合合并在一起变成一个强模型的思想 用模型融合算法的原因 1、单个模型容易过拟合,多个模型融合可以提高范化能力 2、单个模型预测能力不高,多个模型往往能提高预测能力 3、对于数据集过大或过小,可以分别进行划分和有放回的操作,产生不同的数 ...
分类:
编程语言 时间:
2019-01-05 23:20:23
阅读次数:
505
回归问题就是拟合输入变量x与数值型的目标变量y之间的关系,而线性回归就是假定了x和y之间的线性关系,公式如下: 如下图所示,我们可以通过绘制绘制(x,y)的散点图的方式来查看x和y之间是否有线性关系,线性回归模型的目标是寻找一条穿过这些散点的直线,让所有的点离直线的距离最短。这条完美直线所对应的参数 ...
分类:
编程语言 时间:
2019-01-02 21:14:17
阅读次数:
343
https://blog.csdn.net/nieson2012/article/details/51980943 目录 ?1.指数平滑定义及公式 ?2.一次指数平滑 ?3二次指数平滑 ?4.三次指数平滑 ?5指数平滑系数α的确定 1、指数平滑的定义及公式 产生背景:指数平滑由布朗提出、他认为时间序 ...
分类:
编程语言 时间:
2018-09-25 19:30:41
阅读次数:
275