Spark提供了便利的Pipeline模型,可以轻松的创建自己的学习模型。 但是大部分模型都是需要提供参数的,如果不提供就是默认参数,那么怎么选择参数就是一个比较常见的问题。Spark提供在org.apache.spark.ml.tuning包下提供了模型选择器,可以替换参数然后比较模型输出。 目前 ...
分类:
其他好文 时间:
2018-10-22 00:00:34
阅读次数:
278
https://codeforces.com/contest/1064/problem/D 比赛时先交了个能 AC 的代码,之后感觉 会超时,然后重交了一份,开了个很大的静态数组,system test 时直接爆了 ML。 不过赛后说什么也没用了对吧。。。 题意 有一个迷宫,你可以上下左右走,但是要 ...
分类:
其他好文 时间:
2018-10-14 23:36:14
阅读次数:
313
SVM支持向量机的核:线性核。进行预测的时候我们需要把正负样本的数据装载在一起,同时我们label标签也要把正负样本的数据全部打上一个label。 第四步,开始训练和预测。ml(machine learning(机器学习模块)). ...
分类:
其他好文 时间:
2018-10-14 11:30:16
阅读次数:
96
这两天在一台物理机上安装centos7.5,主要是为了跑docker做一些测试环境,docker要升级内核的,3.x内核基本不够用,习惯性(如同一般在虚拟机下) rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.orgrpm -Uvh ht ...
分类:
其他好文 时间:
2018-10-08 00:39:55
阅读次数:
238
ES启动报如下错误[2018-10-06×××3:12:15,871][INFO][o.e.d.z.ZenDiscovery][es3]failedtosendjoinrequesttomaster[{es2}{B_JKs2_FT9KMjKElXz8Omg}{8IAmxXFTQ_isqHb3gMVC4g}{172.16.0.6}{172.16.0.6:9300}{ml.machine_memory=
分类:
其他好文 时间:
2018-10-06 23:42:35
阅读次数:
495
机器学习算法需要作用于数据,用来训练算法模型。数据集通常是以纯文本文件存储的表格数据,文件的每一行是一条数据记录,每条记录由多列组成,列之间用分隔符(一般是逗号,)分开,例如前面用到过的鸢尾花数据集。 在ML.NET中,使用TextLoader将文本文件导入到数据集。使用方式如下: filePath ...
分类:
Web程序 时间:
2018-10-02 20:35:23
阅读次数:
284
#7.2.1_定义类 一个类的功能:数据域、定义方法、初始化程序 初始化程序总是被命名为:_ _init_ _ (两个连续的下划线) #7.2.4_self参数 #self参数是指向对象本身的参数,那么它的作用域就是整个类,self.x可以直接访问实例变量x,self.ml()表示调用类的对象sel ...
分类:
编程语言 时间:
2018-10-02 17:21:50
阅读次数:
157
python版本:3.6.5 opencv版本:3.2.0 使用的jupyter notebook 源码如下: 错误如下: 错误原因: 传递的参数错误 train函数中第二个参数应该是数组的布局方式 应该根据传入数组的形式填cv2.ml.ROW_SAMPLE或者cv2.ml.COL_SAMPLE 例 ...
分类:
编程语言 时间:
2018-09-29 14:27:24
阅读次数:
6091
? 书中第十三章的程序,主要讲了汇编语言和 C/++ 相互调用的方法 ● 代码,数组求和的几种优化 ● C 内嵌汇编(代码段),检查对象大小 ● C++ 内嵌汇编(单独的函数),加密字符串 ● C++ 内嵌汇编(独立文件),线性查找。要点:单独使用 ml.exe 编译 index2.asm 生成 i ...
分类:
编程语言 时间:
2018-09-24 21:18:44
阅读次数:
162
概念 均方差 MSE mean square error 平均绝对差 MAE mean absolute error 交叉损失熵 cross entropy 欠拟合:训练集和测试集性能接近 过拟合:训练集远远高于测试集性能 有监督学习算法比较 knn 调节:n_neighbors 优点:模型很容易解 ...
分类:
编程语言 时间:
2018-09-24 13:51:44
阅读次数:
158