15 分钟用 ML 破解一个验证码系统 http://python.jobbole.com/89004/ 相关代码: http://t.cn/R8yFJiN 关于验证码识别的参考文章: https://medium.com/@ageitgey/how-to-break-a-captcha-syste ...
分类:
编程语言 时间:
2018-01-30 23:08:59
阅读次数:
217
应用ML是一个高度迭代的过程 Idea Code Experment ... 去不断地调整超参数。 Train/Dev/Test sets 通常将数据集划分为Train/Dev/Test集。 Training set: 用于模型的训练 Hold out cross validation set/De ...
分类:
移动开发 时间:
2018-01-29 20:13:22
阅读次数:
656
主要讲了NERC的四种方式, NERC Feature,NERC rules, NERC ML和statistical NERC。NERC Feature主要讲在一个窗口中,其他token可以根据三种不同的features定下自己是什么分类,从而定义主token是什么分类。NERC rules主要讲... ...
分类:
其他好文 时间:
2018-01-29 19:19:43
阅读次数:
186
整个代码段改为 // 输入 int N, ML, MD; int AL[MAX_ML], BL[MAX_ML], DL[MAX_ML]; int AD[MAX_MD], BD[MAX_MD], DD[MAX_MD]; int d[MAX_N]; //最短距离 bool updated; // 是否有 ...
分类:
其他好文 时间:
2018-01-27 15:22:57
阅读次数:
143
MLlib中众多机器学习算法API在单一管道或工作流中更容易相互结合起来使用。管道的思想主要是受到scikit-learn库的启发。 ML API使用Spark SQL中的DataFrame作为机器学习的数据集。DataFrame不同的列可以分别存储文本,特征向量,真实的Lables,和预测值。 T ...
分类:
其他好文 时间:
2018-01-19 14:03:29
阅读次数:
172
一直以来对OpenCV的边缘检测不满意,现在的边缘检测主要是基于各种算子,很多时候,边缘没办法非常细致的分割出来,后面ML的加入提供了更多的思路,在这里记录一下,最近的一些探索和想法,首先上一张图。 目的在于提取图像中黑色纹路的地方,尝试过边缘增强,对比度增强算法,各种enhancement。 效果 ...
分类:
其他好文 时间:
2018-01-18 17:01:15
阅读次数:
164
UCI:加州大学欧文分校开放的经典数据集,被很多数据挖掘实验室采用。 http://archive.ics.uci.edu/ml/datasets.html CEIC:超过128个国家的经济数据,能精确查找GDP、进出口零售,销售等深度数据。 http://www.ceicdata.com/zh-h ...
分类:
其他好文 时间:
2018-01-17 22:29:55
阅读次数:
199
Spark ML Pipeline基于DataFrame构建了一套High-level API,我们可以使用MLPipeline构建机器学习应用,它能够将一个机器学习应用的多个处理过程组织起来,通过在代码实现的级别管理好每一个处理步骤之间的先后运行关系,极大地简化了开发机器学习应用的难度。 Spar ...
分类:
其他好文 时间:
2018-01-08 01:07:15
阅读次数:
218
Spark2.0的机器学习算法比之前的改变最大的是2.0基本采用了dataframe来实现的,但之前的都是用的RDD,看官网说貌似在3.0的时候RDD就不用了!还有一个就是hiveContext和sqlContext进行了合并,统一是sessioncontext。 在spark.ml中,实现了加速失 ...
分类:
编程语言 时间:
2018-01-07 20:19:22
阅读次数:
1014
P1292 倒酒 题目描述 Winy是一家酒吧的老板,他的酒吧提供两种体积的啤酒,a ml和b ml,分别使用容积为a ml和b ml的酒杯来装载。 酒吧的生意并不好。Winy发现酒鬼们都非常穷。有时,他们会因为负担不起aml或者bml啤酒的消费,而不得不离去。因此,Winy决定出售第三种体积的啤酒 ...
分类:
其他好文 时间:
2017-12-30 21:35:49
阅读次数:
176