一 机器学习、数据挖掘、深度学习经典博客网站 http://www.cnblogs.com/maybe2030 1. 算法(包括机器学习算法、进化计算、群体智能优化算法等) [Machine Learning] 深度学习中消失的梯度 [Machine Learning] logistic函数和sof ...
分类:
其他好文 时间:
2018-10-01 22:35:52
阅读次数:
283
今年 1 月,谷歌人工智能负责人 Jeff Dean(当时还是谷歌大脑负责人)与 2017 年图灵奖得主、体系结构巨擘 David Patterson(当时获奖结果尚未公布)联合发表了题为《计算机体系结构黄金时代:赋能机器学习革命》的文章。文章指出,机器学习算法正在革命性地着手解决人类社会最为巨大的 ...
分类:
其他好文 时间:
2018-09-30 00:55:18
阅读次数:
179
1. 深度学习是当前很热门的机器学习算法,在深度学习中,涉及到大量的矩阵相乘,现在需要计算三个稠密矩阵A,B,C的乘积ABC,假设三个矩阵的尺寸分别为m*n,n*p,p*q,且 m<n<p<q,以下计算顺序效率最高的是() A. ABC B. (AC)B C. A(BC) D. 所有效率都相同 解答 ...
分类:
其他好文 时间:
2018-09-21 13:28:15
阅读次数:
234
文章转自 https://blog.csdn.net/jameshadoop/article/details/44905643 Elasticsearch是一个实时的分布式搜索和分析引擎。它可以帮助你用前所未有的速度去处理大规模数据。 它可以用于全文搜索,结构化搜索以及分析,当然你也可以将这三者进行 ...
分类:
其他好文 时间:
2018-09-21 00:40:20
阅读次数:
229
一些废话,也可能不是废话。可能对,也可能不对。 机器学习的定义:如果一个程序可以在任务T上,随着经验E的增加,效果P也可以随之增加,则称这个程序可以在经验中学习。 “程序”指的是需要用到的机器学习算法,算法的效果除了依赖于训练数据,也依赖于从数据种提取的特征。 也可以说机器学习的是特征和任务之间的关 ...
分类:
其他好文 时间:
2018-09-20 18:49:02
阅读次数:
170
欢迎大家前往 "腾讯云+社区" ,获取更多腾讯海量技术实践干货哦~ 本文由 "roganhuang " 发表于 "云+社区专栏" 导语 随着腾讯云业务的扩大,母机数量越来越多。为减少人力并实现母机故障的自动化定位,本文尝试利用机器学习算法,通过对历史故障母机的日志数据学习,训练模型实现自动化分析定位 ...
分类:
其他好文 时间:
2018-09-13 14:13:33
阅读次数:
138
看了原理,总觉得需要用具体问题实现一下机器学习算法的模型,才算学习深刻。而写此博文的目的是,网上关于K-NN解决此问题的博文很多,但大都是调用Python高级库实现,尤其不利于初级学习者本人对模型的理解和工程实践能力的提升,也不利于Python初学者实现该模型。 本博文的特点: 一 全面性地总结K- ...
分类:
编程语言 时间:
2018-09-11 11:15:44
阅读次数:
308
MLlib是Spark提供提供机器学习的库,专为在集群上并行运行的情况而设计。MLlib包含很多机器学习算法,可在Spark支持的所有编程语言中使用。MLlib设计理念是将数据以RDD的形式表示,然后在分布式数据集上调用各种算法。其实,MLlib就是RDD上一系列可供调用的函数的集合。本文主要内容有简介、数据类型、统计、算法。
分类:
其他好文 时间:
2018-09-10 00:53:20
阅读次数:
202
这几年来,机器学习和数据挖掘非常火热,它们逐渐为世界带来实际价值。与此同时,越来越多的机器学习算法从学术界走向工业界,而在这个过程中会有很多困难。数据不平衡问题虽然不是最难的,但绝对是最重要的问题之一。 一、数据不平衡 在学术研究与教学中,很多算法都有一个基本假设,那就是数据分布是均匀的。当我们把这 ...
分类:
其他好文 时间:
2018-09-09 14:53:15
阅读次数:
710
1.前言:为什么我们要关心模型的bias和variance? 大家平常在使用机器学习算法训练模型时,都会划分出测试集,用来测试模型的准确率,以此评估训练出模型的好坏。但是,仅在一份测试集上测试,存在偶然性,测试结果不一定准确。那怎样才能更加客观准确的评估模型呢,很简单,多用几份测试数据进行测试,取多 ...
分类:
其他好文 时间:
2018-09-07 17:59:18
阅读次数:
638