斯坦福机器学习公开课---1. 机器学习简单介绍
1.1 介绍
机器学习流行原因---
1) 由人工智能AI发展来的一个领域
2) 是计算机需要开发的一项新的能力,涉及工业和基础学科中的很多内容。
应用学习算法,如设计自主机器人,计算生物学和其他被机器学习影响的领域。
1.2 机器学习应用
1) 数据挖掘
网站点击流数据、电子医疗记录、计算生物...
分类:
其他好文 时间:
2015-02-02 21:38:06
阅读次数:
1210
点击流(ClickStream)是指用户在网站上持续访问的轨迹。众所周知,用户对网站的每次访问包含了一系列的点击动作行为,这些点击行为数据就构成了点击流数据(ClickStreamData),它代表了用户浏览网站的整个流程。目前点击流数据的获取方法有很多,例如通过JS进行事件捕获、发..
分类:
其他好文 时间:
2015-01-14 18:19:11
阅读次数:
201
背景是设计一个实时数据接入的模块,负责接收客户端的实时数据写入(如日志流,点击流),数据支持直接下沉到HBase上(后续提供HBase上的查询),或先持久化到Kafka里,方便后续进行一些计算和处理,再下沉到文件系统或做别的输出。
在设计中,对于客户端和服务端有这么些目标。
客户端需要支持多语言(Java,C++),做得尽量轻量级,只要连上服务端的ip:port,以RPC的形式调用简单的write就可以把数据写出去。客户端不承担任何逻辑的处理,服务端的负载均衡对客户端是透明的。
服务端想要做的是一个去中心...
分类:
其他好文 时间:
2014-07-04 08:59:19
阅读次数:
552