计划:1. 番茄工作法图解:简单易行的时间管理方法 (完成)2.
大数据:互联网大规模数据挖掘与分布式处理3. 量化:大数据时代的企业管理5. 黑客与画家:来自计算机时代的高见 6. 倾听的力量:如何掌握沟通中的关键商业技巧
7. 失控 凯文·凯利8. 罗辑思维 罗振宇9. 说服力让你...
分类:
其他好文 时间:
2014-05-10 00:36:52
阅读次数:
289
1、数据挖掘解决的典型商业问题
需要强调的是,数据挖掘技术从一开始就是面向应用的。目前,在很多领域,数据挖掘(data mining)都是一个很时髦的词,尤其是在如银行、电信、保险、交通、零售(如超级市场)等商业领域。数据挖掘所能解决的典型商业问题包括:数据库营销(Database Marketing)、客户群体划分(Customer Segmentation & Classificatio...
分类:
其他好文 时间:
2014-05-09 22:46:23
阅读次数:
410
数据挖掘通过预测未来趋势及行为,做出前摄的、基于知识的决策。数据挖掘的目标是从数据库中发现隐含的、有意义的知识,主要有以下五类功能。
1、自动预测趋势和行为
数据挖掘自动在大型数据库中寻找预测性信息,以往需要进行大量手工分析的问题如今可以迅速直接由数据本身得出结论。一个典型的例子是市场预测问题,数据挖掘使用过去有关促销的数据来寻找未来投资中回报最大的用户,其它可预测的问题包括预报破产以...
分类:
其他好文 时间:
2014-05-09 22:01:47
阅读次数:
387
用这篇日志记录在做毕业课题的一些思考,按时间分割。2014/02至2014/04:
抽了一些时间,看林轩田老师的《机器学习基石》,大致对机器学习、数据挖掘有了一个认识,数据挖掘更侧重于挖掘大量或潜在的数据,从而对一些问题进行分析,机器学习则是通过大量已知数据的训练,形成机器的思维,从而“学会”对.....
分类:
其他好文 时间:
2014-05-09 10:14:27
阅读次数:
289
在之前为了寻找最有分类器,我们提出了如下优化问题:
在这里我们可以把约束条件改写成如下:
首先我们看下面的图示:
很显然我们可以看出实线是最大间隔超平面,假设×号的是正例,圆圈的是负例。在虚线上的点和在实线上面的两个一共这三个点称作支持向量。现在我们结合KKT条件分析下这个图。
我们从式子和式子可以看出如果那么,
这个也就说明时,w处于可行域的边界上,这时才是起作用的约束...
分类:
其他好文 时间:
2014-05-09 02:33:02
阅读次数:
345
1.Apriori算法
如果一个事务中有X,则该事务中则很有可能有Y,写成关联规则
{X}→{Y}
将这种找出项目之间联系的方法叫做关联分析。关联分析中最有名的问题是购物蓝问题,在超市购物时,有一个奇特的现象——顾客在买完尿布之后通常会买啤酒,即{尿布}→{啤酒}。原来,妻子嘱咐丈夫回家的时候记得给孩子买尿布,丈夫买完尿布后通常会买自己喜欢的啤酒。
考虑到规则的合理性,...
分类:
其他好文 时间:
2014-05-07 23:58:32
阅读次数:
529
How do you know what machine learning algorithm to
choose for your classification problem? Of course, if you really care about
accuracy, your best bet...
分类:
其他好文 时间:
2014-05-07 00:50:14
阅读次数:
438
简单的以下面曲线拟合例子来讲:直线拟合后,相比原来的点偏差最大,最后一个图完全拟合了数据点偏差最小;但是拿第一个直线模型去预测未知数据,可能会相比最后一个模型更准确,因为最后一个模型过拟合了,即第一个模型的方差比最后一个模型小。一般而言高偏差意味着欠拟合,高方差意味着过拟合。他们之间有如下的关系:
...
分类:
其他好文 时间:
2014-05-07 00:28:40
阅读次数:
946