听着the
mass,大气磅礴,心潮澎湃,不由得想写点什么。很长时间没有写写了,十分必要自己看看自己,变帅了还是变丑了。春天的北京,飘扬着柳絮,呼吸困难,心跳加速。还是先说正事。一、这几个月干了什么最主要的是完成了coursera上的几门课程:machine
learning, 机器学习基石, da...
分类:
其他好文 时间:
2014-07-22 23:08:32
阅读次数:
389
Xenia the beginner mathematician is a third year student at elementary school. She is now learning the addition operation.
The teacher has written down the sum of multiple numbers. Pupils should ca...
分类:
其他好文 时间:
2014-07-22 23:05:53
阅读次数:
382
第48期百度技术沙龙上的《大数据场景下主题检索应用》讲座介绍了很多训练大规模主题模型的技术细节。讲座回来后,我粗略整理了下讲座上涉及的主题模型和训练大规模模型相关的资料和文献。
1. 主题模型的发展历史
a. 布尔模型 Boolean model
b. 向量空间模型 VSM (Vector space model)
c. 潜在语义索引 LSI (Latent...
分类:
其他好文 时间:
2014-05-03 21:40:07
阅读次数:
371
上个月,参加了百度技术沙龙, 夏粉的《广告数据上的大规模机器学习》讲座介绍了大规模机器学习中的若干重要问题。遗憾的是,百度的相关算法没有公开的论文。
1. 数据处理
目标: 获取信息, 去除噪音
机器学习技术点: 选择对点击概率分布 预估足够多样本
解决方法: a. 不可见和不完整样本过滤; b. 样本采样; c. 异常样本检测
算法:a. 百度...
分类:
其他好文 时间:
2014-05-03 21:12:36
阅读次数:
378
在配置集群时,每个节点上有很多相同的配置,如启动服务相同、安装程序、提供相同的配置文件,甚至定制相同的任务计划来定期执行某些操作等。如果你管理的只是三两个节点配置起来还是相当简单的,但是有三五十台,甚至上百台你还要自已一个一个手动来配置,那就太痛苦了。因些..
分类:
其他好文 时间:
2014-05-03 20:42:02
阅读次数:
572
XPath 语法
XPath 使用路径表达式来选取 XML 文档中的节点或节点集。节点是通过沿着路径 (path) 或者步 (steps) 来选取的。
XML 实例文档
我们将在下面的例子中使用这个 XML 文档。
Harry Potter
29.99
Learning XML
39.95
XPath 使用路...
分类:
其他好文 时间:
2014-04-30 22:18:39
阅读次数:
327
在K-fold cross validation 下 比较不同的K的选择对于参数选择(模型参数,CV意义下的估计的泛化误差)以及实际泛化误差的影响。更一般的问题,在实际模型选择问题中,选择几重交叉验证比较合适?
交叉验证的背景知识:
CV是用来验证模型假设(hypothesis)性能的一种统计分析方法,基本思想是在某种意义下将原始数据进行分组,一部分作为训练集,一部分作为验证集,使用训练...
分类:
其他好文 时间:
2014-04-30 22:14:38
阅读次数:
327
在机器学习(Machine learning)领域,主要有三类不同的学习方法:
监督学习(Supervised learning)、
非监督学习(Unsupervised learning)、
半监督学习(Semi-supervised learning),
监督学习:通过已有的一部分输入数据与输出数据之间的对应关系,生成一个函数,将输入映射到合适的输出,例如分类。
非监督学习:直接...
分类:
其他好文 时间:
2014-04-30 22:12:38
阅读次数:
297
欢迎大家评论文章, 我会耐心解答. 本博客会经常更新, 所有原创文章, 都是亲自所写, 如有好的建议等请站内联系. 主要讲解关于Image Processing(IP),Image Analysis(IA), Computer Vision(CV) && Machine Learning(ML)的一些知识,希望结识更多志同道合的朋友, 同学. 艺无止境, 与君共勉. 欢迎大家提供有意义的评论. 希望和大家共同进步. 同时,提供关于本博客两个专栏的QQ群号,方便大家之间相互交流(^_^).欢迎大家加入,谢谢...
分类:
其他好文 时间:
2014-04-29 13:45:21
阅读次数:
389