最近在学习论文的时候发现了在science上发表的关于新型的基于密度的聚类算法 Kmean算法有很多不足的地方,比如k值的确定,初始结点选择,而且还不能检测费球面类别的数据分布,对于第二个问题,提出了Kmean++,而其他不足还没有解决,dbscan虽然可以对任意形状分布的进行聚类,但是必须指定一个 ...
分类:
编程语言 时间:
2017-06-08 22:30:36
阅读次数:
307
Ref: https://onlinecourses.science.psu.edu/stat464/print/book/export/html/5 Two sample test 直接使用R的t-test t.test(n, t, alternative="two.sided", var.equ ...
分类:
移动开发 时间:
2017-06-07 11:16:22
阅读次数:
179
Ref: https://onlinecourses.science.psu.edu/stat464/print/book/export/html/4 使用非参数方法的优势: 1. 对总体分布做的假设少,所以总体分布未知也可以; 2. 容易做; 3. 一般对离群值更具鲁棒性robust; 4. 适用 ...
分类:
移动开发 时间:
2017-06-06 15:51:07
阅读次数:
167
Ref: https://onlinecourses.science.psu.edu/stat464/print/book/export/html/3 The Binomial Distribution in R: The Normal Distribution in R: 要执行t-test或者查 ...
分类:
移动开发 时间:
2017-06-06 14:16:34
阅读次数:
183
参考网址: https://onlinecourses.science.psu.edu/stat464/node/2 Binomial Distribution Normal Distribution 将正态分布标准化。这也就是Z-score Confidence Interval 在上面的前提下, ...
分类:
移动开发 时间:
2017-06-06 11:59:48
阅读次数:
250
CNN的发展史 上一篇回顾讲的是2006年Hinton他们的Science Paper,当时提到,2006年虽然Deep Learning的概念被提出来了,但是学术界的大家还是表示不服。当时有流传的段子是Hinton的学生在台上讲paper时,台下的机器学习大牛们不屑一顾,质问你们的东西有理论推导吗 ...
分类:
Web程序 时间:
2017-05-31 12:10:50
阅读次数:
408
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=4749 Problem Description 2013 is the 60 anniversary of Nanjing University of Science and Technology, an ...
分类:
其他好文 时间:
2017-05-28 15:27:10
阅读次数:
226
转载一篇文章 如何在 Kaggle 首战中进入前 10% Posted on 2016-04-29 | In Data Science | Introduction 本文采用署名 - 非商业性使用 - 禁止演绎 3.0 中国大陆许可协议进行许可。著作权由章凌豪所有。 Kaggle 是目前最大的 Da ...
分类:
其他好文 时间:
2017-05-25 18:58:58
阅读次数:
354
目录(?)[+] 目录(?)[+] 通过Dynamic Web TWAIN SDK和Node.js的组合,只需要几行代码就可以实现在浏览器中控制扫描仪,获取图像后上传到远程服务器。 原文:Document Imaging and Uploading With Dynamic Web TWAIN an ...
分类:
Web程序 时间:
2017-05-25 11:53:05
阅读次数:
361
关于算法,面太广。本系列只研究实际应用中遇到的核心算法。了解这些算法和应用,对java码农进阶是很有必要的。 对于Paxos学习论证过程中,证实一句话:有史以来学习paxos最好的地方wiki:Paxos (computer science) 目录 1.背景 2.Paxos算法 3.Muti-Pax ...
分类:
编程语言 时间:
2017-05-23 21:48:05
阅读次数:
187