1. 基本概念1.1 数据挖掘:(1) 数据挖掘是从存放在数据集中的大量数据中挖掘出有趣知识的过程。
(2) 又称数据中知识发现(Knowledge Discovery Databases)或知识发现,它是从一个大量数据中抽取挖掘出未知的、有价值的模式和规律等知识的非平凡过程,它与数据仓库有着密切的联系。
(3) 广义的数据挖掘是指知识发现的全过程;狭义的数据挖掘是指统计分析、机器学习等发现数...
分类:
其他好文 时间:
2016-05-12 12:38:26
阅读次数:
178
最大似然函数
我们没法直接用求导解方程的办法直接求得最大值。可以采用EM算法
换成公式3形式求最大似然函数,其中Qi(z(i))用以下求,p(xi,zi;θ)为下式分子带入3中求最大似然函数的参数值为2.
其中 ,并且 也顺理成章地可以估计为 。
重复迭代前面两步,直到似然函数的值收敛为止。
下列为GMM参考代码l连接点击...
分类:
其他好文 时间:
2016-05-12 12:37:15
阅读次数:
195
上一节我们做完了查询和删除商品的功能,这一节我们做一下添加和更新商品的功能。
1. 添加商品
2. 更新商品...
分类:
其他好文 时间:
2016-05-12 12:37:15
阅读次数:
222
项目开发好以后,通常要在多个环境部署,象我们公司多达5种环境:本机环境(local)、(开发小组内自测的)开发环境(dev)、(提供给测试团队的)测试环境(sit)、预发布环境(pre)、正式生产环境(prod),每种环境都有各自的配置参数,比如:数据库连接、远程调用的ws地址等等。如果每个环境build前手动修改这些参数,显然太不fashion.
maven早就考虑到了这些问题,看下面的p...
分类:
其他好文 时间:
2016-05-12 12:36:26
阅读次数:
175
浏览器兼容问题一:不同浏览器的标签默认的外补丁和内补丁不同
问题症状:随便写几个标签,不加样式控制的情况下,各自的margin 和padding差异较大。
碰到频率:100%
解决方案:CSS里 *{margin:0;padding:0;}
备注:这个是最常见的也是最易解决的一个浏览器兼容性问题,几乎所有的CSS文件开头都会用通配符*来设置各个标签的内外补丁是0。
...
分类:
其他好文 时间:
2016-05-12 12:36:43
阅读次数:
105
乐观是一首激昂优美的进行曲,时刻鼓舞着你向事业的大路勇猛前进。——大仲马相关文章:自定义View之绘图篇(一):基础图形的绘制自定义View之绘图篇(二):路径(Path)自定义View之绘图篇(三):文字(Text)了解baseLine和FontMetrics有助于我们理解drawText()绘制文字的原理,下面我们一起来看看呗。一、baseLine 基线记得小时候练习字母用的是四线格本,把字母...
分类:
其他好文 时间:
2016-05-12 12:36:43
阅读次数:
212
最近由于工作的原因,各种事情,忙的要死.用户发现软件有问题,也不管是不是自己操作的问题,一口就咬定是软件的问题,询问什么问题时就”有问题”三个字回应也是醉了.
烦心事过去就不说,之前一直关于Docker看到了数据卷容器,就像知道数据卷容器有什么用处.查了不少资料,最基本的用处还是利用数据卷容器来备份、恢复、迁移数据卷.备份我们先创建一个data容器.sudo docker run -i -t -v...
分类:
其他好文 时间:
2016-05-12 12:35:29
阅读次数:
224
“冰山在海上之所以显得庄严宏伟,是因为他只有八分之一露出水面。”数据之所以显得能量巨大,是因为需要巨大的数据量为支撑,通过分析挖掘搞清楚水下的“八分之七”,才能得出最精华的结论。搞清楚水下,就是未来的机会所在...
分类:
其他好文 时间:
2016-05-12 12:35:57
阅读次数:
175
hive使用技巧(四)——巧用MapJoin解决数据倾斜问题...
分类:
其他好文 时间:
2016-05-12 12:33:15
阅读次数:
264
[Google Deep Learning 笔记] Logistic Classification...
分类:
其他好文 时间:
2016-05-12 12:33:22
阅读次数:
232
通常情况下,我们根据整个字段来索引数据,字段最长时,也不过十个字;但是还有一种情况,如果我们索引的是一篇文章呢?这时候如何处理这个字段,分词器很好的解决了这个问题。...
分类:
其他好文 时间:
2016-05-12 12:34:07
阅读次数:
161
第4课 :Spark Streaming的Exactly-One的事务处理和不重复输出彻底掌握
/* 王家林老师授课http://weibo.com/ilovepains 每天晚上20:00YY频道现场授课频道68917580*/
Exactly Once的事务处理:
1,数据零丢失:必须有可靠的数据来源和可靠的Receiver,且整个应用程序的metadata必须进行check...
分类:
其他好文 时间:
2016-05-12 12:33:25
阅读次数:
171
Hadoop 中的join分为三种
Reduce端join,适合于两个大表
Map端join,适合一个大表和一个小表,小表放到 Distribute Cache里面
semi join 当join只用到其中一个表中的一小部分时
Reduce端join
读入两个大表,对value按文件进行标记
在Reduce端收集属于不同文件的value到不同的list,对同一key的不同list中的value做笛卡...
分类:
其他好文 时间:
2016-05-12 12:31:29
阅读次数:
194
本文原文QQ空间链接:http://user.qzone.qq.com/29185807/blog/1462853926
本文原文csdn博文链接:
上一篇文章中,分析create和join,是创建和加入swarm集群。那么swarm集群是如何工作和管理的。
下面我们就来分析下。
1、swarm manage主体构建流程
先看看manage c...
分类:
其他好文 时间:
2016-05-12 12:31:46
阅读次数:
294
本篇博文将从如下几点组织文章:
一:案例演示
二:源码分析一:案例演示
这里只是贴出源码,后续会对改代码的实战和实验演示都会详细的补充。package com.dt.spark.sparkstreaming
import org.apache.spark.SparkConf
import org.apache.spark.sql.Row
import org.apache.spark.sql....
分类:
其他好文 时间:
2016-05-12 12:33:14
阅读次数:
265
关键字:bluetooth 蓝牙协议 HCI剖析 HCI概述 HCI笔记 LMP L2CAP SDP RFCOMM
作者:zhongjun
本着互相学习的目的,来分享此一系列的文章,欢迎转载,请注明作者,尊重版权,谢谢
文章有不当处请指正,共同学习
此系列目前这样打算:
LMP剖析 + 模拟源码:
蓝牙LMP剖析(一)
蓝牙LM...
分类:
其他好文 时间:
2016-05-12 12:31:14
阅读次数:
283
关键字:bluetooth 蓝牙协议 HCI剖析 HCI概述 HCI笔记 LMP L2CAP SDP RFCOMM
作者:zhongjun
本着互相学习的目的,来分享此一系列的文章,欢迎转载,请注明作者,尊重版权,谢谢
文章有不当处请指正,共同学习
此系列目前这样打算:
LMP剖析 + 模拟源码:
蓝牙LMP剖析(一)
蓝牙LM...
分类:
其他好文 时间:
2016-05-12 12:32:53
阅读次数:
247