码迷,mamicode.com
首页 > 其他好文
【数据挖掘】基础
1. 基本概念1.1 数据挖掘:(1) 数据挖掘是从存放在数据集中的大量数据中挖掘出有趣知识的过程。 (2) 又称数据中知识发现(Knowledge Discovery Databases)或知识发现,它是从一个大量数据中抽取挖掘出未知的、有价值的模式和规律等知识的非平凡过程,它与数据仓库有着密切的联系。 (3) 广义的数据挖掘是指知识发现的全过程;狭义的数据挖掘是指统计分析、机器学习等发现数...
分类:其他好文   时间:2016-05-12 12:38:26    阅读次数:178
高斯混合模型用到的几个公式
最大似然函数 我们没法直接用求导解方程的办法直接求得最大值。可以采用EM算法 换成公式3形式求最大似然函数,其中Qi(z(i))用以下求,p(xi,zi;θ)为下式分子带入3中求最大似然函数的参数值为2. 其中  ,并且  也顺理成章地可以估计为  。 重复迭代前面两步,直到似然函数的值收敛为止。 下列为GMM参考代码l连接点击...
分类:其他好文   时间:2016-05-12 12:37:15    阅读次数:195
【SSH网上商城项目实战09】添加和更新商品类别功能的实现
上一节我们做完了查询和删除商品的功能,这一节我们做一下添加和更新商品的功能。 1. 添加商品 2. 更新商品...
分类:其他好文   时间:2016-05-12 12:37:15    阅读次数:222
Maven利用Profile构建不同环境的部署包
项目开发好以后,通常要在多个环境部署,象我们公司多达5种环境:本机环境(local)、(开发小组内自测的)开发环境(dev)、(提供给测试团队的)测试环境(sit)、预发布环境(pre)、正式生产环境(prod),每种环境都有各自的配置参数,比如:数据库连接、远程调用的ws地址等等。如果每个环境build前手动修改这些参数,显然太不fashion. maven早就考虑到了这些问题,看下面的p...
分类:其他好文   时间:2016-05-12 12:36:26    阅读次数:175
初识-常见浏览器兼容性问题与解决方案
浏览器兼容问题一:不同浏览器的标签默认的外补丁和内补丁不同 问题症状:随便写几个标签,不加样式控制的情况下,各自的margin 和padding差异较大。 碰到频率:100% 解决方案:CSS里    *{margin:0;padding:0;} 备注:这个是最常见的也是最易解决的一个浏览器兼容性问题,几乎所有的CSS文件开头都会用通配符*来设置各个标签的内外补丁是0。 ...
分类:其他好文   时间:2016-05-12 12:36:43    阅读次数:105
自定义View之绘图篇(四):baseLine和FontMetrics
乐观是一首激昂优美的进行曲,时刻鼓舞着你向事业的大路勇猛前进。——大仲马相关文章:自定义View之绘图篇(一):基础图形的绘制自定义View之绘图篇(二):路径(Path)自定义View之绘图篇(三):文字(Text)了解baseLine和FontMetrics有助于我们理解drawText()绘制文字的原理,下面我们一起来看看呗。一、baseLine 基线记得小时候练习字母用的是四线格本,把字母...
分类:其他好文   时间:2016-05-12 12:36:43    阅读次数:212
自己学Docker:7.数据卷容器的备份、恢复
最近由于工作的原因,各种事情,忙的要死.用户发现软件有问题,也不管是不是自己操作的问题,一口就咬定是软件的问题,询问什么问题时就”有问题”三个字回应也是醉了. 烦心事过去就不说,之前一直关于Docker看到了数据卷容器,就像知道数据卷容器有什么用处.查了不少资料,最基本的用处还是利用数据卷容器来备份、恢复、迁移数据卷.备份我们先创建一个data容器.sudo docker run -i -t -v...
分类:其他好文   时间:2016-05-12 12:35:29    阅读次数:224
系统架构师成长之路(三)
“冰山在海上之所以显得庄严宏伟,是因为他只有八分之一露出水面。”数据之所以显得能量巨大,是因为需要巨大的数据量为支撑,通过分析挖掘搞清楚水下的“八分之七”,才能得出最精华的结论。搞清楚水下,就是未来的机会所在...
分类:其他好文   时间:2016-05-12 12:35:57    阅读次数:175
hive使用技巧(四)——巧用MapJoin解决数据倾斜问题
hive使用技巧(四)——巧用MapJoin解决数据倾斜问题...
分类:其他好文   时间:2016-05-12 12:33:15    阅读次数:264
[Google Deep Learning 笔记] Logistic Classification
[Google Deep Learning 笔记] Logistic Classification...
分类:其他好文   时间:2016-05-12 12:33:22    阅读次数:232
全文索引----中文分词器mmseg4j
通常情况下,我们根据整个字段来索引数据,字段最长时,也不过十个字;但是还有一种情况,如果我们索引的是一篇文章呢?这时候如何处理这个字段,分词器很好的解决了这个问题。...
分类:其他好文   时间:2016-05-12 12:34:07    阅读次数:161
第4课 :Spark Streaming的Exactly-One的事务处理和不重复输出彻底掌握
第4课 :Spark Streaming的Exactly-One的事务处理和不重复输出彻底掌握 /* 王家林老师授课http://weibo.com/ilovepains  每天晚上20:00YY频道现场授课频道68917580*/   Exactly Once的事务处理: 1,数据零丢失:必须有可靠的数据来源和可靠的Receiver,且整个应用程序的metadata必须进行check...
分类:其他好文   时间:2016-05-12 12:33:25    阅读次数:171
Hadoop Join
Hadoop 中的join分为三种 Reduce端join,适合于两个大表 Map端join,适合一个大表和一个小表,小表放到 Distribute Cache里面 semi join 当join只用到其中一个表中的一小部分时 Reduce端join 读入两个大表,对value按文件进行标记 在Reduce端收集属于不同文件的value到不同的list,对同一key的不同list中的value做笛卡...
分类:其他好文   时间:2016-05-12 12:31:29    阅读次数:194
【原创】swarm源码分析(2)---manage流程与store
本文原文QQ空间链接:http://user.qzone.qq.com/29185807/blog/1462853926 本文原文csdn博文链接:      上一篇文章中,分析create和join,是创建和加入swarm集群。那么swarm集群是如何工作和管理的。        下面我们就来分析下。 1、swarm manage主体构建流程 先看看manage c...
分类:其他好文   时间:2016-05-12 12:31:46    阅读次数:294
第5课:基于案例一节课贯通Spark Streaming流计算框架的运行源码
本篇博文将从如下几点组织文章: 一:案例演示 二:源码分析一:案例演示 这里只是贴出源码,后续会对改代码的实战和实验演示都会详细的补充。package com.dt.spark.sparkstreaming import org.apache.spark.SparkConf import org.apache.spark.sql.Row import org.apache.spark.sql....
分类:其他好文   时间:2016-05-12 12:33:14    阅读次数:265
蓝牙L2CAP剖析(一)
关键字:bluetooth 蓝牙协议  HCI剖析 HCI概述 HCI笔记 LMP L2CAP SDP RFCOMM  作者:zhongjun 本着互相学习的目的,来分享此一系列的文章,欢迎转载,请注明作者,尊重版权,谢谢 文章有不当处请指正,共同学习 此系列目前这样打算: LMP剖析 + 模拟源码: 蓝牙LMP剖析(一) 蓝牙LM...
分类:其他好文   时间:2016-05-12 12:31:14    阅读次数:283
蓝牙L2CAP剖析(二)
关键字:bluetooth 蓝牙协议  HCI剖析 HCI概述 HCI笔记 LMP L2CAP SDP RFCOMM  作者:zhongjun 本着互相学习的目的,来分享此一系列的文章,欢迎转载,请注明作者,尊重版权,谢谢 文章有不当处请指正,共同学习 此系列目前这样打算: LMP剖析 + 模拟源码: 蓝牙LMP剖析(一) 蓝牙LM...
分类:其他好文   时间:2016-05-12 12:32:53    阅读次数:247
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!