转自:一个电商数据分析师的经验总结 http://www.woshipm.com/operate/36334.html 3、 聚类分析 零售行业的聚类分析主要是指将具有相似购物行为的顾客进行群体的细分,以支持精细化的营销活动,带来更大的营销效果,节省成本。Spss里面的聚类分析主 要有两种K-mea ...
分类:
其他好文 时间:
2017-04-06 12:20:33
阅读次数:
202
在K-Means聚类算法原理中,我们讲到了K-Means和Mini Batch K-Means的聚类原理。这里我们再来看看另外一种常见的聚类算法BIRCH。BIRCH算法比较适合于数据量大,类别数K也比较多的情况。它运行速度很快,只需要单遍扫描数据集就能进行聚类,当然需要用到一些技巧,下面我们就对B ...
分类:
编程语言 时间:
2017-04-05 21:59:07
阅读次数:
322
DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)是一种很典型的密度聚类算法,和K-Means,BIRCH这些一般只适用于凸样本集的聚类相比,DBSCAN既可以适用于凸样本集,也可以适用 ...
分类:
数据库 时间:
2017-04-05 21:57:11
阅读次数:
867
K-Means算法是无监督的聚类算法,它实现起来比较简单,聚类效果也不错,因此应用很广泛。K-Means算法有大量的变体,本文就从最传统的K-Means算法讲起,在其基础上讲述K-Means的优化变体方法。包括初始化优化K-Means++, 距离计算优化elkan K-Means算法和大数据情况下的 ...
分类:
编程语言 时间:
2017-04-05 21:54:39
阅读次数:
475
聚类算法就是通过一个固定的准则将若干个数据分成不同的类,而这个准则就是算法,即分类的标准。 1.样本: 数据是这样的,300个数据点: 这些数据显示成图形,如下图: 如上图,这是三百个数据点,单凭肉眼看,我无法分别点和点,那个和哪个是同一类,这些点很没有规律,但是请看下图: 如上图:我便可以看清楚这 ...
分类:
编程语言 时间:
2017-04-03 19:35:52
阅读次数:
243
cmd:text()用来在terminal上显示运行信息 cmd:option用来接受运行时的参数,第一个是参数名称,第二个是默认输入参数,第三个是备注。 1. 处理数据: dofile和require的功能差不多,不过require不会重新加载,dofile会,于是能够实现动态更新。 requir ...
分类:
其他好文 时间:
2017-04-03 11:26:31
阅读次数:
372
本周做数据的预处理,本次有两个方向, 第一个是用pca算法进行预处理,进行降维 第二方向是通过k-mean算法进行处理,想法是利用聚类分析中 的K-means算法对训练集进行预处理(在第二次任务中有说明) 时间 内容 4.2-4.8 进行k-mean算法处理数据,完成上周遗留的bug,写读书笔记。 ...
分类:
其他好文 时间:
2017-04-01 21:53:06
阅读次数:
360
一、文本挖掘定义 文本挖掘指的是从文本数据中获取有价值的信息和知识,它是数据挖掘中的一种方法。文本挖掘中最重要最基本的应用是实现文本的分类和聚类,前者是有监督的挖掘算法,后者是无监督的挖掘算法。 二、文本挖掘步骤 1)读取数据库或本地外部文本文件 2)文本分词 2.1)自定义字典 2.2)自定义停止 ...
分类:
其他好文 时间:
2017-04-01 15:49:48
阅读次数:
291
一、数据挖掘的常用方法 利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等,它们分别从不同的角度对数据进行挖掘。 分类。分类是找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库中的数据项映射到某 ...
分类:
其他好文 时间:
2017-04-01 15:46:46
阅读次数:
225
8种特殊建库测序 1. RNA-seq 2. 外显子测序 3. small RNA-seq 4. 单细胞DNA测序 5. 单细胞mRNA测序 6. 甲基化测序 7.Moleculo长测序 8. Ribozero和方向性RNA文库 1. RNA-seq 今天呐,主要是给大家介绍一下RNA-seq(RN ...
分类:
其他好文 时间:
2017-03-24 22:57:53
阅读次数:
3656