(一) 数据处理 ① 插值拟合 主要用于对数据的补全和基本的趋势分析 ② 小波分析,聚类分析(高斯混合聚类,K-均值聚类等等) 主要用于诊断数据异常值并进行剔除 ③ 主成成分分析、线性判别分析、局部保留投影等 主要用于多维数据的降维处理,减少数据冗余 ④ 均值、方差分析、协方差分析等统计方法 主要用 ...
分类:
其他好文 时间:
2020-02-12 16:28:34
阅读次数:
117
介绍 为训练营课程 《Python 数据分析入门与进阶》的第八节,在该章节中我们将利用提供的课程数据来进行一次实战性质的时间序列和聚类分析。 知识点 数据处理 数据可视化 中文分词 文本聚类 数据概览 本次课程的数据来源于运行过程中产生的真实数据,我们对部分数据进行了脱敏处理。 首先,我们需要下载课 ...
分类:
编程语言 时间:
2020-02-07 15:14:00
阅读次数:
128
1. 概述 系统聚类法也称为多层次聚类法,分类的单位由高到低呈树状结构,且所处的位置越低其包含的样本点就越少,共同特征越多。这种方法适合于数据量较小的情况,当数据量较大时系统聚类法的速度较慢。 2. 算法核心思想 其做法是开始时把每个样品作为一类,然后把最靠近的两个或若干个样品(即距离最小的群品)首 ...
分类:
其他好文 时间:
2020-02-06 13:04:45
阅读次数:
131
平摊分析(Amortized Analysis) 参考链接:https://blog.csdn.net/Ying_Xu/article/details/51433497 1、聚类分析 2、记账方法 3、势能方法 其中的公式Ci表示为执行当前操作需要的花销 push操作:势能增加1,操作花销为1,因此 ...
分类:
其他好文 时间:
2020-02-04 23:24:50
阅读次数:
71
1 import pandas as pd 2 import numpy as np 3 from sklearn.cluster import KMeans 4 import matplotlib.pyplot as plt 5 6 7 def stand_sca(data): 8 """ 9 标 ...
分类:
其他好文 时间:
2019-12-29 20:10:30
阅读次数:
201
什么是业务逻辑? 什么是正则表达式? 以上为提问 第5章 应用安全 5.1 应用安全概述 搭建方式的变化;早期的应用系统采用的客户/服务器模式是一种双层的结构,通常是将一台个人计算机做客户机使用,另外一台服务器用于存放后台的数据库系统,应用程序可以和客户端直接相连,中间没有其他的逻辑。程序的衣物逻辑 ...
分类:
其他好文 时间:
2019-12-18 23:41:51
阅读次数:
105
数据分析与挖掘 学习&实战记录 从大量数据(包括文本)中挖掘出隐含的、未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程,就是 数据挖掘 。 数据挖掘基础 数据挖掘基本任务 数据挖掘的基本任务包括利用分类预测、聚类分析、关联规则 ...
分类:
其他好文 时间:
2019-12-18 09:24:38
阅读次数:
110
13聚类分析和判别分析 聚类分析 什么是聚类分析? 聚类:数据对象的集合 在同一集群内彼此相似 与其他集群中的对象不同 聚集分析 将一组数据对象分组为群集,即为分组 聚类是无监督的分类:没有预定义的类。 典型应用 作为了解数据分布的独立工具。 作为其它算法的预处理步骤 什么是好的聚类? 良好的聚类方 ...
分类:
其他好文 时间:
2019-12-11 21:06:41
阅读次数:
97
投资机构或电商企业等积累的客户交易数据繁杂。需要根据用户的以往消费记录分析出不同用户群体的特征与价值,再针对不同群体提供不同的营销策略。 用户分析指标 根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个神奇的要素,这三个要素构成了数据分析最好的指标 R-最近一次消费(Rec ...
分类:
编程语言 时间:
2019-12-07 21:03:21
阅读次数:
94
k均值聚类算法(k-means clustering algorithm)是一种迭代求解的聚类分析算法,其步骤是随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚 ...
分类:
编程语言 时间:
2019-11-20 14:11:33
阅读次数:
97