码迷,mamicode.com
首页 > 编程语言 > 详细

Python高级数据处理与可视化(一)

时间:2017-01-23 19:02:18      阅读:277      评论:0      收藏:0      [点我收藏+]

标签:for   res   height   bsp   png   style   cal   sed   min   

1. 聚类分析

  聚类分析(cluster analysis):以相似性为基础把相似的对象通过静态分类的方法分成不同的组别或更多的子集。特性:基于相似性,有多个聚类中心。

  K-Means:「K-均值」算法表示以空间中K个点为中心进行聚类,对最靠近他们的对象归类。

    技术分享

技术分享
In [47]: from numpy import vstack

In [48]: from scipy.cluster.vq import kmeans,vq

In [49]: list1 = [88.0,74.0,96.0,85.0]

In [50]: list2 = [92.0,99.0,95.0,94.0]

In [51]: list3 = [91.0,87.0,99.0,95.0]

In [52]: list4 = [78.0,99.0,97.0,81.0]

In [53]: list5 = [88.0,78.0,98.0,84.0]

In [54]: list6 = [100.0,95.0,100.0,92.0]

In [55]: data = vstack((list1,list2,list3,list4,list5,list6))  # Stack arrays in sequence vertically (row wise).Take a sequence of arrays and stack them vertically to make a single array. 

In [61]: centroids,_ = kmeans(data,2)  # Performs k-means on a set of observation vectors forming k clusters.

In [62]: result,_ = vq(data,centroids)  # Assign codes from a code book to observations.

In [63]: result
Out[63]: array([1, 0, 0, 0, 1, 0])
根据成绩进行聚类分析

  numpy.vstack: https://docs.scipy.org/doc/numpy/reference/generated/numpy.vstack.html

  scipy.cluster.vq.kmeans: https://docs.scipy.org/doc/scipy/reference/generated/scipy.cluster.vq.kmeans.html#scipy.cluster.vq.kmeans

  scipy.cluster.vq.vq: https://docs.scipy.org/doc/scipy/reference/generated/scipy.cluster.vq.vq.html

 

 

2. Matplotlib绘图基础

3. Matplotlib图像属性控制

4. Pandas作图

5. 数据存取

6. Python的理工类应用

7. Python的人文社科类应用

Python高级数据处理与可视化(一)

标签:for   res   height   bsp   png   style   cal   sed   min   

原文地址:http://www.cnblogs.com/wnzhong/p/6344553.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!