from numpy import * from random import _inst import numpy as np import matplotlib.pyplot as plt def fileMat(filename): file = open(filename, "r") cont... ...
分类:
编程语言 时间:
2017-08-18 23:55:07
阅读次数:
498
执行后,在命令行中输入, 一定要先到logs文件夹所在目录下,在输入下面命令,不然会找不到 执行结果: 打开浏览器: 输入显示的网址 ...
分类:
其他好文 时间:
2017-08-14 16:28:57
阅读次数:
184
接着上篇的说的,爬取了大数据相关的职位信息,http://www.17bigdata.com/jobs/。 词云如图所示: 可以看出有些噪声词没能被去除,比如相关、以上学历等无效词汇。本想通过DF判断停用词,但是我爬的时候没顾及到这个问题,外加本身记录数也不高,就没再找职位信息的停用词。当然也可看出 ...
分类:
编程语言 时间:
2017-08-10 13:41:19
阅读次数:
165
通过plt.subplot能够在一张图中画出多个子图 #coding: utf-8 #!/usr/bin/env python """ Draw a graph with matplotlib. You must have matplotlib for this to work. """ __aut ...
分类:
编程语言 时间:
2017-08-08 22:52:06
阅读次数:
420
回归拟合是最基础的数据分析方法,而线性回归又是最基础的回归拟合。对于分布非常集中的数据,可以直接采用最小二乘法进行回归拟合。甚至,我们可以直接把数据放到excel表格中,使用excel直接进行拟合。然而,当数据中含有噪声的时候,必须采用新的算法过滤噪声点。 在此,介绍一种RANSAC(Random ...
分类:
其他好文 时间:
2017-08-08 00:37:38
阅读次数:
302
自动保存图表:pyplot.savefig('D:\\pic.png'),替代了 pyplot.show()。 1 # 使用matplotlib.pyplot.scatter绘制散点 2 import matplotlib.pyplot as plt 3 from pylab import mpl ... ...
分类:
其他好文 时间:
2017-08-07 00:11:49
阅读次数:
395
#coding:utf-8 import math import copy import numpy as np import matplotlib.pyplot as plt isdebug = True #指定k个高斯分布參数,这里指定k=2。 #注意2个高斯分布具有同样方差Sigma。均值分别 ...
分类:
编程语言 时间:
2017-08-05 14:55:06
阅读次数:
210
什么叫跌代: 可以将某个数据集合内的数据一个一个挨着取出来就叫做跌代。 迭代器协议: 可以被跌代要满足的要求叫做可迭代协议,可迭代对象必须提供一个next的方法,执行该方法要么返回跌代中的下一项,要么就引起一个StopIteration异常,以终止跌代(跌代只能往后走,而不能往前退) python中 ...
分类:
编程语言 时间:
2017-08-02 17:40:43
阅读次数:
213