一.分析所采用数据的来源有哪些? 1.国家相关部门统计信息主要包括央行、银监会、证监会、国家统计局、政府网、互联网络信息中心发布的数据统计信息(如通过统计局发布的数据得知春运的客流人数) 2.第三方机构统计数据,主要包括天猫大数据、搜数网、统计网、数据堂、淘宝指数、百度指数、艾瑞咨询、知网数据、万方 ...
分类:
其他好文 时间:
2019-02-25 19:02:37
阅读次数:
242
前言 为什么要做爬虫? 首先请问:都说现在是"大数据时代",那数据从何而来? 企业产生的用户数据:百度指数、阿里指数、TBI腾讯浏览指数、新浪微博指数 数据平台购买数据:数据堂、国云数据市场、贵阳大数据交易所 政府/机构公开的数据:中华人民共和国国家统计局数据、世界银行公开数据、联合国数据、纳斯达克 ...
分类:
编程语言 时间:
2018-07-27 01:35:50
阅读次数:
321
注:数据库是根据中华人民共和国国家统计局截至2003年6月30号的数据,但是之前有修改过的数据,所以,假如是太早颁发的身份证在地区代码上可能有出入。可以参考国家统计局的数据。 如果有哪里不妥请提出,我会尽快改进。校验成功并不能说明是真的身份证号码,因为市、县编码的校验没有,也没能查到含有此编码的资料 ...
为什么要做爬虫? 首先请问:都说现在是"大数据时代",那数据从何而来? 企业产生的用户数据:百度指数、阿里指数、TBI腾讯浏览指数、新浪微博指数 数据平台购买数据:数据堂、国云数据市场、贵阳大数据交易所 政府/机构公开的数据:中华人民共和国国家统计局数据、世界银行公开数据、联合国数据、纳斯达克。 数 ...
分类:
其他好文 时间:
2018-06-01 22:21:12
阅读次数:
257
数据的获取方式: 1、获取外部的公开数据集, UCI 加州大学欧文分校开放的经典数据集,被很多数据挖掘实验室采用 http://archive.ics.uci.edu/ml/datasets.html 国家数据:数据来源于中国国家统计局,包含了我国经济民生等多个方面的数据。 http://data. ...
分类:
其他好文 时间:
2018-03-09 00:26:22
阅读次数:
336
一、 为什么要做爬虫?首先:都说现在是"大数据时代",那数据从何而来?企业产生的用户数据:百度指数、阿里指数、TBI腾讯浏览指数、新浪微博指数数据平台购买数据:数据堂、国云数据市场、贵阳大数据交易所政府/机构公开的数据:中华人民共和国国家统计局数据、世界银行公开数据、联合国数据、纳斯达克。数据管理咨 ...
分类:
其他好文 时间:
2017-12-23 14:18:47
阅读次数:
191
1、进入国家统计局官网 查找最新省市区数据 http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201703/t20170310_1471429.html 2、将数据放到txt文件,然后我们可以看到省份都是以 0000 结尾,市都是以 00 结尾,转为Json代码如下 ...
分类:
其他好文 时间:
2017-11-13 13:41:51
阅读次数:
346
身份证前6位代表着该身份证的籍贯在哪里,而官方的措辞则为:行政区划代码 如何找到最新的行政区划代码了? 通过:http://blog.sina.com.cn/s/blog_5a76dae20100tqv5.html 此人的博客得知,行政区划代码是国家统计局统计的。 所以首先进入国家统计局的网站:ht ...
分类:
其他好文 时间:
2017-09-28 13:08:12
阅读次数:
1192