标签:phi hub war bdd src ima github a10 李开复
一直想趁着知乎还比较开放爬点数据做分析,因为懒延期至今。
爬虫由Java实现,放在服务器上跑了三四天,可以说是龟速了,毕竟爬虫和反爬虫就是应该友好相处的嘛,反反爬虫和反反反爬虫互相伤害就没意思了。
从我的关注列表向外爬了两圈,数据是上周(2017,9.11))的,所以下面的报道可能和实时数据有些偏差。
本来想做图论分析,但是应该就是个简单的小世界网络,结果也不好可视化,所以就只做了一些简答的数值分析。
放上源码,代码逻辑在Readme里有写
Github:pokerfaceSad/ZhihuSpider
还是汉子占多数
仰望赞同数大于100万的12位大佬
还有一些没有可视化的数据
Github:pokerfaceSad/ZhihuSpider
求Star
标签:phi hub war bdd src ima github a10 李开复
原文地址:http://www.cnblogs.com/akiddo/p/7669489.html