BeautifulSoup 善于网页数据分析 ,但是 python for android : BeautifulSoup 有 bug ,
text = h4.a.text 只能取得 None,所以我写了function: getText()
来fix this bug.
例如: 抓取CSDN极客头条内容 soup.py
import urllib2, re
from Beau...
分类:
移动开发 时间:
2014-05-03 17:33:08
阅读次数:
427
近日浏览csdn博客,发先一本自编的分享自编《Python基础教程》无水印文字版,推荐读之,内容朴实无华无拖泥带水,板式清晰,是python入门和初学者必藏教程。
下载地址
http://download.csdn.net/detail/u014036026/7188403...
分类:
编程语言 时间:
2014-05-03 17:06:16
阅读次数:
407
BeautifulSoup 善于网页数据分析
请参考: http://www.crummy.com/software/BeautifulSoup
例如: 抓取CSDN首页极客头条内容 soup.py
import urllib2, re
from BeautifulSoup import BeautifulSoup
page = urllib2.urlopen("http://gee...
分类:
编程语言 时间:
2014-05-03 15:31:42
阅读次数:
401
眼下大数据口号满天飞,今天拿我微信圈朋友一段时间内分享内容作为数据,用R包的算法实现简单分析。由于微信没有接口获取数据,暂时只能手动记录数据,主要是做个小尝试,数据获取方式是其次。1)我们看看微信圈活跃的朋友。PS:知道为何我们的流量烧的这么快了吧?这些小伙伴八成是运营商潜伏过来的余则成,在背后分成...
分类:
其他好文 时间:
2014-05-01 19:11:52
阅读次数:
372
一、Apriori 算法概述
Apriori 算法是一种最有影响力的挖掘布尔关联规则的频繁项集的 算法,它是由Rakesh Agrawal 和RamakrishnanSkrikant 提出的。它使用一种称作逐层搜索的迭代方法,k- 项集用于探索(k+1)- 项集。首先,找出频繁 1- 项集的集合。该集合记作L1。L1 用于找频繁2- 项集的集合 L2,而L2 用于找L2,如此下去,直到不能找到 ...
分类:
其他好文 时间:
2014-05-01 17:50:47
阅读次数:
280
1.下载破解版:http://www.pc6.com/softview/SoftView_13845.html2.安装时引入授权文件并汉化;3.打开IE9,菜单:管理加载项->工具栏和扩展,查看HttpWatch
Professional启动;4.IE9执行快捷键shift+f2即打开httpwat...
分类:
Web程序 时间:
2014-05-01 10:36:56
阅读次数:
363
ps:作为目前人工智能和数据库领域研究的热点问题,数据挖掘从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘(Data
Mining,DM),又称数据库中的知识发现(Knowledge Discover in Database,KDD),是目前人工智能和数据库领域研...
分类:
其他好文 时间:
2014-05-01 06:55:40
阅读次数:
254
又拖了好久继续写R
语言的学习笔记了啊这次到了基本数据管理了,众所周知数据准备是数据分析的最重要的前提书本是从一个例子开始本章的内容的,例子是一个类似调查问卷的然后把回答标为从1到5,再进行分析(这让我想到了自学SPSS
的时候啊)> manager date country gender ...
分类:
其他好文 时间:
2014-05-01 04:22:35
阅读次数:
1943
1.算法简介
朴素贝叶斯(Naive Bayes)是无监督学习的一种常用算法,易于实现,没有迭代,并有坚实的数学理论(即贝叶斯定理)作为支撑。
本文以拼写检查作为例子,讲解Naive Bayes分类器是如何实现的。对于用户输入的一个单词(words),拼写检查试图推断出最有可能的那个正确单词(correct)。当然,输入的单词有可能本身就是正确的。比如,输入的单词thew,用户...
分类:
其他好文 时间:
2014-04-29 13:38:20
阅读次数:
476