能够将热爱的技术应用于实际生活生产中,是做技术人员向往和乐之不疲的事。
现将前期手里面的一个项目做一个大致的总结,与大家一起分享、交流、进步。项目现在正在线上运行,项目名——基于Hadoop的数据分析综合管理平台。
项目流程整体比较清晰,爬取数据(txt文本)-->数据清洗-->文本模型训练-->文本分类-...
分类:
其他好文 时间:
2014-05-04 00:22:05
阅读次数:
476
BeautifulSoup 善于网页数据分析 ,但是 python for android : BeautifulSoup 有 bug ,
text = h4.a.text 只能取得 None,所以我写了function: getText()
来fix this bug.
例如: 抓取CSDN极客头条内容 soup.py
import urllib2, re
from Beau...
分类:
移动开发 时间:
2014-05-03 17:33:08
阅读次数:
427
近日浏览csdn博客,发先一本自编的分享自编《Python基础教程》无水印文字版,推荐读之,内容朴实无华无拖泥带水,板式清晰,是python入门和初学者必藏教程。
下载地址
http://download.csdn.net/detail/u014036026/7188403...
分类:
编程语言 时间:
2014-05-03 17:06:16
阅读次数:
407
BeautifulSoup 善于网页数据分析
请参考: http://www.crummy.com/software/BeautifulSoup
例如: 抓取CSDN首页极客头条内容 soup.py
import urllib2, re
from BeautifulSoup import BeautifulSoup
page = urllib2.urlopen("http://gee...
分类:
编程语言 时间:
2014-05-03 15:31:42
阅读次数:
401
眼下大数据口号满天飞,今天拿我微信圈朋友一段时间内分享内容作为数据,用R包的算法实现简单分析。由于微信没有接口获取数据,暂时只能手动记录数据,主要是做个小尝试,数据获取方式是其次。1)我们看看微信圈活跃的朋友。PS:知道为何我们的流量烧的这么快了吧?这些小伙伴八成是运营商潜伏过来的余则成,在背后分成...
分类:
其他好文 时间:
2014-05-01 19:11:52
阅读次数:
372
按问题进行分类查找网站存在的问题需要经过以下阶段1、识别和描述问题2、理清问题边界3、收集客户需求4、确定客户需求的关键质量特性四个阶段中都要明确:1、确定工作目标2、清晰工作范围3、做好利益相关方的沟通4、项目风险评估需要考虑的后续问题:1、会不会导致后期不断返工2、优化结果不被客户认可_____...
分类:
Web程序 时间:
2014-05-01 11:27:10
阅读次数:
378
1.下载破解版:http://www.pc6.com/softview/SoftView_13845.html2.安装时引入授权文件并汉化;3.打开IE9,菜单:管理加载项->工具栏和扩展,查看HttpWatch
Professional启动;4.IE9执行快捷键shift+f2即打开httpwat...
分类:
Web程序 时间:
2014-05-01 10:36:56
阅读次数:
363
又拖了好久继续写R
语言的学习笔记了啊这次到了基本数据管理了,众所周知数据准备是数据分析的最重要的前提书本是从一个例子开始本章的内容的,例子是一个类似调查问卷的然后把回答标为从1到5,再进行分析(这让我想到了自学SPSS
的时候啊)> manager date country gender ...
分类:
其他好文 时间:
2014-05-01 04:22:35
阅读次数:
1943
seo的三大灵魂,我认为是:用户体验、逻辑思维、数据分析。下面seo小鑫给大家介绍一下这三大灵魂分别的含义。
一、用户体验
用户体验就是搜索引擎追求的目标,也是算法中赋予页面和网站权重最主要的依据。
1.优质的内容资源——最有可能满足用户搜索信息的需求。
2.合理的内链——给用户提供尽可能多的用户体验。
3.优质的友链和外链——代表网站得到用户的认可。
4.高点击、低跳出、高滞留——满...
分类:
其他好文 时间:
2014-04-29 13:26:20
阅读次数:
262
做seo很长时间了,一直没有真正的做过seo数据分析,不会seo数据分析,不是一个seo高手,我认为seo数据在SEO中体现并且需要分析一些数据:
1、关键词数据
这个主要体现在网站的目标关键词,长尾关键词和一些热搜关键词等,这些词可以用用户搜索词、网站浏览路径、来源关键词、搜索引擎、询问其他人对产品的理解等找出一系列核心关键词。
2、网站情况以及流量数据
每天记录下网站的收录量,外链数,...
分类:
其他好文 时间:
2014-04-29 13:24:22
阅读次数:
283