最近研究搜索引擎、知识图谱和Python爬虫比较多,中文乱码问题再次浮现于眼前。虽然市面上讲述中文编码问题的文章数不胜数,但是此处还是准备简单做下笔记。方便以后查阅和大家学习。主要包括raw_input输入、文件读取、变量比较等str、unicode、utf-8转换问题。 纪伯伦曾说过:“你无法同时...
分类:
编程语言 时间:
2015-12-18 06:50:55
阅读次数:
483
作为一名从小就看篮球的球迷,会经常逛虎扑篮球及湿乎乎等论坛,在论坛里面会存在很多精美图片,包括NBA球队、CBA明星、花边新闻、球鞋美女等等,如果一张张右键另存为的话真是手都点疼了。作为程序员还是写个程序来进行吧!所以我通过Python+Selenium+正则表达式+urllib2进行海量图片爬取。...
分类:
编程语言 时间:
2015-12-18 06:53:13
阅读次数:
373
前面我讲述过如何通过BeautifulSoup获取维基百科的消息盒,同样可以通过Spider获取网站内容,最近学习了Selenium+Phantomjs后,准备利用它们获取百度百科的旅游景点消息盒(InfoBox),这也是毕业设计实体对齐和属性的对齐的语料库前期准备工作。希望文章对你有所帮助~
分类:
编程语言 时间:
2015-12-18 06:50:03
阅读次数:
486
这篇文章主要是爬取百度5A景区摘要信息,再利用Jieba分词工具进行中文分词,最后提出文本聚类算法的一些概念知识。一. Selenium爬取百度百科摘要 二. Jieba中文分词 1.安装及入门介绍 2.添加自定义词典 3.关键词提取 4.对百度百科获取摘要分词 5.去除停用词 三. 基于VSM的文...
分类:
编程语言 时间:
2015-12-18 06:49:30
阅读次数:
8948
1 #include 2 3 int charCount(char *str) 4 { 5 int iCount = 0; 6 int i, j, k=0; 7 char *p = str; 8 char *q = p; 9 while (*p)10 ...
分类:
编程语言 时间:
2015-12-18 06:46:05
阅读次数:
142
1、function xx(){} 2、匿名方式 window.onload=function(){dslfjdslfkjdslf}; 3、动态方式 var demo=new Function('x','y','var y=x+y;return y;'); var sum=demo(4,55); a...
分类:
编程语言 时间:
2015-12-18 06:34:59
阅读次数:
364
本文是投稿文章,作者:一叶(博客)欢迎将原创文章或者译文投给我们,投稿方式:support@cocoachina.com或者在首页点击“投稿爆料”一、解决问题Swift项目需要使用封装好的Objective-c组件、第三方类库,苹果提供的解决方案能够处理日常大部分需求,但还不能称之为完美,混编过程中...
分类:
编程语言 时间:
2015-12-18 06:29:58
阅读次数:
346
说17号发超简单的教程就17号,qq核审通过后就封装了这个,现在放出来~~这个是我封装的一个开源项目:https://github.com/dunitian/LoTQQLogin————————————————————————————————————————————先申请一下创建一个应用网站或者移动...
分类:
编程语言 时间:
2015-12-18 06:24:40
阅读次数:
191
有些软件的界面采用Win32窗口嵌套一个IE控件,用Spy++只能识别出一个Internet Explorer_Server控件。常用的几个API函数无法取到IE控件里面的内容,更无法对里面的控件进行操作,所以这给自动化带来了麻烦。本文将讲述如何使用Python获取IHTMLDocument2接口,...
分类:
编程语言 时间:
2015-12-18 00:07:29
阅读次数:
283
# The isBadVersion API is already defined for you.# @param version, an integer# @return a bool# def isBadVersion(version):class Solution(object): d...
分类:
编程语言 时间:
2015-12-18 00:03:32
阅读次数:
262
· cin: 使用空白(空格,制表符和换行符)来定字符串的界,这意味着cin在获取字符数组输入时只读取一个单词,读取该单词后,cin将该字符串放到数组中,并自动在结尾添加空字符。面向行输入:· getline() 读取整行,通过回车键输入的换行符来确定输入结尾;调用:cin.getline(na.....
分类:
编程语言 时间:
2015-12-17 23:58:37
阅读次数:
394
function defineSubclass(superclass, //父类的构造函数 constructor, //新的子类的构造函数 methods, //实例方法:复制至原型中 ...
分类:
编程语言 时间:
2015-12-17 23:52:18
阅读次数:
214
1 #include 2 using namespace std; 3 int main() 4 { 5 int a, b; 6 while(cin >> a >> b) 7 { 8 cout << a + b << endl; 9 }10 ...
分类:
编程语言 时间:
2015-12-17 23:53:58
阅读次数:
229
Swift提供了所有c类语言的控制流结构。包括for和while循环来执行一个任务多次;if和switch语句来执行确定的条件下不同的分支的代码;break和continue关键字能将运行流程转到你代码的另一个点上。除了C语言传统的for-condition-increment循环,Swift加入了...
分类:
编程语言 时间:
2015-12-17 23:49:55
阅读次数:
314
1 var arr = [{ 2 "id": 1, 3 "name": "内存", 4 "sid": 1, 5 "sname": "16G" 6 }, { 7 "id": 1, 8 "name": "内存", 9 "sid": 2,10 ...
分类:
编程语言 时间:
2015-12-17 23:49:07
阅读次数:
204
一、new到底做了什么?首先,我们来试着看一下new的实例中到底包含些什么? function base(){ this.str="tong";}var a=new base();console.dir(a);在控制器中的结果如下:我们看到其中包含str的同时,还包含着_proto_对象,上...
分类:
编程语言 时间:
2015-12-17 23:49:53
阅读次数:
219
很多人都在问学Java和学c语言哪个好?这个怎么说呢?Java和c是两个不同开发平台的基础语言,应用的领域也不同。先说Java吧。Java是安卓开发平台的基础语言,大家都知道安卓因其开源特性备广大用户所熟悉。Java作为开发安卓的基础语言理所应当的成为热门编程语言,再者,以前的N..
分类:
编程语言 时间:
2015-12-17 22:39:58
阅读次数:
252