编程语言！码迷,mamicode.com！

Python 学习日记第一篇

一、Python数字类型1、数字类型有整数型，浮点型以及一些较为少见的类型，数字类型支持数学运算加减乘除取余 In[1]:23+45 Out[1]:68 In[2]:1.7+2 Out[2]:3.7 In[3]:2*10 Out[3]:20 In[4]:10/2 Out[4]:5 In[5]:23-45 Out[5]:-22 In[6]:100&7 Out[6]:42、python的数学模..

分类：编程语言时间：2017-02-08 23:25:06 阅读次数：283

散列(C++实现)

散列的构成：散列函数，散列表的存储方式，散列表的冲突解决方法。 1.散列函数较常用的散列函数有除留余数法，数字分析法，平方取中法，折叠法。 2.散列表的存储方式闭散列法（开地址法），用数组存储；开散列法（链地址法），用邻接链表存储。 3.散列表的冲突解决方法主要是针对闭散列中关键码位置冲突的问 ...

分类：编程语言时间：2017-02-08 23:07:31 阅读次数：340

探索Javascript 异步编程

在我们日常编码中，需要异步的场景很多，比如读取文件内容、获取远程数据、发送数据到服务端等。因为浏览器环境里Javascript是单线程的，所以异步编程在前端领域尤为重要。异步的概念所谓异步，是指当一个过程调用发出后，调用者不能立刻得到结果。实际处理这个调用的过程在完成后，通过状态、通知或者回调来 ...

分类：编程语言时间：2017-02-08 23:04:28 阅读次数：187

Elasticsearch Java API 续

1、使用multi get API可以通过索引名、类型名、文档id一次得到一个文档集合，文档可以来自同一个索引库，也可以来自不同索引库。示例如下: 注释1: 通过单一的ID获取一个文档. 注释2：传入多个id，从相同的索引名/类型名中获取多个文档. 注释3：可以同时获取不同索引中的文档. 注释4：遍 ...

分类：编程语言时间：2017-02-08 23:01:50 阅读次数：168

Python爬虫进阶一之爬虫框架概述

综述爬虫入门之后，我们有两条路可以走。一个是继续深入学习，以及关于设计模式的一些知识，强化Python相关知识，自己动手造轮子，继续为自己的爬虫增加分布式，多线程等功能扩展。另一条路便是学习一些优秀的框架，先把这些框架用熟，可以确保能够应付一些基本的爬虫任务，也就是所谓的解决温饱问题，然后再深入 ...

分类：编程语言时间：2017-02-08 23:04:17 阅读次数：228

创建新的C++工程来调用Caffe对图片进行识别

前段时间一直在跑Caffe训练数据。之前用训练好的caffemodel对图片进行分类都是用的命令行指令，于是就想着自己新建一个工程来调用caffe，结合classification的代码来对图片进行分类。上网查阅了很多资料，最详细的一篇就是：http://blog.csdn.net/qq_14845 ...

分类：编程语言时间：2017-02-08 22:51:41 阅读次数：1287

Python爬虫进阶二之PySpider框架安装配置

关于首先，在此附上项目的地址，以及官方文档 PySpider 官方文档安装 1. pip 首先确保你已经安装了pip，若没有安装，请参照 pip安装 2. phantomjs PhantomJS 是一个基于 WebKit 的服务器端 JavaScript API。它全面支持web而不需浏览器支持 ...

分类：编程语言时间：2017-02-08 22:52:22 阅读次数：290

Python爬虫利器四之PhantomJS的用法

前言大家有没有发现之前我们写的爬虫都有一个共性，就是只能爬取单纯的html代码，如果页面是JS渲染的该怎么办呢？如果我们单纯去分析一个个后台的请求，手动去摸索JS渲染的到的一些结果，那简直没天理了。所以，我们需要有一些好用的工具来帮助我们像浏览器一样渲染JS处理的页面。其中有一个比较常用的工具， ...

分类：编程语言时间：2017-02-08 22:48:36 阅读次数：305

Python爬虫实战七之计算大学本学期绩点

大家好，本次为大家带来的项目是计算大学本学期绩点。首先说明的是，博主来自山东大学，有属于个人的学生成绩管理系统，需要学号密码才可以登录，不过可能广大读者没有这个学号密码，不能实际进行操作，所以最主要的还是获取它的原理。最主要的是了解cookie的相关操作。本篇目标 1.模拟登录学生成绩管理系统 2 ...

分类：编程语言时间：2017-02-08 22:43:07 阅读次数：357

Elasticsearch Java API简要总汇

3.1 集群的连接 3.1.1 作为Elasticsearch节点 [html] view plain copy 代码： import static org.elasticsearch.node.NodeBuilder.nodeBuilder; import org.elasticsearch.cl ...

分类：编程语言时间：2017-02-08 22:41:40 阅读次数：1443

Python爬虫利器六之PyQuery的用法

前言你是否觉得 XPath 的用法多少有点晦涩难记呢？你是否觉得 BeautifulSoup 的语法多少有些悭吝难懂呢？你是否甚至还在苦苦研究正则表达式却因为少些了一个点而抓狂呢？你是否已经有了一些前端基础了解选择器却与另外一些奇怪的选择器语法混淆了呢？嗯，那么，前端大大们的福音来了，Py ...

分类：编程语言时间：2017-02-08 22:38:54 阅读次数：275

Python爬虫进阶三之Scrapy框架安装配置

初级的爬虫我们利用urllib和urllib2库以及正则表达式就可以完成了，不过还有更加强大的工具，爬虫框架Scrapy，这安装过程也是煞费苦心哪，在此整理如下。 Windows 平台：我的系统是 Win7，首先，你要有Python，我用的是2.7.7版本，Python3相仿，只是一些源文件不同。 ...

分类：编程语言时间：2017-02-08 22:40:55 阅读次数：277

Python爬虫进阶五之多线程的用法

前言我们之前写的爬虫都是单个线程的？这怎么够？一旦一个地方卡到不动了，那不就永远等待下去了？为此我们可以使用多线程或者多进程来处理。首先声明一点！多线程和多进程是不一样的！一个是 thread 库，一个是 multiprocessing 库。而多线程 thread 在 Python 里面被称作 ...

分类：编程语言时间：2017-02-08 22:38:20 阅读次数：339

Python爬虫入门七之正则表达式

在前面我们已经搞定了怎样获取页面的内容，不过还差一步，这么多杂乱的代码夹杂文字我们怎样把它提取出来整理呢？下面就开始介绍一个十分强大的工具，正则表达式！ 1.了解正则表达式正则表达式是对字符串操作的一种逻辑公式，就是用事先定义好的一些特定字符、及这些特定字符的组合，组成一个“规则字符串”，这个“规 ...

分类：编程语言时间：2017-02-08 21:53:24 阅读次数：319

[Python学习之路] 猜大小游戏

1 # coding =utf-8 2 import random 3 4 def roll_dice(number=3, points=None): 5 if points == None: 6 points = [] 7 while number > 0: 8 point = random.ra... ...

分类：编程语言时间：2017-02-08 21:53:44 阅读次数：440

Python爬虫实战四之抓取淘宝MM照片

福利啊福利，本次为大家带来的项目是抓取淘宝MM照片并保存起来，大家有没有很激动呢？最新动态更新时间：2015/8/2 最近好多读者反映代码已经不能用了，原因是淘宝索引页的MM链接改了。网站改版了，URL的索引已经和之前的不一样了，之前可以直接跳转到每个MM的个性域名，现在中间加了一个跳转页，本以 ...

分类：编程语言时间：2017-02-08 21:51:30 阅读次数：333

Python爬虫入门六之Cookie的使用

大家好哈，上一节我们研究了一下爬虫的异常处理问题，那么接下来我们一起来看一下Cookie的使用。为什么要使用Cookie呢？ Cookie，指某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据（通常经过加密）比如说有些网站需要登录后才能访问某个页面，在登录之前，你想抓取 ...

分类：编程语言时间：2017-02-08 21:51:42 阅读次数：238