一、介绍Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间,官网推荐在现在的项目中使用Beautiful Soup 4, 移植到BS4,安装模块如下:# pip3 install beautifulso
分类:
其他好文 时间:
2018-07-09 15:18:00
阅读次数:
151
如果你已经决定把Python作为你的编程语言,那么,你脑海中的下一个问题会是:"进行数据分析有哪些Python库可用?" Numpy 对于科学计算,它是Python创建的所有更高层工具的基础。以下是它提供的一些功能: 1. N维数组,一种快速、高效使用内存的多维数组,它提供矢量化数学运算 。 2. ...
分类:
编程语言 时间:
2018-07-07 20:08:23
阅读次数:
171
网上你可能会见过不少动态的二维码,除了感觉很新奇以外,或许你会问这是怎么做出来的?其实有简单也有复杂的,简单的就是用一张 GIF 图片来制作。今天简单介绍如何用python制作动态二维码。 实现是用一个免费的python库myqr, 在这里可以看到: https://pypi.org/pypi/My ...
分类:
编程语言 时间:
2018-07-07 15:40:18
阅读次数:
164
20个必不可少的Python库也是基本的第三方库 读者您好。今天我将介绍20个属于我常用工具的Python库,我相信你看完之后也会觉得离不开它们。他们是: Requests.Kenneth Reitz写的最富盛名的http库。每个Python程序员都应该有它。 Scrapy.如果你从事爬虫相关的工作 ...
分类:
编程语言 时间:
2018-07-07 00:32:18
阅读次数:
339
一、该项目主要分以下三步组成: 二、详细过程 1.配置数据库信息 建表语句, 以其中部分字段为例: 配置json数据到.json文件, 用于读取配置信息,进行数据库连接 2.脚本编写 涉及到的python库 代码编写 3.配置Jenkins 远程ssh配置,配置定时任务(tip:建议晚上进行采集(或 ...
分类:
数据库 时间:
2018-07-06 14:15:07
阅读次数:
326
数据挖掘工程师并不是一直都在图形化界面中工作,并且随着大数据开源技术的发展,会有更多的任务需要在命令行环境下完成,比如在hadoop环境下进行数据文件的导入导出,在ubuntu环境下进行python库的安装与配置,因此就需要掌握一些基本的、常用的Linux命令。本文针对这一话题进行了总结梳理。 1. ...
分类:
系统相关 时间:
2018-07-04 22:54:43
阅读次数:
241
BeautifulSoup 是一个可以从HTML或XML文件中提取数据的Python库,它的使用方式相对于正则来说更加的简单方便,常常能够节省我们大量的时间。 官方中文文档的:https://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh ...
分类:
其他好文 时间:
2018-06-29 19:20:43
阅读次数:
167
NumPy简介: NumPy系统是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix))。 NumPy(Numeric Python)提供了许多高级的 ...
分类:
编程语言 时间:
2018-06-28 19:20:15
阅读次数:
191
1.openpyxl用于Excel操作#安装openpyxl库pipinstallopenpyxl2.openpyxl用法#1.导入openpyxlimportopenpyxl#2.打开文件.xlsxwb=open(‘xx.xlsx‘)#3.打开工作表Sheetsheet=wb[‘Sheet1‘]#Sheet1表示工作簿名称#4.读取数据print(sheet[‘A1‘].value)print(
分类:
编程语言 时间:
2018-06-27 10:19:30
阅读次数:
395