1.网络数据采集的一个常用功能就是获取 HTML 表格并写入 CSV 文件。维基百科的文本编 辑器对比词条(https://en.wikipedia.org/wiki/Comparison_of_text_editors)中用了许多复杂 的 HTML 表格,用到了颜色、链接、排序,以及其他在写入 C ...
分类:
编程语言 时间:
2020-05-19 01:13:44
阅读次数:
77
数据类型 - 列表: 列表的功能:创建、查询、切片、增加、修改、删除、循环、排序 创建: List=[‘a’,’b’,’c’] 查询: List.index(‘a’) =>0 切片: List[0:3] 返回从索引0-3的元素,不包括3,顾头不顾尾 List[0:-1] 返回从索引0至最后一个值,但 ...
分类:
其他好文 时间:
2020-05-18 12:08:22
阅读次数:
148
"传送门开启了传送门吃" $其实要发现只需要考虑[1,k]这个循环节$ $开始我们想让数字最小那么[1,k]就和目标串相等就好了$ $然后我们从目标串的k+1位开始判断$ $Ⅰ.若相等,无事发生,继续判断下一个字母$ $Ⅱ.若比目标串大,那么继续判断下去也一定大,break$ $Ⅲ.若比目标串小,那 ...
分类:
其他好文 时间:
2020-05-15 20:05:32
阅读次数:
71
代码1、2如下 #方法一import requests from bs4 import BeautifulSoup #对bs4库中的Beautiful类引用 allUniv = []#获取界面的信息 def getHTMLText(url): try: r = requests.get(url, t ...
分类:
编程语言 时间:
2020-05-13 23:30:18
阅读次数:
120
1、plt.plot(x,y) plt.plot(x,y,format_string,**kwargs) x轴数据,y轴数据,format_string控制曲线的格式字串 format_string 由颜色字符,风格字符,和标记字符 代码: import requestsfrom bs4 impor ...
分类:
其他好文 时间:
2020-05-10 19:33:48
阅读次数:
91
(1)和lxml一样,Beautifu Soup也是一个HTML/XML的解析器,主要的功能也是如何解析和提取HTML/XML数据。 (2)lxml只会局部遍历,而Beautiful Soup是基于HTML DOM的,会载入整个文档,解析整个DOM树,因此时间和内存开销都会大很多,所以性能要低于lx ...
分类:
Web程序 时间:
2020-05-10 14:37:17
阅读次数:
68
新学了一下笛卡尔树,这道题是模板题,统计一下以 $x$ 为 lca 的点对就行. 然后统计的话用线段树合并 + 启发式合并就行了. code: #include <bits/stdc++.h> #define N 100006 #define ll long long #define lson s[ ...
分类:
其他好文 时间:
2020-05-08 23:00:23
阅读次数:
78
给你 $ a $ 个 $ 0 $,$ b $ 个 $1$,$ c $ 个 $ 2 $,$ d $ 个 $ 3 $,要求排成一个长度为 $ a+b+c+d $ 的数列,相邻两个差的绝对值为 $ 1 $,并输出任一方案。 ...
分类:
其他好文 时间:
2020-05-08 22:38:01
阅读次数:
90
http://acm.hdu.edu.cn/showproblem.php?pid=6351 题目 给一个数字n,可以执行k次交换,每次交换都选择数字中的2位,并且交换后不能出现前导0,问能得到的最小值和最大值是多少。 T<=100,n,k<=10^9 题解 方法一 把交换看为对换,枚举排列,然后分 ...
分类:
其他好文 时间:
2020-05-08 13:09:47
阅读次数:
52
注意:使用前要装selenium第三方的库才可以使用 版本:python3 from bs4 import BeautifulSoup from urllib import request # 要请求的网络地址 url = 'https://www.hao123.com/' # 请求网络地址得到ht ...
分类:
编程语言 时间:
2020-05-07 23:09:21
阅读次数:
90