本篇在日常工作中会使用到的一些命令或技巧吧,不断更新中... pip源 临时使用 永久修改 ubuntu源 UTC时间转北京时间 tcpdump抓包 Vim技巧 字符串匹配 复制粘贴缩进错乱问题的解决方案 linux查看文件夹大小 IP正则 使用shell命令从文本提取ip地址: linux 取文件 ...
分类:
其他好文 时间:
2019-12-07 12:55:29
阅读次数:
147
import re """ 使用match方法进行匹配 result = re.match(正则表达式,要匹配的字符串) 如果match匹配到数据的话,就可以使用group方法提取数据 注: 若字符串匹配正则表达式,则match方法返回匹配对象(Match Object), 否则返回None(不是空 ...
分类:
其他好文 时间:
2019-12-06 23:37:53
阅读次数:
107
^~ 标识符匹配后面跟-一个字符串。匹配字符串后将停止对后续的正则表达式进行匹配,如location ^~ /images/ , 在匹配了/images/这个字符串后就停止对后续的正则匹配= 精准匹配,如location=/,只会匹配url为/的请求。 ~ 区分大小写的匹配。 ~* 不区分大小写的匹 ...
分类:
其他好文 时间:
2019-12-02 17:09:58
阅读次数:
98
首先我们通过一张图来了解 NLP 所包含的技术知识点,这张图从分析对象和分析内容两个不同的维度来进行表达. 有机器学习相关经验的人都知道,中文自然语言处理的过程和机器学习过程大体一致,但又存在很多细节上的不同点,下面我们就来看看中文自然语言处理的基本过程有哪些呢? 获取语料 语料,即语言材料。语料是 ...
分类:
其他好文 时间:
2019-12-02 16:53:30
阅读次数:
119
[TOC] kmp 问题:有两个字符串,S为主串(长度为n),T为模式串(长度为m),其中n m,如何判断T是否为S的子串 样例: abbaabbaaba abbaaba 朴素解法: S从头开始遍历,以每个字母为开头,再遍历T看是否匹配。 如何降低时间复杂度? 第一次匹配时,到了第七个字符发现不匹配 ...
分类:
其他好文 时间:
2019-12-01 20:52:27
阅读次数:
109
1.简述互联网信息抓取的方式。 互联网信息自动抓取,最常见且有效的方式是使用网络爬虫。 2.简述舆情系统的组成架构。 用户终端->采集层->分析层->呈现层->用户 3.中文分词算法可以分为哪几类? (1)基于字符串匹配的分词方法,它是待处理的中文字符串与一个“尽可能全面”的词典中的词条按照一定的规 ...
分类:
其他好文 时间:
2019-12-01 16:51:40
阅读次数:
265
概念明确:被匹配串、匹配串。如从cbabce找ab,前者和后者分别称为被匹配串、匹配串。 最容易想到的方法:从首字母开始,逐个比较下去。一旦发现有不同的字符就停止并将这个匹配串后移一位,然后从头开始进行下一次比较。这样,就需要将字串中的所有字符一一比较。 KMP算法 Boyer-Moore算法 基于 ...
分类:
编程语言 时间:
2019-11-26 13:35:29
阅读次数:
76
T1: 模拟 T2: dp T3: 枚举 T4: 观察到答案的性质,即最后一个不用回答,因此下一个数%2的结果就是这个数的答案 T5: 观察到X(X(G))的点数=X(G)的边数,X(G)的边数有等于G中有多少对边有公共点,枚举公共点算即可 T6: KMP,记录每个前缀出现的次数 T7: 状压 T8 ...
分类:
其他好文 时间:
2019-11-24 19:26:44
阅读次数:
80
KMP总结 什么是KMP? KMP算法,又称为模式匹配算法,能够在线性时间内判定字符串 $A[1$~$N]$ 是否为字符串 $B[1$~$M]$ 的子串,并求出字符串 $A$ 在字符串 $B$ 中各次出现的位置。(from 李煜东《算法竞赛进阶指南》) 如何进行KMP? 第一步: $A$串进行自我匹 ...
分类:
其他好文 时间:
2019-11-24 13:54:45
阅读次数:
62
```cpp int pi[1005]; void GetPrefixFunction(char *s, int sl) { pi[0] = 0, pi[1] = 0; for(int i = 1, k = 0; i < sl; ++i) { while(k && s[i] != s[k]) k =... ...
分类:
编程语言 时间:
2019-11-21 13:46:42
阅读次数:
50