本篇在日常工作中会使用到的一些命令或技巧吧,不断更新中... pip源 临时使用 永久修改 ubuntu源 UTC时间转北京时间 tcpdump抓包 Vim技巧 字符串匹配 复制粘贴缩进错乱问题的解决方案 linux查看文件夹大小 IP正则 使用shell命令从文本提取ip地址: linux 取文件 ...
分类:
其他好文 时间:
2019-12-07 12:55:29
阅读次数:
147
import re """ 使用match方法进行匹配 result = re.match(正则表达式,要匹配的字符串) 如果match匹配到数据的话,就可以使用group方法提取数据 注: 若字符串匹配正则表达式,则match方法返回匹配对象(Match Object), 否则返回None(不是空 ...
分类:
其他好文 时间:
2019-12-06 23:37:53
阅读次数:
107
^~ 标识符匹配后面跟-一个字符串。匹配字符串后将停止对后续的正则表达式进行匹配,如location ^~ /images/ , 在匹配了/images/这个字符串后就停止对后续的正则匹配= 精准匹配,如location=/,只会匹配url为/的请求。 ~ 区分大小写的匹配。 ~* 不区分大小写的匹 ...
分类:
其他好文 时间:
2019-12-02 17:09:58
阅读次数:
98
首先我们通过一张图来了解 NLP 所包含的技术知识点,这张图从分析对象和分析内容两个不同的维度来进行表达. 有机器学习相关经验的人都知道,中文自然语言处理的过程和机器学习过程大体一致,但又存在很多细节上的不同点,下面我们就来看看中文自然语言处理的基本过程有哪些呢? 获取语料 语料,即语言材料。语料是 ...
分类:
其他好文 时间:
2019-12-02 16:53:30
阅读次数:
119
1.简述互联网信息抓取的方式。 互联网信息自动抓取,最常见且有效的方式是使用网络爬虫。 2.简述舆情系统的组成架构。 用户终端->采集层->分析层->呈现层->用户 3.中文分词算法可以分为哪几类? (1)基于字符串匹配的分词方法,它是待处理的中文字符串与一个“尽可能全面”的词典中的词条按照一定的规 ...
分类:
其他好文 时间:
2019-12-01 16:51:40
阅读次数:
265
位运算主要有以下几方式 位的提取(把每一位提取出来) 字符串匹配,感觉在位运算中使用字符串很好用 异或运算去重复,异或代替其他运算,总之异或很重要 一、常用的知识点 (1)位操作 | 与运算:与运算用来置位 & 并运算:并运算用来掩码,n&(-n)可以获得最低位的1 ~取反:用的很少 ^异或运算:异 ...
分类:
其他好文 时间:
2019-11-19 17:02:22
阅读次数:
109
1 经典的算法题目 1.1 字符串匹配问题 有一个字符串str1="哈哈哈 你好啊好啊 你好啊啊 你好啊好啊啊你好你好好",和一个子串str2="你好啊好啊啊". ①判断str1中是否是否包含str2,如果存在,就返回第一次出现的问题。如果没有,则返回-1. ②要求用最快的速度完成匹配。 思路1:暴 ...
分类:
编程语言 时间:
2019-11-17 17:31:53
阅读次数:
108
一、BF算法的基本思想 BF(Brute Force)算法是模式匹配中最简单、最直观的算法。该算法最基本的思想是从主串的第 start 个字符起和模式P(要检索的子串)的第1个字符比较,如果相等,则逐个比较后续字符;比较过程中一旦发现不相等的情况,则回溯到主串的第 start+1 个字符位置,重新和 ...
分类:
编程语言 时间:
2019-11-06 00:49:52
阅读次数:
93
1) 概述 正则表达式(regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。 正则表达式是由普通字符(例如字符 a 到 z)以及特殊字符(称为"元字符")组成的文字模式。模式描 ...
分类:
其他好文 时间:
2019-11-05 21:28:16
阅读次数:
79
这个算法在算法导论上写的很晦涩,而且还搞了一大堆定义和推导。其实背后的想法很naive。 既然要做字符串匹配,那就构造一个有限自动机出来:对于长度为n的pattern,如果当前字符串匹配上了一个字符,那么自动机的状态就是1;如果当前字符串匹配上了两个字符,那么自动机的状态就是2,……如果当前字符串把 ...
分类:
其他好文 时间:
2019-11-05 01:01:52
阅读次数:
147