import jieba txt = open("西游记.txt", "r", encoding='utf-8').read() words = jieba.lcut(txt) # 使用精确模式对文本进行分词 counts = {} # 通过键值对的形式存储词语及其出现的次数 for word in ...
分类:
其他好文 时间:
2020-11-20 11:30:40
阅读次数:
32
import jieba txt = open("聊斋志异白话简写版.txt", "r", encoding='utf-8').read() words = jieba.lcut(txt) # 使用精确模式对文本进行分词 counts = {} # 通过键值对的形式存储词语及其出现的次数 for w ...
分类:
其他好文 时间:
2020-11-20 11:24:38
阅读次数:
3
1 import jieba 2 3 txt = open("D:\\西游记.txt", "r", encoding='gb18030').read() 4 words = jieba.lcut(txt) # 使用精确模式对文本进行分词 5 counts = {} # 通过键值对的形式存储词语及其出 ...
分类:
其他好文 时间:
2020-11-19 13:02:49
阅读次数:
32
import jieba txt = open("D:\\西游记.txt", "r", encoding='utf-8').read() words = jieba.lcut(txt) # 使用精确模式对文本进行分词 counts = {} # 通过键值对的形式存储词语及其出现的次数 for wor ...
分类:
其他好文 时间:
2020-11-19 12:43:23
阅读次数:
12
1.倒排索引 搜索引擎中存储的是倒排索引,就是分好的词,和词语文章的关联 事先把文章使用分词打散,以词为依据,标记清楚对应的文章的编号 查询时 把查询的语句也进行分词,然后根据分词,找到那些文章中包含了这些词 2.django创建全文索引的过程 1.django中提供的是结构化数据(mysql中) ...
分类:
其他好文 时间:
2020-11-17 12:13:16
阅读次数:
6
例子 想将 ,。?全部替换为,号,改怎么办呢? 注意: 这里的符号 [] {} 是英文状态下,而符号,。?是中文状态下,因为我处理的是汉语文章。 [] 里面的内容表示要替换的文字,{}表示间隔几个字符,{1}表示每个字符单独成为一个字符,比如 [你好啊啊]{2},这种表达切出的词为 你好 以及 啊啊 ...
分类:
其他好文 时间:
2020-11-16 13:17:39
阅读次数:
3
形态学 形态学(morphology)是生物学的一个分支,其关注的是动植物的形态和结构等。这里用同一词语表示图像处理的数学形态学的内容。数学形态学的语言是集合论,其中的集合表示图像的对象,如:二值化图像中,所有白色像素的集合是该图像的一个完整形态学描述。集合中每两个分量提供一个像素的坐标,第三个分量 ...
分类:
其他好文 时间:
2020-10-29 10:29:48
阅读次数:
29
1.搜索引擎工作原理 1.倒排索引 搜索引擎中存储的是倒排索引,就是分好的词,和词语文章的关联 事先把文章使用分词打散,以词为依据,标记清楚对应的文章的编号 查询时: 把查询的语句也进行分词,然后根据分词,找到那些文章中包含了这些词 2.django创建全文索引的过程 1.django中提供的是结构 ...
分类:
其他好文 时间:
2020-10-19 22:47:05
阅读次数:
18
在教学中,老师为学生创设了具有启发性的教学情境,大胆放手,使学生在大量观察、猜测、实践、探索与交流的数学活动过程中,经历知识的形成过程,突破教学的难点,帮助学生建立不确定现象这一新的观念。 本堂课主要使学生初步体验现实世界中存在的不确定现象,能用“一定”、“不可能”和“可能”等词语来描述生活中的一些 ...
分类:
其他好文 时间:
2020-10-09 20:27:34
阅读次数:
25
https://mp.weixin.qq.com/s/-CEm1lr_vEB_m1HwLslHhABy超神经场景描述:利用AI技术判断一个人的情绪通常有两种途径,一种是通过面部表情,另一种是通过语音。前者已经比较成熟,而语音识别情感方面的研究,正在快速发展。近期,一些科研团队提出了新的方法,来更准确地识别用户声音中的情绪。关键词:语音情感识别情绪分类知乎上有很多关于「如何判断女朋友是否生气」之类的
分类:
编程语言 时间:
2020-09-21 11:46:52
阅读次数:
54