redis.conf 1 #是否在后台运行;no:不是后台运行 2 daemonize yes 3 4 #是否开启保护模式,默认开启。要是配置里没有指定bind和密码。开启该参数后,redis只会本地进行访问,拒绝外部访问。 5 protected-mode yes 6 7 #redis的进程文件 ...
分类:
其他好文 时间:
2020-07-13 09:20:20
阅读次数:
60
昨天学习了简单的文本处理,之后在课后的练习中实现了包括了对tf-idf的处理和基于朴素贝叶斯简单的文本分类 基于tf-idf的数据集在出现多个关键词的时候一般能够相对准确对文本进行分类,但是对于相对具有深层含义的内容,例如情感的积极,情感的消息这方面的分类来说,就显得有些乏力的。根据昨天构建的文本分 ...
分类:
其他好文 时间:
2020-07-09 10:48:09
阅读次数:
72
Jitsi是个优秀的WebRTC流媒体服务器,使用Java语言做开发,可以让很多Java人员也能进行流媒体开发,但是奈何国内的教程太少,官方文档更新太快,导致很多想用他的人却望而却步。 在写这篇文章之前,在搜索引擎上进行了搜索,发现没有一篇文章完整的把Jitsi Meet搭建起来并且能够多人正常音视 ...
分类:
Web程序 时间:
2020-07-05 12:05:18
阅读次数:
307
pip install openpyxl 写文件 from openpyxl import Workbook wb = Workbook() # grab the active worksheet ws = wb.active # or # ws = wb.create_sheet("Sheet1" ...
分类:
其他好文 时间:
2020-07-03 01:07:20
阅读次数:
87
动机:在IDE中添加widfly依赖 原由:widfly实现了servlet接口,有我们对外交互时所需求的jar包 步骤: 第一步: 找到module依赖的地方 第二步:点击左侧的添加按钮,点击Library 第三步:选择自己想添加的应用服务器 总结:需要添加这个的原因就是缺少jar包,如果不导入所 ...
分类:
其他好文 时间:
2020-06-29 15:06:51
阅读次数:
54
TF-IDF的定义及计算 最近在做一些NLP的研究,由于也是第一次做这个东西,其实还是发现很多有意思的东西。 相信很多做过NLP的人都应该接触过提取关键词的这个功能。现在有很多可以使用的第三方工具包可以很容易的来实现这个功能,比如snowNLP,jieba等,但是我们还是要做到知其然,知其所以然,所 ...
分类:
其他好文 时间:
2020-06-28 09:13:35
阅读次数:
129
1.jieba分词与词性标注 思路: (1)利用pandas读取csv文件中的酒店客户评论,并创建3个新列用来存放分词结果、词性标注结果、分词+词性标注结果 (2)利用jieba分词工具的posseg包,同时实现分词与词性标注 (3)利用停用词表对分词结果进行过滤 (4)将分词结果以20000条为单 ...
分类:
编程语言 时间:
2020-06-27 20:32:04
阅读次数:
125
内容源自 https://www.aclweb.org/anthology/2020.acl-tutorials.8.pdf 1描述开放域问题回答(QA)是利用大量不同主题的文献来回答问题的任务,是自然语言处理(NLP)、信息检索(IR)中长期存在的一个问题。 及相关领域(沃海等人,1999年;摩尔 ...
分类:
其他好文 时间:
2020-06-26 01:05:10
阅读次数:
147
拜读了两篇大作,受益匪浅,感谢! 这孩子谁懂哈 https://blog.csdn.net/zhaomengszu/article/details/81452907 elly https://zhuanlan.zhihu.com/p/94446764 #如何准确抓住一篇文章内容的关键词? TF-ID ...
分类:
编程语言 时间:
2020-06-18 13:19:41
阅读次数:
244
Spring Boot 2.x中目前自带的主要JSON序列化和反序列化工具目前主要有:com.google.gson.Gson、com.fasterxml.jackson和org.yaml.snakeyaml.Yaml(用于yaml与json的转换): 平常的Web开发自带JSON包里用的最多的应该 ...
分类:
编程语言 时间:
2020-06-16 18:16:36
阅读次数:
361