eMMC(embedded MultiMedia Card)是MMC协会制定,针对手机和平板电脑的内嵌式存储器标准规范。 1、背景介绍 纵观Nand Flash发展史,最开始闪存市场被三星和东芝霸占,各闪存生产商没有一套统一的设计标准。为了反抗三星和东芝的霸权,在旧金山IDF论坛上成立了ONFI(O ...
分类:
其他好文 时间:
2020-02-05 11:33:45
阅读次数:
145
jieba简介 jieba库是一个简单实用的中文自然语言处理分词库。 jieba分词属于概率语言模型分词。概率语言模型分词的任务是:在全切分所得的所有结果中求某个切分方案S,使得P(S)最大。 jieba支持三种分词模式: 全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧 ...
分类:
其他好文 时间:
2020-02-02 19:31:12
阅读次数:
108
今天学习自然语言的算法 TF-IDF 算法 :关键词提取 TF-IDF的主要思想就是:如果某个词在一篇文档中出现的频率高,也就是TF高;在语料库中其他的文档中很少出现,就是DF低,也就是IDF高,则认为这个词具有很好的类区分能力。 TF为词频(Term Frequency),表示词t在文档d中出现的 ...
分类:
其他好文 时间:
2020-02-02 00:59:39
阅读次数:
86
1. 倒排求交 上一篇讲了分词。对用户的query分词之后,得到了一个个独立的词(term)。先设想一个问题,用这些词去索引里搜索时,是不是doc命中query中任何一个term,都可以被搜索出来?(query中只有一个term除外) 这里涉及好几个问题: 1. 截断:例如query是5个词ABCD ...
分类:
其他好文 时间:
2020-01-30 09:56:17
阅读次数:
101
使用jieba模块对内容进行处理,在tfidf.py源码中加入一些自定义的停用词,然后将生成的列表词组使用WordCloud展示出来 from jieba import analyse# 引入TF-IDF关键词抽取接口tfidf = analyse.extract_tags import matpl ...
分类:
其他好文 时间:
2020-01-29 14:17:43
阅读次数:
104
什么是TD-IDF? 计算特征向量(或者说计算词条的权重) 构造文档模型 我们这里使用空间向量模型来数据化文档内容:向量空间模型中将文档表达为一个矢量。 We use the spatial vector model to digitize the document content: the vec ...
分类:
其他好文 时间:
2020-01-22 18:28:36
阅读次数:
236
知道原理的同学这部分可以略过直接看实践部分 什么是TD-IDF? 构造文档模型 我们这里使用空间向量模型来数据化文档内容:向量空间模型中将文档表达为一个矢量。 用特征向量(T1,W1;T2,W2;T3, W3;…;Tn,Wn)表示文档。 Ti是词条项,Wi是Ti在文档中的重要程度, 即将文档看作是由 ...
分类:
其他好文 时间:
2020-01-22 14:35:25
阅读次数:
138
1. #####gafana过期安装包安装报错Error unpacking rpm package grafana-5.1.4-1.x86_64error: unpacking of archive failed on file /usr/sbin/grafana-cli;5e250e9c: cp ...
分类:
数据库 时间:
2020-01-21 00:36:35
阅读次数:
137
Redis主从复制 author:QYX 主从复制、就是主机数据更新后根据配置和策略,自动同步到备机的master/slaver机制,Master以写为主,Slave以读为主 用处: 读写分离 性能扩展 容灾快速恢复 配从(服务器)不配(主服务器) 拷贝到多个redis.conf文件include ...
分类:
其他好文 时间:
2020-01-20 00:32:44
阅读次数:
114
第一步,安装mysql, # mysql -uroot -p 2.建立远程root用户 mysql> GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' IDENTIFIED BY '你设置的密码' WITH GRANT OPTION; mysql> flush pr ...
分类:
编程语言 时间:
2020-01-09 19:00:41
阅读次数:
91