搜索关键字：idf，搜索到581个结果！码迷,mamicode.com！

eMMC特性分析

eMMC(embedded MultiMedia Card)是MMC协会制定，针对手机和平板电脑的内嵌式存储器标准规范。 1、背景介绍纵观Nand Flash发展史，最开始闪存市场被三星和东芝霸占，各闪存生产商没有一套统一的设计标准。为了反抗三星和东芝的霸权，在旧金山IDF论坛上成立了ONFI（O ...

分类：其他好文时间：2020-02-05 11:33:45 阅读次数：145

NLP之中文分词cppjieba

jieba简介 jieba库是一个简单实用的中文自然语言处理分词库。 jieba分词属于概率语言模型分词。概率语言模型分词的任务是：在全切分所得的所有结果中求某个切分方案S，使得P(S)最大。 jieba支持三种分词模式：全模式，把句子中所有的可以成词的词语都扫描出来, 速度非常快，但是不能解决歧 ...

分类：其他好文时间：2020-02-02 19:31:12 阅读次数：108

二月一号博客

今天学习自然语言的算法 TF-IDF 算法：关键词提取 TF-IDF的主要思想就是：如果某个词在一篇文档中出现的频率高，也就是TF高；在语料库中其他的文档中很少出现，就是DF低，也就是IDF高，则认为这个词具有很好的类区分能力。 TF为词频（Term Frequency），表示词t在文档d中出现的 ...

分类：其他好文时间：2020-02-02 00:59:39 阅读次数：86

搜索引擎（3）——查询理解——不可省词

1. 倒排求交上一篇讲了分词。对用户的query分词之后，得到了一个个独立的词（term）。先设想一个问题，用这些词去索引里搜索时，是不是doc命中query中任何一个term，都可以被搜索出来？（query中只有一个term除外）这里涉及好几个问题： 1. 截断：例如query是5个词ABCD ...

分类：其他好文时间：2020-01-30 09:56:17 阅读次数：101

对采集的游记进行数据分析

使用jieba模块对内容进行处理，在tfidf.py源码中加入一些自定义的停用词，然后将生成的列表词组使用WordCloud展示出来 from jieba import analyse# 引入TF-IDF关键词抽取接口tfidf = analyse.extract_tags import matpl ...

分类：其他好文时间：2020-01-29 14:17:43 阅读次数：104

什么是TD-IDF？（计算两篇文章相似度）

什么是TD-IDF？计算特征向量（或者说计算词条的权重）构造文档模型我们这里使用空间向量模型来数据化文档内容：向量空间模型中将文档表达为一个矢量。 We use the spatial vector model to digitize the document content: the vec ...

分类：其他好文时间：2020-01-22 18:28:36 阅读次数：236

动手实践用LDA模型计算两篇英文文档相似度

知道原理的同学这部分可以略过直接看实践部分什么是TD-IDF？构造文档模型我们这里使用空间向量模型来数据化文档内容：向量空间模型中将文档表达为一个矢量。用特征向量（T1，W1；T2，W2；T3， W3；…；Tn，Wn）表示文档。 Ti是词条项，Wi是Ti在文档中的重要程度，即将文档看作是由 ...

分类：其他好文时间：2020-01-22 14:35:25 阅读次数：138

jmeter+influxdb+granfana+collectd监控cpu+mem+TPS

1. #####gafana过期安装包安装报错Error unpacking rpm package grafana-5.1.4-1.x86_64error: unpacking of archive failed on file /usr/sbin/grafana-cli;5e250e9c: cp ...

分类：数据库时间：2020-01-21 00:36:35 阅读次数：137

Redis(六)

Redis主从复制 author:QYX 主从复制、就是主机数据更新后根据配置和策略，自动同步到备机的master/slaver机制，Master以写为主，Slave以读为主用处：读写分离性能扩展容灾快速恢复配从(服务器)不配(主服务器) 拷贝到多个redis.conf文件include ...

分类：其他好文时间：2020-01-20 00:32:44 阅读次数：114

在linux centos7 上安装java运行时环境，

第一步，安装mysql， # mysql -uroot -p 2.建立远程root用户 mysql> GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' IDENTIFIED BY '你设置的密码' WITH GRANT OPTION; mysql> flush pr ...

分类：编程语言时间：2020-01-09 19:00:41 阅读次数：91

共581条上一页 1 ... 6 7 8 9 10 ... 59 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)