码迷,mamicode.com
首页 >  
搜索关键字:tokenize    ( 75个结果
7-2 最佳调度问题 (40 分)
假设有n(n<=20)个任务由k(k<=20)个可并行工作的机器完成。完成任务i需要的时间为ti。 试设计一个算法,对任意给定的整数n和k,以及完成任务i 需要的时间为ti ,i=1~n。计算完成这n个任务的最佳调度,使得完成全部任务的时间最早。 输入格式: 输入数据的第一行有2 个正整数n和k。第 ...
分类:其他好文   时间:2019-11-22 15:25:08    阅读次数:350
安装和使用nltk
安装 参考:https://www.cnblogs.com/zrmw/p/10869325.html 分词: 注意先分句再分词 ,这些对象均来自nltk.tokenize库 1. word_tokenize 导入nltk的tokenize库后,tokens = nltk.word_tokenize( ...
分类:其他好文   时间:2019-11-16 21:26:17    阅读次数:82
自然语言处理及案例
''' 自然语言处理(NLP) 词袋模型:一句话的语义很大程度取决于某个单词出现的次数,所以可以把句子中所有可能出现的单词作为特征名, 每一个句子为一个样本,单词在句子中出现的次数为特征值构建数学模型,称为词袋模型。 例如: 1 The ... ...
分类:编程语言   时间:2019-07-24 09:27:35    阅读次数:191
设计模式之JDK和Spring
一、JDK中的设计模式 (1)结构性模式 1.适配器模式 java.util.Arrays#asList() java.io.InputStreamReader(InputStream) java.io.OutputStreamWriter(OutputStream) java.xml.bind.a ...
分类:编程语言   时间:2019-07-18 23:44:00    阅读次数:142
anaconda 不一样的conda命令
@[TOC]anaconda 不一样的conda命令 安装环境 python 3.7.3 + anaconda 缘由 1. 清华源不能用了 2. 中科大源不能用了 ... 惨痛学习中的意外参数出现了.. 隔壁组的助教居然还分享了个坑..... conda create n py3 clone bas ...
分类:其他好文   时间:2019-06-09 20:49:46    阅读次数:157
ElasticSearch(十八)初识分词器
1、什么是分词器 作用:切分词语,normalization(提升recall召回率),如给你一段句子,然后将这段句子拆分成一个一个的单个的单词,同时对每个单词进行normalization(时态转换,单复数转换),分词器 recall,召回率:搜索的时候,增加能够搜索到的结果的数量 3个功能: 一 ...
分类:其他好文   时间:2019-05-19 18:16:21    阅读次数:114
安装TA-Lib时报错:ubuntu****, Command "/usr/bin/python -u -c "import setuptools, tokenize;__file__='
使用pip install TA-Lib 时报错: 解决方案: sudo apt-get install libssl-dev libffi-dev python-dev build-essential libxml2-dev libxslt1-dev sudo apt-get install li ...
分类:编程语言   时间:2019-04-30 17:17:24    阅读次数:3362
20175317 《Java程序设计》第七周学习总结
20175317 《Java程序设计》第七周学习总结 教材学习内容总结 第七周我学习了教材第八章的内容,学习了许多常用实用类,有以下内容: 类 1. 如何构造 对象 2. 类的常用方法 3. 字符串与基本数据类型的转化 4. 正则表达式及字符串的替换与分解 类 类 类 1. 的对象 2. 类的常用方 ...
分类:编程语言   时间:2019-04-14 16:15:03    阅读次数:142
机器学习入门-文本特征-word2vec词向量模型 1.word2vec(进行word2vec映射编码)2.model.wv['sky']输出这个词的向量映射 3.model.wv.index2vec(输出经过映射的词名称)
函数说明: 1. from gensim.model import word2vec 构建模型 word2vec(corpus_token, size=feature_size, min_count=min_count, window=window, sample=sample) 参数说明:corp ...
分类:其他好文   时间:2019-01-27 14:42:31    阅读次数:339
机器学习入门-文本特征-使用LDA主题模型构造标签 1.LatentDirichletAllocation(LDA用于构建主题模型) 2.LDA.components(输出各个词向量的权重值)
函数说明 1.LDA(n_topics, max_iters, random_state) 用于构建LDA主题模型,将文本分成不同的主题 参数说明:n_topics 表示分为多少个主题, max_iters表示最大的迭代次数, random_state 表示随机种子 2. LDA.component ...
分类:其他好文   时间:2019-01-27 01:06:51    阅读次数:760
75条   上一页 1 2 3 4 ... 8 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!