题目 状压DP 设 f[i] 表示状态为 i 时的最大概率 那么很明显,f的转移为 但是如果我们这样做就要枚举i,j,k,时间会炸 所以要找优化的方法 认真观察,会发现其实k可以与处理出来 设两个数组,cnt[i],log[i] log[i]表示i是2的几次方(向下取整) cnt[i]状态为i时的k ...
分类:
其他好文 时间:
2019-08-10 21:49:39
阅读次数:
141
冒泡排序(Bubble sort)和选择排序(Selection sort) 初看冒泡排序和选择排序不禁会问它们有什么区别? 的确, 它们的基本思想是一样的. 都是通过一轮的循环找到所要排序数中的最值(最大值或最小值), 然后将最值置于顶端. 它们的区别主要体现在对其他数(非最值)的处理上. 冒泡排 ...
分类:
编程语言 时间:
2019-06-03 14:33:42
阅读次数:
100
贪心搜索(greedy search) 贪心搜索最为简单,直接选择每个输出的最大概率,直到出现终结符或最大句子长度。 集束搜索(beam search) 集束搜索可以认为是维特比算法的贪心形式,在维特比所有中由于利用动态规划导致当字典较大时效率低,而集束搜索使用beam size参数来限制在每一步保 ...
分类:
其他好文 时间:
2019-04-28 19:05:49
阅读次数:
164
一、jieba 库简介 (1) jieba 库的分词原理是利用一个中文词库,将待分词的内容与分词词库进行比对,通过图结构和动态规划方法找到最大概率的词组;除此之外,jieba 库还提供了增加自定义中文单词的功能。 (2) jieba 库支持3种分词模式: 精确模式:将句子最精确地切开,适合文本分析。 ...
分类:
其他好文 时间:
2019-04-15 00:42:17
阅读次数:
248
一、jieba库与wordcloud库的使用 1.jieba库与wordcloud库的介绍 jieba 库的分词原理是利用一个中文词库,将待分词的内容与分词词库进行比对,通过图结构和动态规划方法找到最大概率的词组;除此之外,jieba 库还提供了增加自定义中文单词的功能。 wordcloud是优秀的 ...
分类:
其他好文 时间:
2019-04-04 00:04:50
阅读次数:
376
一、jieba 库简介 (1) jieba 库的分词原理是利用一个中文词库,将待分词的内容与分词词库进行比对,通过图结构和动态规划方法找到最大概率的词组;除此之外,jieba 库还提供了增加自定义中文单词的功能。 (2) jieba 库支持3种分词模式: 精确模式:将句子最精确地切开,适合文本分析。 ...
分类:
其他好文 时间:
2019-04-03 23:58:43
阅读次数:
292
Note of Jieba jieba库是python 一个重要的第三方中文分词函数库,但需要用户自行安装。 一、jieba 库简介 (1) jieba 库的分词原理是利用一个中文词库,将待分词的内容与分词词库进行比对,通过图结构和动态规划方法找到最大概率的词组;除此之外,jieba 库还提供了增加 ...
分类:
其他好文 时间:
2019-04-02 19:51:52
阅读次数:
176
理论推导 神经网络通常第一层称为输入层,最后一层 $L$ 被称为输出层,其他层 $l$ 称为隐含层 $(1 max) {// 找到softmax输出的最大概率,视为预测值 max = s.output[i]; index = i; } } for (int i = 0; i 0) { if (i = ...
分类:
其他好文 时间:
2019-03-11 00:57:45
阅读次数:
172
思想: 把每个词看成是各个字组成,如果相连的字在不同的文本中出现次数越多,相连的字很可能是一个词 利用字与字相邻出现的频率反映词的可靠度 buzhou: 建立统计语言模型 对句子进行单词划分,然后对划分结果进行概率计算,获得最大概率的分词方式 语言模型: 长度为m的字符串确定其概率分布为P(w1,w ...
分类:
其他好文 时间:
2018-11-07 18:16:34
阅读次数:
191
LDA只是一个求解思路。 1.理解LDA首先要理解EM算法,EM不能叫做一个算法,只是一个思想:它要求解的其实是一个极大似然估计,就是我用已知量去求解导致这个已知量出现的最大概率,而在这里又恰恰有点偏,这个已知量是我们开始给定的这个初值,我们要去用这个已知量去求解最大,然后再用这个最大值再带入到我们 ...
分类:
其他好文 时间:
2018-05-24 23:06:07
阅读次数:
226