八卦一下
计算的本质[http://book.douban.com/subject/26148763/]
书中提到了几种与图灵机等价的模型, lambda算子、部分递归函数、SKI组合子、Iota、标签系统、循环标签系统、Conway生命游戏、rule 110、Wolfram的2,3图灵机。
部分递归函数,可能就是维基百科在递归函数词条中提到的“在可计算性理论中证明了递归函数...
分类:
其他好文 时间:
2014-12-15 19:08:18
阅读次数:
200
本文翻译自Elasticsearch官方指南的Proximity Matching一章。
邻近匹配(Proximity Matching)
使用了TF/IDF的标准全文搜索将文档,或者至少文档中的每个字段,视作"一大袋的单词"(Big bag of Words)。match查询能够告诉我们这个袋子中是否包含了我们的搜索词条,但是这只是一个方面。它不能告诉我们关于单词间关...
分类:
其他好文 时间:
2014-12-15 12:11:17
阅读次数:
205
一. sort merge joins连接(排序合并连接) 原理
指的是两个表连接时, 通过连接列先分别排序后, 再通过合并操作来得到最后返回的结果集的方法.
假如表 T1 和 T2 的连接方式是排序合并连接, oracle 执行步骤如下:
(1) 根据 sql 语句中的谓词条件(如果有) 访问 T1 表, 得到一个过滤的结果集, 然后按照 T1 中的连接列对结果集进行排序
(2...
分类:
数据库 时间:
2014-12-13 10:53:51
阅读次数:
291
fold change英文简称 : FC中文全称 : 倍性变化所属分类 : 生物科学词条简介 : 一种用于描述两个用于相比的对象数量差异的方法。例如,第一个样本和第二个样本的量是50/10,那么FC(Ratio)就是5,反之就是0.2。用这种方法分析微阵列的数据可以说明:1)从基因表达的绝对值而来的...
分类:
其他好文 时间:
2014-12-12 11:29:31
阅读次数:
153
luncene 各种Query类详解实例,包括词条搜索类TermQuery “与或”搜索类——BooleanQuery 在某一范围内搜索类——RangeQuery 使用前缀搜索类——PrefixQuery 多关键字搜索——PhraseQuery 短语词缀搜索——PhrasePrefixQuery 相近词语的搜索——FuzzyQuery...
分类:
其他好文 时间:
2014-12-11 12:22:36
阅读次数:
242
以字段为中心的查询(Field-centric Queries)
上述提到的三个问题都来源于most_fields是以字段为中心(Field-centric),而不是以词条为中心(Term-centric):它会查询最多匹配的字段(Most matching fields),而我们真正感兴趣的最匹配的词条(Most matching terms)。
NOTE
best_fields同...
分类:
其他好文 时间:
2014-12-11 10:26:13
阅读次数:
312
首先,是关键词的选取:好吧这个我这模型实在是太简单了,但还是讲一讲比较好呢。。。我们现在手头有的是一堆百度百科词条w的DF(w, c)值,c是整个百科词条。。。原因是。。。方便嘛~(而且人家现成的只有介个了啦~)我们发现有830W+的词条数目,都存下来显然是不理智、不科学、不魔法的。所以选取一部分作...
分类:
编程语言 时间:
2014-12-06 21:28:41
阅读次数:
357
安装:从ORACAL下载JAVA SE安装程序,进行安装。安装过程再次就不详细介绍,相信大家都可以完成。配置环境变量:高级系统设置 -> 环境变量 -> 系统变量JAVA_HOME : 新增词条:JAVA安装路径,此处本人的路径为(D:\Java\jdk1.8.0_25)PATH : 修改...
分类:
编程语言 时间:
2014-12-06 15:20:06
阅读次数:
165
控制分析(Controlling Analysis)
查询只能摘到真实存在于倒排索引(Inverted Index)中的词条(Term),因此确保相同的分析过程会被适用于文档的索引阶段和搜索阶段的查询字符串是很重要的,这样才能够让查询中的词条能够和倒排索引中的词条匹配。
尽管我们说的是文档(Document),解析器(Analyzer)是因字段而异的(Determined per Fi...
分类:
其他好文 时间:
2014-12-06 11:27:30
阅读次数:
319
翻译自官方指南的全文搜索一章。
全文搜索(Full Text Search)
现在我们已经讨论了搜索结构化数据的一些简单用例,是时候开始探索全文搜索了 - 如何在全文字段中搜索来找到最相关的文档。
对于全文搜索而言,最重要的两个方面是:
相关度(Relevance)
查询的结果按照它们对查询本身的相关度进行排序的能力,相关度可以通过TF/IDF,参见什么是相关...
分类:
其他好文 时间:
2014-12-03 10:31:26
阅读次数:
313