1.jingxi-search的建立。 为了灵活的进行分布式部署需要创建一搜素的服务工程发布 搜素服务。Taotao-search。 1.1 系统架构 1.2 创建jingxi-search项目 1.3 pom.文件 需要依赖jingxi-common工程 需要依赖的jar包: Spring的jar ...
分类:
其他好文 时间:
2017-10-22 01:42:00
阅读次数:
298
1.有关搜索功能的构思(有关solr 以及 IK Analyzer 的下载链接 http://pan.baidu.com/s/1i43DOW1 密码:u5gg) 1.1 配置solr服务,设置端口为8080 然后在solr服务加入所需要的字段 1.2 建立jingxi-reach项目 1.3 写一个 ...
分类:
其他好文 时间:
2017-10-22 01:38:22
阅读次数:
142
前一文中已经对推荐算法做了个简单的介绍,最常用的就是协同过滤,可分为基于用户的或者基于作品的。我以mahout对这两个算法进行了测试,发现只用这两个算法来完成推荐的工作,还远远不够。这两算法有以下问题待解决: 1.数据源的广度和精度。 算法需要大量的user_id,product_id,like_n ...
分类:
其他好文 时间:
2017-10-10 19:13:34
阅读次数:
176
问题 使用 ElasticSearch 做搜索 时,比如用户输入 --> 柠檬,搜出来的结果 --> 柠檬汽水,柠檬味牙膏等在前面,真正想要的水果那个 柠檬 在后面。已经在中文分词中加了 柠檬,还是不管用,正常来说 tf、idf 都一样,影响排序的只有 field norms。按道理 “柠檬” 的 ...
分类:
其他好文 时间:
2017-10-09 19:47:26
阅读次数:
279
很多网站都有猜你喜欢,我对淘宝的推荐还是比较满意的。很多算法都可以实现推荐功能,下面来看一看机器学习的算法: 1.回归算法。 回归的意思大概是,估计这堆数据这个规律,然后找出这个规律,这个过程就是回归。spark的MLlib中有线性回归、逻辑回归、保序回归三种。 比如, 假设订单数与价格有f(x)= ...
分类:
编程语言 时间:
2017-09-29 19:25:15
阅读次数:
170
最近在win7的电脑上装了ubuntu,也就是双系统.打算之后工作就直接进入ubuntu,减少之前win7和虚拟机之间的切换.进入ubuntu后,发现一个奇怪的问题是,在终端全屏的时候,底部总是有几行被隐藏了.明明光标在最底部,硬是无法看见,必须把鼠标往屏幕下方移动,它们才会出来.一往下移,最顶端的 ...
分类:
系统相关 时间:
2017-09-26 15:58:42
阅读次数:
271
转:http://www.infocool.net/kb/Other/201704/327327.html 社交类产品对搜索功能需求要求就比较高,需要根据用户城市、用户ID昵称等进行搜索。 项目原先的搜索接口采用SQL查询的方式实现,数据库表采用了按城市分表的方式。但随着业务的发展,搜索接口调用频次 ...
分类:
其他好文 时间:
2017-09-21 19:42:02
阅读次数:
213
一、 多条件的查询方法: 之前已经介绍过倒排索引的结构。在查单个词的时候比较简单,直接查从索引里找是否有这个词对应的文档列表就行了。但如果条件是and、or、not这样的条件,怎么处理呢? and:对多个条件分别取文档列表后,再取交集。 or:对多个条件分别取文档列表后,再取并集。 not:对多个条 ...
分类:
其他好文 时间:
2017-09-11 19:53:08
阅读次数:
111
以前学过点 面向对象的知识,我感觉这之间是有关联的,比如说装饰器的第一个要素是对被装饰的函数的封闭性,不允许更改;第二个就是对装饰器本oj身的可扩展性。 装饰器要点:高阶函数+嵌套函数=装饰器 需要掌握的知识点:1、函数即变量 2、高阶函数(函数的参数也是函数) 3、嵌套函数 装饰器一:装饰器不带参 ...
分类:
编程语言 时间:
2017-08-17 00:46:25
阅读次数:
230
恢复内容开始 # Windows 实战项目 001 文件扫描器 (01) - 主要实现功能 - 搜索系统目录文件 - 找到文件并打印输出 - 主要使用到的函数 - FindFirstFile 函数原型: 参数1 lpFileName 搜索的文件名 参数2 lpFindFileData 搜索到文件数据 ...