码迷,mamicode.com
首页 > 编程语言 > 详细

python搜索引擎和框架

时间:2018-04-03 23:43:53      阅读:522      评论:0      收藏:0      [点我收藏+]

标签:roc   install   res   end   src   port   mode   text   get   

1.安装全文检索包

# 全文检索框架
pip install django-haystack
# 全文检索引擎
pip install whoosh
# 中文分词框架
pip install jieba

heystack一些配置都是固定写好的,需要注意下

2.配置全文检索

  • 1.安装haystack应用

    INSTALLED_APPS = (
      ...
      ‘haystack‘,
    )
    
  • 2.在settings.py文件中配置搜索引擎

    # 配置搜索引擎后端
    HAYSTACK_CONNECTIONS = {
      ‘default‘: {
          # 使用whoosh引擎:提示,如果不需要使用jieba框架实现分词,就使用whoosh_backend
          ‘ENGINE‘: ‘haystack.backends.whoosh_cn_backend.WhooshEngine‘,
          # 索引文件路径
          ‘PATH‘: os.path.join(BASE_DIR, ‘whoosh_index‘),  # 在项目目录下创建文件夹 whoosh_index
      }
    }
    # 当添加、修改、删除数据时,自动生成索引
    HAYSTACK_SIGNAL_PROCESSOR = ‘haystack.signals.RealtimeSignalProcessor
  • 3.在要建立索引的表对应的应用下,创建search_indexes.py文件 
      • 定义商品索引类GoodsSKUIndex(),继承自indexes.SearchIndexindexes.Indexable

      • from haystack import indexes
        from .models import GoodsSKU


        class GoodsSKUIndex(indexes.SearchIndex, indexes.Indexable):
          # 定义字符类型的属性,名称固定为text
          # document=True表示建立的索引数据存储到文件中
          # use_template=True表示通过模板指定表中的字段,用于查询
          text = indexes.CharField(document=True, use_template=True)

          # 针对哪张表进行查询
          def get_model(self):
            return GoodsSKU

          # 针对哪些行进行查询
          def index_queryset(self, using=None):
            return self.get_model().objects.filter(isDelete=False)               

  • 4.指定要建立索引的字段

    • templates下面新建目录search/indexes/应用名

      • 比如goods应用中的GoodsSKU模型类中的字段要建立索引文件夹:search/indexes/goods
      • 在新建目录下,创建goodssku_text.txt,并编辑要建立索引的字段,如下图   

      • templates/search/indexes/goods/goodssku_text_txt

  • 技术分享图片
  • 5.生成索引文件

  • # 在终端运行, 提示是否要删除原有信息, 输入y
  • python manage.py rebuild_index  
  • 技术分享图片
  • 搜索表单处理

    • 搜索地址:/search/
    • 搜索方法:get
    • 接收关键字:q
    • action="/search/"    method="get"    文本框的name= "q" 为固定写法
    • 技术分享图片
                                          
        

配置搜索地址正则

import haystack.urls

url(r‘^search/‘, include(haystack.urls)),

测试搜索效果,接收结果

  • 全文检索结果:

    • 搜索出结果后,haystack会把搜索出的结果传递给templates/search目录下的search.html
    • 对于search.html,我们需要自己建立该html文件,并定义自己的搜索结果页面 技术分享图片
  • 传递的上下文包括:

    • query:搜索关键字
    • page:当前页的page对象
    • paginator:分页paginator对象
    • 提示:
      • settings.py文件中设置HAYSTACK_SEARCH_RESULTS_PER_PAGE
      • 通过HAYSTACK_SEARCH_RESULTS_PER_PAGE可以控制每页显示数量
      • 每页显示一条数据:HAYSTACK_SEARCH_RESULTS_PER_PAGE = 1
  • search.html编写,类似商品列表页面

  

技术分享图片

python搜索引擎和框架

标签:roc   install   res   end   src   port   mode   text   get   

原文地址:https://www.cnblogs.com/yuanzhengchi/p/8708620.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!