Django实现全文检索(支持中文)

作者: ___大鱼___ | 来源:发表于2018-05-12 10:45 被阅读91次

PS: 我的检索是在文章模块下 forum/article

第一步:先安装需要的包:

pip install django-haystack
pip install whoosh
pip install jieba

第二步: 配置需要的文件 settings.py

添加haystack应用模块

INSTALLED_APPS = (
     ...
    'haystack',
     ...
)

在settings.py 末尾添加

HAYSTACK_CONNECTIONS = {
    'default': {
        'ENGINE': 'article.whoosh_cn_backend.WhooshEngine',
        'PATH': os.path.join(BASE_DIR, 'whoosh_index'),
    },
}
HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor'   # 索引自动更新

第三步: 配置url路径

在 forum/forum/urls.py中包含search路径

url(r'^search/', include('haystack.urls')),

第四步:建立模型

forum/article/models.py

class Article(models.Model):
    '''
    文章数据模型
    '''
    id = models.AutoField(primary_key=True,verbose_name='文章编号')
    title = models.CharField(max_length=50,verbose_name='文章标题')
    content = MDTextField()
    publish_time = models.DateTimeField(auto_now_add=True,verbose_name='发表时间')
    last_update_time = models.DateTimeField(auto_now=True,verbose_name='最后一次修改时间')
    status = models.IntegerField(u'状态', default=1)  
    read_count = models.IntegerField(default=0,verbose_name='阅读次数')
    comment_count = models.IntegerField(default=0,verbose_name='评论次数')

    #关联用户
    user = models.ForeignKey(User,on_delete=models.CASCADE,verbose_name='用户')
    subject = models.ForeignKey(Subject, null=True, blank=True, on_delete=models.CASCADE,
                                verbose_name='属于哪一个专题')

第五步:设置为那个class建立索引

如果你想针对某个app例如mainapp做全文检索,则必须在mainapp的目录下面建立search_indexes.py文件,文件名不能修改
例:forum/article/search_indexes.py模块


from article.models import Article
from haystack import indexes


class ArticleIndex(indexes.SearchIndex, indexes.Indexable):

    text = indexes.CharField(document=True, use_template=True)

    def get_model(self):
        return Article

    def index_queryset(self, using=None):
        return self.get_model().objects.filter(status=1)

每个索引里面必须有且只能有一个字段为document=True

第六步: 确定我们需要的属性:

新建yourapp/templates/search/indexes/yourapp/article_text.txt来指明需要属性
例: article/templates/search/indexes/yourapp/article_text.txt

{{ object.title }}  # 文章标题
{{ object.user.username }}  # 文章作者
{{ object.content }}  # 文章内容

第七步: 把搜索引擎放入项目下

例: forum/article/whoosh_cn_backend.py

将文件whoosh_backend.py(例: 我的python路径E:\python\Lib\site-packages\haystack\backends\whoosh_backend.py
)放到article下,并重命名为whoosh_cn_backend.py,例如blog/whoosh_cn_backend.py。修改如下:

导入  
from jieba.analyse import ChineseAnalyzer
找到
schema_fields[field_class.index_fieldname] = TEXT(stored=True, analyzer=StemmingAnalyzer(), field_boost=field_class.boost, sortable=True)
然后将其修改为
schema_fields[field_class.index_fieldname] = TEXT(stored=True, analyzer=ChineseAnalyzer(), field_boost=field_class.boost, sortable=True)

成功引入jieba分词

第八步: 前端页面配置

templates/base.html (搜索页面)

  <form class="navbar-form navbar-left" action="/search/" method="get">
                <div class="form-group">
                    <input type="text" class="form-control" name="q" placeholder="请输入搜索的内容" value=""/>
                </div>
                <input type="submit" value="搜索">
            </form>

结果展示页面(forum/article/templates/search/search.html)

{% extends 'base.html' %}

{% block title %}搜索结果{% endblock %}

{% block content %}
<div class="container" id="content">
    <div class="search-body">

    <form method="get" action="">
        <table>
            <tr>
                <td>
                    <label for="id_q"></label>
                </td>
                <td>
                    <input class="form-control" id="id_q" name="q" type="search" value="{{ query }}" />
                </td>

                <td>&nbsp;</td>
                <td>
                    <button class="btn btn-defaul" type="submit"><span class="glyphicon glyphicon-search">搜索</span></button>
                </td>
            </tr>


        </table>
</form>
        {% if query %}
            <h3>搜索结果</h3>

            <table class="table">
            <tr>

                 {% for result in page.object_list %}
                      <td>
                <p>
                    <a href="{% url 'article:article_detail' article_id=result.object.id %}">
                        {{ result.object.title }}</a>
                </p> 作者: <a href="{% url 'user:user_index' result.object.user.id %}">{{ result.object.user.username }}</a>
                <p>{{ result.object.content | safe | truncatechars_html:40 }}</p>
            </td>
            </tr>

            {% empty %}
                <p>没有得到想要的结果哦.</p>
            {% endfor %}
            </table>


            {% if page.has_previous or page.has_next %}
                <div>
                    {% if page.has_previous %}<a href="?q={{ query }}&amp;page={{ page.previous_page_number }}">{% endif %}&laquo; 上一页{% if page.has_previous %}</a>{% endif %}
                    |
                    {% if page.has_next %}<a href="?q={{ query }}&amp;page={{ page.next_page_number }}">{% endif %}下一页 &raquo;{% if page.has_next %}</a>{% endif %}
                </div>
            {% endif %}
        {% else %}
            {# Show some example queries to run, maybe query syntax, something else? #}
        {% endif %}


    </div>

</div>
{% endblock %}

第九步: 建立索引

python manage.py rebuild_index
建立成功会自行生成一个forum/whoosh_index的文件夹

第十步: 运行程序

python manage.py runserver

PS: 模板样式可以自行调整

相关文章

  • Django实现全文检索(支持中文)

    PS: 我的检索是在文章模块下 forum/article 第一步:先安装需要的包: 第二步: 配置需要的文件 s...

  • 全文检索-sphinx

    为什么要用Sphinx原因1:MySQL不支持中文全文检索、模糊查询(like)慢原因2:sphinx支持中文全文...

  • MySQL搜索(全文检索)

    MySQL在5.7版本中终于提供了原生的中文全文检索的能力,通过内置了ngram全文检索插件,用来支持中文分词,并...

  • Django+haystack+whoosh+jieba全文检索

    简介 全文检索主要用在大数据量时多字段模糊检索上能较大的提高检索效率。django实现全文检索功能主要靠hayst...

  • Coreseek安装与测试

    1.Coreseek介绍: Sphinx默认不支持中文索引及检索,基于Sphinx开发了Coreseek全文检索服...

  • django全文检索的实现

    1在虚拟环境项目下安装 自动的将django升级为2.0.7版本后,要再pip install django==1...

  • MySQL中文全文检索

    MySQL中文全文检索

  • 利用mongo-connector将mongodb中数据同步到e

    因为项目中需要对mongodb中数据实现全文检索的功能,但mongodb的全文检索不支持英文。而 elastics...

  • Sphinx实时搜索设计探讨

    背景 Sphinx是一个全文搜索引擎,虽然官方没对中文分词检索做直接支持,但是配合coreseek还是能很好地实现...

  • Django全文检索

    全文检索 django中提供了一个包haystack,是一种全文检索的框架,可以方便地对model里面的 内容进行...

网友评论

    本文标题:Django实现全文检索(支持中文)

    本文链接:https://www.haomeiwen.com/subject/htycdftx.html