基于Python的信息检索课程设计

作者: LEMFOooO | 来源:发表于2019-08-10 12:02 被阅读0次

基于Python的信息检索课程设计
[源码和文档分享]基于Python的信息检索课程设计
读书笔记：《Information filtering and
常用推荐算法
sketch to photo基于检索篇
2021年3月25日日知录
读书笔记—《交互设计精髓》第15章搜索与查找改善数据检索
基于NMT的Conversation Generation相关概
人机对话（3）-聊天机器人（检索、生成）
项目三：基于内容的图像检索

sdu视点新闻全站爬虫爬取+索引构建+搜索引擎查询练习程序

爬虫功能使用Python的scrapy库实现，并用MongoDB数据库进行存储。

索引构建和搜索功能用Python的Whoosh和jieba库实现。（由于lucene是java库，所以pyLucene库的安装极其麻烦，因此选用Python原生库Whoosh实现，并使用jieba进行中文分词。）

搜索网页界面用django实现，页面模板套用BootCDN。

1 要求

以下是检索的基本要求：可以利用lucene、nutch等开源工具，利用Python、Java等编程语言，但需要分别演示并说明原理。

1.1 Web网页信息抽取

以山东大学新闻网为起点进行网页的循环爬取，保持爬虫在view.sdu.edu.cn之内（即只爬取这个站点的网页），爬取的网页数量越多越好。

1.2 索引构建

对上一步爬取到的网页进行结构化预处理，包括基于模板的信息抽取、分字段解析、分词、构建索引等。

1.3 检索排序

对上一步构建的索引库进行查询，对于给定的查询，给出检索结果，明白排序的原理及方法。

点击此处下载文档和源码

基于Python的信息检索课程设计
sdu视点新闻全站爬虫爬取+索引构建+搜索引擎查询练习程序爬虫功能使用Python的scrapy库实现，并用Mo...
[源码和文档分享]基于Python的信息检索课程设计
1 要求以下是检索的基本要求：可以利用lucene、nutch等开源工具，利用Python、Java等编程语言，...
读书笔记：《Information filtering and
该论文的研究目的：基于已存在的信息检索模型提出一个信息过滤模型，并使用这个模型对信息检索和信息过滤进行比较，以便...
常用推荐算法
基于内容过滤从信息检索，和文本检索发展而来基于商品描述及用户喜好描述，为用户推荐商品协同过滤基于用户行为为用户推...
sketch to photo基于检索篇
A 基于检索的方法融合图像，但检索的内容是label,在网络中检索。 B 同样基于检索的方式，但检索基于的内容是s...
2021年3月25日日知录
基础篇基于认知心理学的高效学习方法一、化繁为简，解决复杂问题的思维过滤法（一）信息检索 1.信息检索的有效性...
读书笔记—《交互设计精髓》第15章搜索与查找改善数据检索
1、数字检索方法 ①位置检索 ②标识检索 ③关联或基于属性的检索 2、基于属性的替代方案 ①系统需能够自动摘录恰当...
基于NMT的Conversation Generation相关概
话模型此前的研究大致有三个方向：基于规则、基于信息检索、基于机器翻译。基于规则的对话系统，顾名思义，依赖于人们周...
人机对话（3）-聊天机器人（检索、生成）
当前闲聊机器人有两种实现方式：基于检索与基于生成基于检索的chatbot 检索这种方式，在搜索与推荐系统中通...
项目三：基于内容的图像检索
一、图像检索图像检索两个框架：基于文本和基于内容 1.基于文本常规的图像检索框架，图像由文本注释，然后通过文...