《信息组织与信息检索》专题

专题列表页

未经允许，不得转载，谢谢~~ 一文章简介为什么要提出这个新的评价算法？我们都知道ranking过程对于信息检...[作者空间]

1.目标数据：数据来源：我不是药神短评 - https://movie.douban.com/subject...[作者空间]

使用场景：基于索引词(terms)将搜索结果安排到类别(categories)中，通过缩小搜索结果在搜索期间提供更...[作者空间]

1.JIEBA简介 jieba是基于Python的中文分词工具，支持繁体分词、自定义词典和三种分词模式：精确模式...[作者空间]

1.MMSeg分词算法原理 MMSeg是Chih-Hao Tsai提出的基于字符串匹配（亦称基于词典）的中文分词算...[作者空间]

1.介绍 ICTCLAS（Institute of Computing Technology,Chinese Le...[作者空间]

介绍 Scrapinghub公司提供基于云的Web爬行平台和数据即服务，Scrapy Cloud是Scraping...[作者空间]

1.什么是API2.API的作用3.调用豆瓣API爬取电影Top2504.解决问题 1.什么是API API(Ap...[作者空间]

1.关于Tika的介绍2.检测运行环境3.使用GUI界面解析文档4.通过命令行使用Tika5.使用Tika接口：在...[作者空间]

数据来源：豆瓣图书 Top 250 目标描述：建立一个爬虫项目，抓取豆瓣读书Top 250页面的250本书的信...[作者空间]

1.定义 regular expression（RE），正则表达式是用来简洁表达一组字符串的表达式。正则表达式通常...[作者空间]

1. 安装环境服务器系统：Ubuntu 16.04.3 Apache2.4:/usr/local/apache ...[作者空间]