关键词提取有很多种方法,目前比较常用的两种无监督的方法,一个是tfidf算法,一种是textrank算法,相较来说textrank算法要比tfidf算法要好一些。本文主要简单介绍一下有关TextRank的算法。
PageRank
在介绍TextRank之前,首先介绍一下PageRank,这个比较经典的办法,翻阅了很多资料,大多都只是罗列公式,却没有具体的例子来讲这个公式是如何用的,总感觉云里雾里,不清楚,直到看到这篇文章Understand TextRank for Keyword Extraction by Python。
网友评论