自然语言处理
读了Bengio的《A Neural Probabilistic Language Model》,颇有感悟,以此文...[作者空间]
步骤 分词、去停用词 词袋模型向量化文本 TF-IDF模型向量化文本 LSI模型向量化文本 计算相似度 理论知识 ...[作者空间]
1 初始文本挖掘 1.1 何为文本挖掘 文本挖掘是指从大量文本数据中抽取事先未知的、可理解的、最终可用的知识的过程...[作者空间]