网页读取

作者: 董八七 | 来源:发表于2018-06-07 16:57 被阅读4次

如果用节点,用rvest::read_html(url) %>% html_nodes(".article_title_cn") %>% html_text,主要还是用正则表达式提取有效信息。
如果只读取源代码,用readLines,当网页没有很好的结构时,才用这个方法。

相关文章

网友评论

    本文标题:网页读取

    本文链接:https://www.haomeiwen.com/subject/lkngsftx.html