抓取的网页,是非结构话的数据,我们解析出来结构化数据,
我们的结构化的数据是一个临时的结构化,需要进一步处理才能成为最终的结构化。
本次的结构化,是为了能够更好的还原原本的数据,也为了减少储存空间。
所以可读性并不是很强,需要写脚本才能将数据合并起来,成为可读性强的数据。
我们依然需要从抓取的的数据中找出有意义的数据,将其进行还原,
成为能真正使用的数据。
抓取的网页,是非结构话的数据,我们解析出来结构化数据,
我们的结构化的数据是一个临时的结构化,需要进一步处理才能成为最终的结构化。
本次的结构化,是为了能够更好的还原原本的数据,也为了减少储存空间。
所以可读性并不是很强,需要写脚本才能将数据合并起来,成为可读性强的数据。
我们依然需要从抓取的的数据中找出有意义的数据,将其进行还原,
成为能真正使用的数据。
本文标题:结构化数据抓取
本文链接:https://www.haomeiwen.com/subject/talfnltx.html
网友评论