美文网首页
观后小结:技术演讲 - WebCrawling and Meta

观后小结:技术演讲 - WebCrawling and Meta

作者: 做个懂科学的憨人 | 来源:发表于2013-05-19 21:09 被阅读111次

演讲内容摘要:

Web crawling is a hard problem and the web is messy. There is no shortage of semantic web standards -- basically, everyone has one. How do you make sense of the noise of our web of billions of pages?

This talk presents two key technologies that can be used: Scrapy, an open source & scalable web crawling framework, and Mr. Schemato, a new, open source semantic web validator and distiller.

演讲视频在 vimeo 上,幻灯片可以看 Speaker Deck 上的,或者浏览器直接打开这儿。幻灯片是用 reSTS5 制作的,源码在 github 上。

演讲者是 Andrew Montalenti, co-founder/CTO of Parse.ly

个人观后小结:

  • 他对三个页面抓取相关的动词之间区别的理解:Crawling, Spidering, Scraping
  • Parse.ly 有大于 1TB 的生产数据是放在内存中的
  • 开发和测试环境使用 Scrapy Cloud,生产环境使用 Rackspace Cloud
  • 现场演示如何基于 Scrapy 定制爬虫
  • 演示了他们是怎么使用 Scrapy Cloud
  • 介绍了他们的开源项目:Schemato - the unified validator for the next generation of metadata

作者:czhang

原文链接:http://jianshu.io/p/CFP7Gx

相关文章

  • 观后小结:技术演讲 - WebCrawling and Meta

    演讲内容摘要: Web crawling is a hard problem and the web is mes...

  • 【心理学】怎样做出正确的选择?

    前记:可以把这看作是一篇对一场同名ted演讲的小结&观后感。 先大致概括演讲所论述的结论:我们在生活中无时无刻都要...

  • html Meta小结

  • meta小结汇总

    手机布局必备——视口 viewportviewport官网 http://blog.jobbole.com/44...

  • 2018101422W 7 作文

    乔布斯演讲观后感。 when I listened to a speech of Jobs, I had a ...

  • Robin演讲小结

    Robin: 每次选择,选对了,海阔天空,选错了,荆棘密布 兴趣是最大驱动力,丰富的信息源最重要。 坚持自己选择,...

  • 演讲知识小结

    一、如何克服紧张情绪? ①积极的心理暗示; ②做充分的准备; ③目光看头顶,找面善的人; 演...

  • 英文演讲小结

    But, in a larger sense,we can not dedicate,we can not con...

  • “演讲”活动小结

    为了完成口语交际——演讲的教学内容,我没有选择之前的小组内讲,然后每组推选出代表再在全班演讲,而是给每个孩子机会在...

  • 跨年演讲《时间的朋友》观后感

    跨年演讲《时间的朋友》观后感 2017年年末,抓住了时间的尾巴,参加了罗振宇的《时间的朋友》跨年演讲,这次演讲主要...

网友评论

      本文标题:观后小结:技术演讲 - WebCrawling and Meta

      本文链接:https://www.haomeiwen.com/subject/mjqxtttx.html