智慧芽 面试:
- 简单描述一下协程的运作原理。(在 "关于协程" 中有描述)
- 协程在遇到发送IO请求时是如何运作的?如何把io请求挂起的?(在 "关于协程" 中有提到用 await)
- 关于机器学习,有一个应用场景:爬取到了很多专利,以及专利描述,然后有一个列表记录所有专利的分类,如何对爬取到的专利进行分类?(无监督的情况:爬取到了专利,但是没有对他们有做过分类;有监督的情况:爬取到的专利打上了分类标签)
- 关于爬虫的部署和监控,如果有100个网站需要爬取,如何管理和部署这些爬虫?如果有一只爬虫死了,如果监控到是哪一只爬虫死了?
- 分布式爬虫,分控制端和client端,如果控制端死掉了,如何防止client崩掉?
- python,如何实现单例?
- 你能想到有什么反爬虫的机制?
- 在学习完机器学习课程以后,如何在实际操作中运用?
----------------- 2017/10/02 更新 ------------
- crontab 在执行定时任务时, 每一条命令是顺序执行的还是并行执行的? 如果第一条命令报错了, 后面的命令还会不会执行?
网友评论