美文网首页
记录一下自己学习爬虫的经历 1

记录一下自己学习爬虫的经历 1

作者: newuer | 来源:发表于2015-11-12 23:30 被阅读0次

先说一下自己学习的基本目的 . 

1. 复习 python

2. 理解 爬虫架构

---------- 开始 -------------

当前自己机器的环境 

  a.  mac osx , python3.5, pycharm4.5 .

  b. 还会用到各种包,都尽量的使用最新的.

------------第一个小程序段----------

#!/usr/bin/env python

# coding: utf-8

# 学习一下 BeautifulSoup v4

frombs4importBeautifulSoup

# from imp import

importurllib.request

importsys

importimportlib

importtime,datetime

importlib.reload(sys)

__author__ ='bai'

# 抓取地址 读入页面源文件

url1 ="http://z.cn/"

open_beg_time = time.time()

data = urllib.request.urlopen(url1).read()

open_end_time = time.time()

soup = BeautifulSoup(data,"lxml")

parse_end_time = time.time()

print(soup)

print("get page time",open_end_time - open_beg_time)

print("formate ",parse_end_time - open_end_time)

相关文章

网友评论

      本文标题:记录一下自己学习爬虫的经历 1

      本文链接:https://www.haomeiwen.com/subject/fgohhttx.html