小白学爬虫——第一部分：简单学习Python

作者: Leena_c9a7 | 来源:发表于2019-02-15 23:15 被阅读0次

一篇文章学习 Python 网络爬虫
小白学爬虫——第一部分：简单学习Python
从零基础开始学习Python爬虫你需要注意的点以及如何学习爬虫
从零基础开始学习Python爬虫你需要注意的点以及如何学习爬虫
Python爬虫入门(01) -- 10行代码实现一个爬虫
学渣讲爬虫之Python爬虫从入门到出门（第一讲）
没看错吧？5 行代码就能入门爬虫？
零基础学Python，这些神操作让你1个月上手做项目！
干货 | Python爬虫学习路线，小白都能学会！
各语言简单爬虫

学习目录

定义新函数

文件读写

数组

字符串

字典

定义新函数

通过定义函数名和一组语句序列来定义一个新函数，然后在执行时调用这个函数。一旦定义了一个函数，程序中可以重复使用。

def是用来定义函数的保留关键字。函数命名与变量命名的规则基本上是一样的。字母、数字以及一些符号是合法的，但是函数名的第一个字符不能是数字。不能使用保留关键字命名函数，也要避免函数名和变量名相同。

函数名后面的空括号表明这个函数没有指定参数，若有形式参数，写入括号内用逗号隔开。函数定义的第一行叫做函数头，剩余的部分叫做函数体。

函数头必须以冒号结束，函数体必须缩进。按照惯例，一般缩进4个空格。函数体可以包括任意数量的语句。在Python语言中，是严格缩进的，否则会报错，缩进字符会在用Python写代码时主动提示，这一点不必担心。同时，值得注意的是，在if语句，for循环的使用过程中，也要在冒号后再开始写相应代码。


def hello():

    print('Hello World!')

文件读写

读文件

要以读文件的模式打开一个文件对象，使用Python内置的open()函数，传入文件名和标示符：


f = open('/Users/test.txt','r')

f.read()

f.close()

标示符'r'表示读，这样，我们就成功地打开了一个文件。如果文件打开成功，接下来，调用read()方法可以一次读取文件的全部内容。最后一步是调用close()方法关闭文件。文件使用完毕后必须关闭，因为文件对象会占用操作系统的资源，并且操作系统同一时间能打开的文件数量也是有限的。

写文件

与读文件类似，先用open()函数打开文件，传入文件名和标识符'w'，表示写。你可以调用write()来写入文件，但是务必要调用f.close()来关闭文件。

当我们写文件时，操作系统往往不会立刻把数据写入磁盘，而是放到内存缓存起来，空闲的时候再慢慢写入。只有调用close()方法时，操作系统才保证把没有写入的数据全部写入磁盘。忘记调用close()的后果是数据可能只写了一部分到磁盘，剩下的丢失了。


f = open('/Users/michael/test.txt','w')

f.write('Hello, world!')

f.close()

数组

不含任何元素的列表称为空列表，使用空的方括号（[]）创建一个空列表。列表内的可以是数字，字符串，或者嵌套列表。各元素用逗号隔开，字符串需要加''。


[10, 20, 30, 40]

['crunchy frog', 'ram bladder', 'lark vomit']

可以按照序号来读取数组中的指定序号元素，序号从零开始。x[a:b]表示返回集合中下标a至b（不包括b)的元素集合,x[:b]表示从开始至b(不包括b)，x[a:]表示从a至结束。
介绍一些数组的方法：

L.append(var) #追加元素

L.pop(var) #返回最后一个元素，并从list中删除之

L.remove(var) #删除第一次出现的该元素

L.count(var) #该元素在列表中出现的个数

L.index(var) #该元素的位置,无则抛异常

L.extend(list) #追加list，即合并list到L上

L.sort() #排序

L.reverse() #倒序

字符串

字符串是字符的序列，而列表是一系列值的序列。字符列表与字符串是不同的。

如果想把一个字符串分成单独的单词，使用split函数：


s = 'pining for the fjords'

>>> t = s.split()

>>> print t

['pining', 'for', 'the', 'fjords']

>>> print t[2]

the

介绍一些字符串的方法：

S.find(substring, [start [,end]]) #可指范围查找子串，返回索引值，否则返回-1

S.lower() #转小写

S.upper() #转大写

字典

dict = {‘ob1′:’computer’, ‘ob2′:’mouse’, ‘ob3′:’printer’}

每一个元素是pair，包含key、value两部分。key是Integer或string类型，value 是任意类型，key与value之间以冒号隔开。字典中的键（key）是唯一的，而值并不唯一。


>>> items = [('name', 'Gumby'), ('age', 42)]

>>> d = dict(items)

>>> d

{'name': 'Gumby', 'age': 42}

网友评论

本文标题：小白学爬虫——第一部分：简单学习Python

本文链接：https://www.haomeiwen.com/subject/bduveqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

小白学爬虫——第一部分：简单学习Python

学习目录

定义新函数

文件读写

读文件

写文件

数组

字符串

字典

相关文章

一篇文章学习 Python 网络爬虫

小白学爬虫——第一部分：简单学习Python

从零基础开始学习Python爬虫你需要注意的点以及如何学习爬虫

从零基础开始学习Python爬虫你需要注意的点以及如何学习爬虫

Python爬虫入门(01) -- 10行代码实现一个爬虫

学渣讲爬虫之Python爬虫从入门到出门（第一讲）

没看错吧？5 行代码就能入门爬虫？

零基础学Python，这些神操作让你1个月上手做项目！

干货 | Python爬虫学习路线，小白都能学会！

各语言简单爬虫

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读