美文网首页
小白学爬虫——第一部分:简单学习Python

小白学爬虫——第一部分:简单学习Python

作者: Leena_c9a7 | 来源:发表于2019-02-15 23:15 被阅读0次

    学习目录

    定义新函数

    文件读写

    数组

    字符串

    字典

    定义新函数

    通过定义函数名和一组语句序列来定义一个新函数,然后在执行时调用这个函数。一旦定义了一个函数,程序中可以重复使用。

    def是用来定义函数的保留关键字。函数命名与变量命名的规则基本上是一样的。字母、数字以及一些符号是合法的,但是函数名的第一个字符不能是数字。不能使用保留关键字命名函数,也要避免函数名和变量名相同。

    函数名后面的空括号表明这个函数没有指定参数,若有形式参数,写入括号内用逗号隔开。函数定义的第一行叫做函数头,剩余的部分叫做函数体。

    函数头必须以冒号结束,函数体必须缩进。按照惯例,一般缩进4个空格。函数体可以包括任意数量的语句。在Python语言中,是严格缩进的,否则会报错,缩进字符会在用Python写代码时主动提示,这一点不必担心。同时,值得注意的是,在if语句,for循环的使用过程中,也要在冒号后再开始写相应代码。

    
    def hello():
    
        print('Hello World!')
    
    

    文件读写

    读文件

    要以读文件的模式打开一个文件对象,使用Python内置的open()函数,传入文件名和标示符:

    
    f = open('/Users/test.txt','r')
    
    f.read()
    
    f.close()
    
    

    标示符'r'表示读,这样,我们就成功地打开了一个文件。如果文件打开成功,接下来,调用read()方法可以一次读取文件的全部内容。最后一步是调用close()方法关闭文件。文件使用完毕后必须关闭,因为文件对象会占用操作系统的资源,并且操作系统同一时间能打开的文件数量也是有限的。

    写文件

    与读文件类似,先用open()函数打开文件,传入文件名和标识符'w',表示写。你可以调用write()来写入文件,但是务必要调用f.close()来关闭文件。

    当我们写文件时,操作系统往往不会立刻把数据写入磁盘,而是放到内存缓存起来,空闲的时候再慢慢写入。只有调用close()方法时,操作系统才保证把没有写入的数据全部写入磁盘。忘记调用close()的后果是数据可能只写了一部分到磁盘,剩下的丢失了。

    
    f = open('/Users/michael/test.txt','w')
    
    f.write('Hello, world!')
    
    f.close()
    
    

    数组

    不含任何元素的列表称为空列表,使用空的方括号([])创建一个空列表。列表内的可以是数字,字符串,或者嵌套列表。各元素用逗号隔开,字符串需要加''。

    
    [10, 20, 30, 40]
    
    ['crunchy frog', 'ram bladder', 'lark vomit']
    
    

    可以按照序号来读取数组中的指定序号元素,序号从零开始。x[a:b]表示返回集合中下标a至b(不包括b)的元素集合,x[:b]表示从开始至b(不包括b),x[a:]表示从a至结束。
    介绍一些数组的方法:

    L.append(var) #追加元素

    L.pop(var) #返回最后一个元素,并从list中删除之

    L.remove(var) #删除第一次出现的该元素

    L.count(var) #该元素在列表中出现的个数

    L.index(var) #该元素的位置,无则抛异常

    L.extend(list) #追加list,即合并list到L上

    L.sort() #排序

    L.reverse() #倒序

    字符串

    字符串是字符的序列,而列表是一系列值的序列。字符列表与字符串是不同的。

    如果想把一个字符串分成单独的单词,使用split函数:

    
    s = 'pining for the fjords'
    
    >>> t = s.split()
    
    >>> print t
    
    ['pining', 'for', 'the', 'fjords']
    
    >>> print t[2]
    
    the
    
    

    介绍一些字符串的方法:

    S.find(substring, [start [,end]]) #可指范围查找子串,返回索引值,否则返回-1

    S.lower() #转小写

    S.upper() #转大写

    字典

    dict = {‘ob1′:’computer’, ‘ob2′:’mouse’, ‘ob3′:’printer’}

    每一个元素是pair,包含key、value两部分。key是Integer或string类型,value 是任意类型,key与value之间以冒号隔开。字典中的键(key)是唯一的,而值并不唯一。

    
    >>> items = [('name', 'Gumby'), ('age', 42)]
    
    >>> d = dict(items)
    
    >>> d
    
    {'name': 'Gumby', 'age': 42}
    
    

    相关文章

      网友评论

          本文标题:小白学爬虫——第一部分:简单学习Python

          本文链接:https://www.haomeiwen.com/subject/bduveqtx.html