美文网首页机器学习成长记
[原创]机器学习从Python开始(二)——Python概述

[原创]机器学习从Python开始(二)——Python概述

作者: 机器学习成长记 | 来源:发表于2018-02-01 09:45 被阅读0次

    A.2 Python概述

    让我们重温一下前面提到的Python语言的一些特性。这里不会对Python进行详细的描述,如果想全面了解Python,建议阅读Elkner, Downey和Meyers的《How to Think Like a Computer Scientist》。可以在http://openbookproject.net//thinkCSpy/找到这本书的免费版本。我们将重温在任一种编程语言中都会用到的集合类型与控制结构,来看看在Python中是如何使用的。最后,我们重新讨论一下List的生成,我认为这是Python入门中最让人困惑的部分。

    A.2.1 集合类型

    Python有很多存储item集合的方式,还可以通过添加modules的方式创建更多的容器类型。下面介绍一些Python中常用的容器:

    1.     Lists

    Lists是Python中objects的有序集合,可以存放任何类型:numbers, bool, strings等。创建list时要使用括号。下面代码可以创建名为jj的Lists,并为其添加integer和string实例各一个。

    >>> jj=[]

    >>> jj.append(1)

    >>> jj.append('nice hat')

    >>> jj

    [1, 'nice hat']

    也可以把elements直接存入Lists。实现代码如下:

    >>> jj = [1, 'nice hat']

    同其他编程语言一样,Python也有array数据类型,不过,array只能存一种数据。执行循环时,array比Lists速度快。本书我们不会使用这种类型,因为它容易与NumPy中的array混淆。

    2. Dictionaries

    字典(Dictionaries)是存放无序的关键字/值的容器,关键字类型可以是string或number。在其他编程语言中,Dictionaries被称为关联数组(associative array)或映射(map)。下面我们创建一个字典,再给它添加两个item:

    >>> jj={}

    >>> jj['dog']='dalmatian'

    >>> jj[1]=42

    >>> jj

    {1: 42, 'dog': 'dalmatian'}

    也可以直接用一行代码上面的功能:

    >>> jj = {1: 42, 'dog':'dalmatian'}

    3.  Sets

    这就像数学中的集合,也许你对它不熟悉,它是items唯一的容器。可以通过list创建一个set实例,代码如下:

    >>> a=[1, 2, 2, 2, 4, 5, 5]

    >>> sA=set(a)

    >>> sA

    set([1, 2, 4, 5])

    Sets可以做联合(union)、交集(intersection)、求差(difference)等数学运算。联合运算通过管道符号(|)实现,交集运算可通过&符号实现。举例如下:

    >>> sB=set([4, 5, 6, 7])

    >>> sB

    set([4, 5, 6, 7])

    >>> sA-sB

    set([1, 2])

    >>> sA | sB

    set([1, 2, 4, 5, 6, 7])

    >>> sA & sB

    set([4, 5])

    A.2.2 控制结构

    Python使用时,语句有缩进要求。很多人因此不满,但缩进可以持代码整洁、易读。在for循环、while循环、if 语句中,通过缩进,机器可以知道哪些语句属于循环语句。缩进有tabs和空格两种方式。在其他编程语言中,你会用大括号 { }或关键字.。通过用缩进代替大括号,Python节省了很多空间。我们来看看下面这些常用的控制语句:

    1. If

    If语句是非常易懂的,你可以在一行中实现:

    >>> if jj < 3: print "it'sless than three man"

    如果有多行,你可以使用缩进来告诉解释器你有多行。你也可以选择用缩进把它们放在一行。

    >>> if jj < 3:

    ... print "it's less than threeman"

    ... jj = jj + 1

    多个判断条件,如else if被写作elif,关键字else用做默认判断条件。

    >>> if jj < 3: jj+=1

    ... elif jj==3: jj+=0

    ... else: jj = 0

    2. For

    Python中的for循环可以看做java和c++中的加强版。如果你不太熟悉,可以把它简单的理解为for循环会遍历集合中的每个item。下面我们看一些lists,sets和 dictionaries的例子:

    >>> sB=set([4, 5, 6, 7])

    >>> for item in sB:

    ... print item

    ...

    4

    5

    6

    7

    现在,我们看看如何便利一个字典:

    >>> jj={'dog': 'dalmatian', 1: 45}

    >>> for item in jj:

    ... print item, jj[item]

    ...

    1 45

    dog dalmatian

    从上面可以看出,用于迭代的item其实是字典的关键字。

    A.2.3. List comprehensions

    对于Python新手来说,List comprehensions是最困惑的。List comprehensions是生成list的简便方式,它不需要写很多代码,但其工作方式方式有一些不同。下面举例说明一下。

    >>> a=[1, 2, 2, 2, 4, 5, 5]

    >>> myList = [item*4 for item in a]

    >>> myList

    [4, 8, 8, 8, 16, 20, 20]

    List comprehension常常被一对括号括住。上面的代码等价于:

    >>> myList=[]

    >>> for item in a:

    ... myList.append(item*4)

    ...

    >>> myList

    [4, 8, 8, 8, 16, 20, 20]

    生成同样的mylist,List comprehension使用的语句要简洁的多,不过它让大家困惑的地方是循环内部的执行语句,它的位置在for语句的前面。这与英语的阅读顺序(从左往右)正好相反。接下来看看更高级的功能,只对上面数组中大于2的数字进行运算:

    >>> [item*4 for item in a if item>2]

    [16, 20, 20]

    通过List comprehension可以实现很多功能,可是如果代码的可读性变差,就需要单独写这部分。

    我们已经了解了Python的一些基本原则,下面介绍本书使用的Python模块的安装。安装独立的Python模块(没有绑定其他语言)时,可以切换到压缩包解压后的系统路径下,输入安装命令:

    > python setup.py install

    这是安装Python模块的默认命令。当不确定如何安装Python模块时,可以尝试一下这个命令。这些模块的安装目录为Libs/site-packages/。因此,你不用担心找不到这些模块的安装路径,同时,可以放心地清空下载文件夹。

    部分译自《Machine Learning in Action》

    版权声明:本文为原创文章,未经允许不得转载。

    相关文章

      网友评论

        本文标题:[原创]机器学习从Python开始(二)——Python概述

        本文链接:https://www.haomeiwen.com/subject/ocirzxtx.html