美文网首页呆鸟的Python数据分析
《利用Python进行数据分析》读书笔记(一)Python Ba

《利用Python进行数据分析》读书笔记(一)Python Ba

作者: 陌上疏影凉 | 来源:发表于2018-09-02 07:42 被阅读14次

    这一系列博客是看《Python for Data Analysis》的读书笔记,只截取了大部分自己认为重要的知识点,不少例子也是来自于书中。本机安装的是python 3.6版本,并使用anaconda安装了jupyter notebook和一些常用模块。

    Python Interpreter

    在终端命令行输入python指令后调出python交互界面,使用exit()或者Ctrl+D退出python交互界面。在命令行通过python 文件名.py的方式执行python脚本。

    $ python hello_world.py
    Hello world
    

    IPython Basic

    1. 在命令行输入ipython命令调出ipython交互界面。ipython界面与python界面的区别自己尝试过就能感觉到。

    2. 在命令行输入jupyter notebook命令调出jupyter notebook,当然前提是已经安装了jupyter notebook,jupyter notebook可以很好地将文字与代码合并在一起,是一个很好的工具。

    3. Tab用来在写代码的时候提供提示,起到了代码补全的作用。

      In [1]: an_apple = 27
      
      In [2]: an_example = 42
      
      In [3]: an<Tab>
      an_apple and an_example any
      

      这里定义了两个an开头的变量,引用变量时输入an后按下tab键会提示出两个可能的选项,如果没有多个选项那么按下tab可以直接补全变量名。能提示的不仅是变量名,还有可能的函数,函数的参数等等,与在开发环境中写代码时软件自带的代码提示功能类似。

    4. 用来显示某个函数或变量的详细信息,相当于文档的功能。

      In [1]: a=[1,2,3]
      
      In [2]: a?
      Type:        list
      String form: [1, 2, 3]
      Length:      3
      Docstring:  
      list() -> new empty list
      list(iterable) -> new list initialized from iterable's items
      
      In [10]: print?
      Docstring:
      print(value, ..., sep=' ', end='\n', file=sys.stdout, flush=False)
      Prints the values to a stream, or to sys.stdout by default.
      Optional keyword arguments:
      file: a file-like object (stream); defaults to the current sys.stdout. sep: stringinsertedbetweenvalues,defaultaspace.
      end: stringappendedafterthelastvalue,defaultanewline.
      flush: whether to forcibly flush the stream.
      Type: builtin_function_or_method
      

      a?会显示出列表的种类、长度等所有详细属性,print?则会显示出函数的一些用法和说明。

    5. ??用来显示自定义函数的源码,用法:函数名??

    Python Language Basic

    1. Python相对于C语言或者java语言来说,一个特点就是使用空格取代括号,例如for循环和if语句写法如下:

      for x in array: 
           if x < pivot:
                less.append(x) 
           else:
               greater.append(x)
      
    1. python在每行语句结束时不需要分号结尾

    2. python中的数字、字符串、数据结构、函数、类都是一个python object,有其内部的type和属性。

    3. 使用# 注释内容进行注释。

    4. 在python中,对一个变量赋值即创造了一个引用指向等号右边的元素。例如:

      In [3]: a
      Out[3]: [1, 2, 3]
      
      In [4]: b=a
      
      In [5]: a.append(4)
      
      In [6]: b
      Out[6]: [1, 2, 3, 4]
      

      将a赋值给b时,此时a和b都是指向列表的引用,a和b任意一方对列表进行修改后,另一方的值也会被修改,因为两者的指向是相同的。

    a、b都是指向list的一个引用
    1. 对于大多数语言来说,'5'+5的结果可能是10(将'5'转换成int类型的5),也可能是55(将5转换成str类型的'5'),原因是这些语言支持对不同类型变量操作时的自动转换类型。上述情况在python中会直接报错,因为操作的两者数据类型不同。但是在一些很明显的情况下,也是可以执行的,比如4.5/2,一个是float,一个是int,但是得出的结果仍然是float类型的2.25。

    2. isinstance(变量,数据类型)方法可以判断变量是否是某个类型,返回值为TrueFalse。其中数据类型的位置可以为一个元组,意思是判断某个变量是否为多个数据类型中的某个类型。

      In[21]:a=5
      In [22]: isinstance(a, int)
      Out[22]: True
          
      In[23]:a=5;b=4.5
      In [24]: isinstance(a, (int, float))
      Out[24]: True
      In [25]: isinstance(b, (int, float))
      Out[25]: True
      
    3. 对于一个python object,它有很多属性与方法,getattr()方法可以获取这些方法与属性的反射。例如:字符串a有一个split方法,要获取这个方法本身,可以使用如下代码:

       In [27]: getattr(a, 'split')
       Out[27]: <function str.split>
      
    4. 使用import 模块的方式导入模块,这个不说了。

    5. 运算符操作,即‘+’、‘-’、‘*’、‘/’等等运算符的操作。

    6. is is not ,用法为a is/is not b,用于判断a、b两者的引用是否指向相同元素,常用于判断变量是否为空,需要注意与==的区别,后者是判断两者的内容是否相同。

    7. 大部分Python Object是可变的,也就是说它们的值可以在定义后被修改。

    8. python中,int类型可以存任意位数的整数,float类型默认是64位的浮点数。

    9. 如果想实现c风格整型除法的效果,可以使用 //符号。例如:

      In[52]:3/2 
      Out[52]: 1.5
      
      In[53]:3//2 
      Out[53]: 1
      
    10. 使用单引号双引号表示字符串,多行字符串使用三个双引号。

      a = 'one way of writing a string'
      b = "another way"
      c="""
      This is a longer string that 
      spans multiple lines
      """
      

      Python字符串是不可修改的,字符串定义后就不能使用赋值语句再对其内部字符重新修改。但是可以通过函数修改。

      In [56]: a = 'this is a string'
      In [57]: a[10] = 'f' 
      ----------------------------------------------TypeError Traceback (most recent call last) <ipython-input-57-5ca625d1e504> in <module>()
      ----> 1 a[10] = 'f'
      TypeError: 'str' object does not support item assignment
          
      In [58]: b = a.replace('string', 'longer string')
      In [59]: b
      Out[59]: 'this is a longer string'
      
    11. 使用str(value)函数可以将value转成字符串(str)类型。

    12. 在定义字符串的时候,如果不想使用转义字符,那么可以在字符串之前加上r(由raw单词而来)。例如:

      In [69]: s = r'this\has\no\special\characters'
      
      In [70]: s
      Out[70]: 'this\\has\\no\\special\\characters'
      

      如果想表明定义的字符串是byte类型,那么可以在字符串之前加上b(由单词byte而来)。例如:

      In [85]: bytes_val = b'this is bytes'
      In [86]: bytes_val
      Out[86]: b'this is bytes'
      
    13. 字符串的格式化format(),用法为模板.format(参数...)。例如:

      In [74]: template = '{0:.2f} {1:s} are worth US${2:d}'
      In [75]: template.format(4.5560, 'Argentine Pesos', 1)
      Out[75]: '4.56 Argentine Pesos are worth US$1'
      

      模板中的3个{}内容意思如下:

      • {0:.2f}表示将第一个参数格式化为两位小数的浮点数。
      • {1:s}表示将第二个参数格式化为一个字符串。
      • {2:d}表示将第三个参数格式化为一个整数。

      format的参数分别对应模板中的三个参数。

    14. 格式转换函数,float(value)value转成float类型; int(value)value转成int类型,其他类似的函数如byte()bool()同理。

    15 . 复合条件语句。使用一个简短的语句来代表一个判断的逻辑操作。复合条件语句的格式如下:

    value = true-expr if condition else false-expr

    翻译成常规语句就是:

    if condition:
         value = true-expr
    else:
         value = false-expr
    

    举个例子:

    In[126]:x=5
    In [127]: 'Non-negative' if x >= 0 else 'Negative' 
    Out[127]: 'Non-negative'
    

    翻译过来就是:

    if x >= 0:
        print('Non-negative')
    else:
        print('Negative')
    

    补充材料

    1. 《利用Python进行数据分析》(http://vdisk.weibo.com/s/CRSj_HCw6WR6
    2. https://www.jianshu.com/c/52882df3377a?order_by=top

    相关文章

      网友评论

        本文标题:《利用Python进行数据分析》读书笔记(一)Python Ba

        本文链接:https://www.haomeiwen.com/subject/ubvpwftx.html