美文网首页
pandas学习笔记

pandas学习笔记

作者: Aries_Li | 来源:发表于2018-09-26 14:53 被阅读18次

最近在学python,正好看到一个讲解pandas的系列视频,正好做一下笔记,笔记会参考视频,同时也会参考pandas官方文档。

什么是pandas

pandas is an open source, BSD-licensed library providing high-performance, easy-to-use data structures and data analysis tools for the Python programming language.

完整的文档可以查看pandas的Cookbook

视频地址:
bilibili-使用 pandas 进行数据分析:Data analysis in Python with pandas

环境安装

  • 安装python环境
  • 安装pandas
    python 环境的安装,可以看之前的文章,在centos7上安装python。

pandas安装:
1.Mac上使用brew brew cask install anaconda
2.python -m pip install pandas https://pypi.douban.com/simple/
推荐使用第一种,anaconda的方式安装,比较方便
使用第二种的话,需要下载额外的一些包,需要根据实际情况进行下载,例如matplotlib;

视频使用的资源

[百度网盘]](https://pan.baidu.com/s/1UVT_S9BHJZS8ktjAc8Xpcw) 密码:dr78 (来自bilibili用户)
视频中的网络资源无法使用,可以使用上面百度网盘中的资源,或者使用我提供的地址

目录

1.读取表格数据到pandas中(源码见demo1.py)

#!/usr/bin/env python
# encoding: utf-8

import pandas as pd

''' 因为视频中的地址不可用,可以用网盘中的文件,或者用我提供的文件地址'''

orders = pd.read_table('https://blog.searchinfogo.com/download/data/data/chipotle.tsv')

print(orders)

head = orders.head()
print(head)

user_cols = ['user_id', 'age', 'gender', 'occupation', 'zip_code']
users = pd.read_table("https://blog.searchinfogo.com/download/data/data/u.user", sep='|', header=None, names=user_cols)
print(users)

2.从csv中读取数据(源码见demo2.py)

#!/usr/bin/env python
# encoding: utf-8

import pandas as pd

ufo = pd.read_csv('https://blog.searchinfogo.com/download/data/data/ufo.csv')

type = type(ufo)

print(type)

ufo.head()

type(ufo['City'])

print(ufo['City'])

ufo.shape

ufo.City + ufo.State

ufo['Location'] = ufo.City + ',' + ufo.State

print(ufo['Location'])

总结:
上面的代码涉及视频p1-p3,讲解了pandas如何读取数据,从table、csv中读取数据,并在pandas中组合出一些数据,这些过程涉及
生产数据、获取数据、准备数据几个过程,在实际的使用过程中,用户的操作,或者是其他过程会产生大量的数据,然后获取数据读取到
pandas中,并对数据进行清洗,取出掉无效或者错误的数据,之后最数据进行更深入的分析。

相关文章

  • 大师兄的Python机器学习笔记:Pandas库

    大师兄的Python机器学习笔记:实现评估模型 一、关于Pandas 1. Pandas和Numpy Pandas...

  • pandas索引取数

    注:《利用python进行数据分析》的学习笔记-pandas import pandas as pd import...

  • pandas-基础笔记

    Pandas学习笔记-基础篇 参考资料 https://www.yiibai.com/pandas/ 导入模块 S...

  • 学习笔记----机器学习(三)

    我是iOS开发者之一。我们的App:今日好出行 申明一下,只是学习笔记,只是学习笔记,只是学习笔记。 Pandas...

  • pandas学习笔记

    pandas学习笔记 1.安装 2.学习代码-Series code 1 0 1001 py...

  • pandas学习笔记

    Pandas库的介绍 Pandas是一个开放源码的Python库,它使用强大的数据结构提供高性能的数据操作和分析工...

  • pandas学习笔记

    pandas 读取 csv 文件 查看pandas的列名以及列数 pandas 查看某一列的全部数据或部分数据 查...

  • pandas学习笔记

    筛选数据 读取文件 import pandas as pdpd.read_csv("Lung.txt",heade...

  • pandas 学习笔记

    pd.Series 简介: Series 是一个定长的有序字典 简单创建: Series 中可以包含多种基本数据类...

  • pandas学习笔记

    最近在学python,正好看到一个讲解pandas的系列视频,正好做一下笔记,笔记会参考视频,同时也会参考pand...

网友评论

      本文标题:pandas学习笔记

      本文链接:https://www.haomeiwen.com/subject/ccodoftx.html