How do i read a tabular data file into pandas ?
怎么用pandas读取表格一样的文件?
import pandas as pd
orders = pd.read_table('https://bit.ly/chiporders') # 从网络上读取数据
# 使用read_table的意思就是他的分隔符sep是tab键,当然也可以进行更改pd.read_table('https://bit.ly/chiporders', sep='|')
# 这个传过来的数据分割符就是‘|’
movies = pd.read_table('https://bit.ly/movieusers')
# head函数是显示数据前几行,默认是5行,如果想显示指定行,比如显示3行 head()
movies.head()
# 所以显示的时候不能拆分列,要使用sep参数
movieusers = pd.read_table('https://bit.ly/movieusers', sep='|')
movieusers.head()
# 这个列的名字有错误,我们可以在读取的时候就把它去掉
movieusers = pd.read_table('https://bit.ly/movieusers', sep='|', header=None)
movieusers.head()
# 同时我们在导入的时候可以把它的列名给换了
user_cols = ['user_id', 'age', 'gender', 'occupation', 'zip_code']
pd.read_table('https://bit.ly/movieusers', sep='|', header=None, names=user_cols)
网友评论