一、读取txt文件 → pd.read_table
read_table,读取通用分隔符分隔得文件到数据框,返回DataFrame
# 设置cell多行输出
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = 'all' #默认为'last'
# 导入相关库
import numpy as np
import pandas as pd
import os
# 设置相对路径
os.chdir(r'E:\python_learn\train')
name_1 = 'rating.txt'
data_1 = pd.read_table(name_1,sep=',',names=list('ABC'))
# names,指定数据列名,默认用第一行为列名,无列名可以自行指定
print(data_1.head())
A B C
0 1 258 5
1 2 4081 4
2 2 260 5
3 2 9296 5
4 2 2318 3
二、读取csv文件 → pd.read_csv
read_csv,读取csv文件,返回DataFrame
name_2 = 'pima_data.csv'
data_2 = pd.read_csv(name_2,names=['K1','K2','K3','K4','K5','K6','K7','K8','K9'])
print(data_2.head())
K1 K2 K3 K4 K5 K6 K7 K8 K9
0 6 148 72 35 0 33.6 0.627 50 1
1 1 85 66 29 0 26.6 0.351 31 0
2 8 183 64 0 0 23.3 0.672 32 1
3 1 89 66 23 94 28.1 0.167 21 0
4 0 137 40 35 168 43.1 2.288 33 1
三、读取excel文件 → pd.read_excel
read_excel,读取excel文件,返回DataFrame
name_3 = 'catering_dish_profit.xls'
data_3 = pd.read_excel(name_3)
print(data_3.head())
菜品ID 菜品名 盈利
0 17148 A1 9173
1 17154 A2 5729
2 109 A3 4811
3 117 A4 3594
4 17151 A5 3195
四、数据存储
(1)存储为csv文件 → to_csv
# 创建数据
df = pd.DataFrame(np.random.rand(4,5),columns=list('ABCDE'))
print(df.head())
# 将数据存储为csv文件
df.to_csv('data.csv',index=False)
# index=False,不将index索引数据存入
print('存储完成!')
A B C D E
0 0.376638 0.797135 0.469766 0.277052 0.006427
1 0.253157 0.955432 0.302558 0.018651 0.548335
2 0.554281 0.284012 0.841413 0.425416 0.815934
3 0.924922 0.608062 0.711264 0.204727 0.796173
存储完成!
(2)存储为excel文件 → to_excel
df2 = pd.DataFrame(np.random.randn(4,5),columns=list('ABCDE'))
print(df2.head())
# 将数据存储为excel文件
df2.to_excel('data_2.xls',sheet_name='data_2')
print('存储完成!')
A B C D E
0 -1.165439 -0.856440 0.506196 0.163130 -0.975927
1 0.440153 0.484132 0.878176 1.264960 -1.430835
2 0.128083 -0.106825 0.955168 -0.588886 -1.031886
3 0.086547 -1.183645 2.205348 0.341097 -2.098863
存储完成!
路径文件下分别创建了data.csv和data_2.xls文件,如下图所示:
1.png
网友评论