美文网首页
数据获取_文本数据获取和存储

数据获取_文本数据获取和存储

作者: 南有妖尾 | 来源:发表于2020-04-08 14:40 被阅读0次

一、读取txt文件 → pd.read_table

read_table,读取通用分隔符分隔得文件到数据框,返回DataFrame

# 设置cell多行输出

from IPython.core.interactiveshell import InteractiveShell 
InteractiveShell.ast_node_interactivity = 'all' #默认为'last'

# 导入相关库
import numpy as np
import pandas as pd
import os

# 设置相对路径
os.chdir(r'E:\python_learn\train')
name_1 = 'rating.txt'
data_1 = pd.read_table(name_1,sep=',',names=list('ABC'))
# names,指定数据列名,默认用第一行为列名,无列名可以自行指定
print(data_1.head())
   A     B  C
0  1   258  5
1  2  4081  4
2  2   260  5
3  2  9296  5
4  2  2318  3

二、读取csv文件 → pd.read_csv

read_csv,读取csv文件,返回DataFrame

name_2 = 'pima_data.csv'
data_2 = pd.read_csv(name_2,names=['K1','K2','K3','K4','K5','K6','K7','K8','K9'])
print(data_2.head())
   K1   K2  K3  K4   K5    K6     K7  K8  K9
0   6  148  72  35    0  33.6  0.627  50   1
1   1   85  66  29    0  26.6  0.351  31   0
2   8  183  64   0    0  23.3  0.672  32   1
3   1   89  66  23   94  28.1  0.167  21   0
4   0  137  40  35  168  43.1  2.288  33   1

三、读取excel文件 → pd.read_excel

read_excel,读取excel文件,返回DataFrame

name_3 = 'catering_dish_profit.xls'
data_3 = pd.read_excel(name_3)
print(data_3.head())
    菜品ID 菜品名    盈利
0  17148  A1  9173
1  17154  A2  5729
2    109  A3  4811
3    117  A4  3594
4  17151  A5  3195

四、数据存储

(1)存储为csv文件 → to_csv

# 创建数据
df = pd.DataFrame(np.random.rand(4,5),columns=list('ABCDE'))
print(df.head())

# 将数据存储为csv文件
df.to_csv('data.csv',index=False)
# index=False,不将index索引数据存入
print('存储完成!')
          A         B         C         D         E
0  0.376638  0.797135  0.469766  0.277052  0.006427
1  0.253157  0.955432  0.302558  0.018651  0.548335
2  0.554281  0.284012  0.841413  0.425416  0.815934
3  0.924922  0.608062  0.711264  0.204727  0.796173
存储完成!

(2)存储为excel文件 → to_excel

df2 = pd.DataFrame(np.random.randn(4,5),columns=list('ABCDE'))
print(df2.head())

# 将数据存储为excel文件
df2.to_excel('data_2.xls',sheet_name='data_2')
print('存储完成!')
          A         B         C         D         E
0 -1.165439 -0.856440  0.506196  0.163130 -0.975927
1  0.440153  0.484132  0.878176  1.264960 -1.430835
2  0.128083 -0.106825  0.955168 -0.588886 -1.031886
3  0.086547 -1.183645  2.205348  0.341097 -2.098863
存储完成!

路径文件下分别创建了data.csv和data_2.xls文件,如下图所示:

1.png

相关文章

网友评论

      本文标题:数据获取_文本数据获取和存储

      本文链接:https://www.haomeiwen.com/subject/ocjtmhtx.html