美文网首页
数据获取_文本数据获取和存储

数据获取_文本数据获取和存储

作者: 南有妖尾 | 来源:发表于2020-04-08 14:40 被阅读0次

    一、读取txt文件 → pd.read_table

    read_table,读取通用分隔符分隔得文件到数据框,返回DataFrame

    # 设置cell多行输出
    
    from IPython.core.interactiveshell import InteractiveShell 
    InteractiveShell.ast_node_interactivity = 'all' #默认为'last'
    
    # 导入相关库
    import numpy as np
    import pandas as pd
    import os
    
    # 设置相对路径
    os.chdir(r'E:\python_learn\train')
    
    name_1 = 'rating.txt'
    data_1 = pd.read_table(name_1,sep=',',names=list('ABC'))
    # names,指定数据列名,默认用第一行为列名,无列名可以自行指定
    print(data_1.head())
    
       A     B  C
    0  1   258  5
    1  2  4081  4
    2  2   260  5
    3  2  9296  5
    4  2  2318  3
    

    二、读取csv文件 → pd.read_csv

    read_csv,读取csv文件,返回DataFrame

    name_2 = 'pima_data.csv'
    data_2 = pd.read_csv(name_2,names=['K1','K2','K3','K4','K5','K6','K7','K8','K9'])
    print(data_2.head())
    
       K1   K2  K3  K4   K5    K6     K7  K8  K9
    0   6  148  72  35    0  33.6  0.627  50   1
    1   1   85  66  29    0  26.6  0.351  31   0
    2   8  183  64   0    0  23.3  0.672  32   1
    3   1   89  66  23   94  28.1  0.167  21   0
    4   0  137  40  35  168  43.1  2.288  33   1
    

    三、读取excel文件 → pd.read_excel

    read_excel,读取excel文件,返回DataFrame

    name_3 = 'catering_dish_profit.xls'
    data_3 = pd.read_excel(name_3)
    print(data_3.head())
    
        菜品ID 菜品名    盈利
    0  17148  A1  9173
    1  17154  A2  5729
    2    109  A3  4811
    3    117  A4  3594
    4  17151  A5  3195
    

    四、数据存储

    (1)存储为csv文件 → to_csv

    # 创建数据
    df = pd.DataFrame(np.random.rand(4,5),columns=list('ABCDE'))
    print(df.head())
    
    # 将数据存储为csv文件
    df.to_csv('data.csv',index=False)
    # index=False,不将index索引数据存入
    print('存储完成!')
    
              A         B         C         D         E
    0  0.376638  0.797135  0.469766  0.277052  0.006427
    1  0.253157  0.955432  0.302558  0.018651  0.548335
    2  0.554281  0.284012  0.841413  0.425416  0.815934
    3  0.924922  0.608062  0.711264  0.204727  0.796173
    存储完成!
    

    (2)存储为excel文件 → to_excel

    df2 = pd.DataFrame(np.random.randn(4,5),columns=list('ABCDE'))
    print(df2.head())
    
    # 将数据存储为excel文件
    df2.to_excel('data_2.xls',sheet_name='data_2')
    print('存储完成!')
    
              A         B         C         D         E
    0 -1.165439 -0.856440  0.506196  0.163130 -0.975927
    1  0.440153  0.484132  0.878176  1.264960 -1.430835
    2  0.128083 -0.106825  0.955168 -0.588886 -1.031886
    3  0.086547 -1.183645  2.205348  0.341097 -2.098863
    存储完成!
    

    路径文件下分别创建了data.csv和data_2.xls文件,如下图所示:

    1.png

    相关文章

      网友评论

          本文标题:数据获取_文本数据获取和存储

          本文链接:https://www.haomeiwen.com/subject/ocjtmhtx.html