美文网首页
pandans_数据查看

pandans_数据查看

作者: 敬子v | 来源:发表于2023-01-15 10:38 被阅读0次

    数据源:链接: https://pan.baidu.com/s/1EFqJFXf70t2Rubkh6D19aw 提取码: syqg

    数据源示例:

    步骤1 导入必要的库

    import pandas as pd

    步骤2 从如下地址导入数据集

    path1='pandas_exercise\exercise_data\chipotle.tsv'

    步骤3 将数据集存入一个名为chipo的数据框内

    chipo=pd.read_csv(path1,sep='\t')

    步骤4 查看前10行内容

    print(chipo.head())

    步骤6 数据集中有多少个列(columns)

    print(chipo.shape[1])

    步骤7 打印出全部的列名称

    print(chipo.columns)

    步骤8 数据集的索引是怎样的

    print(chipo.index)

    步骤9 被下单数最多商品(item)是什么?

    c=chipo[['item_name','quantity']].groupby(['item_name']).agg({'quantity':'sum'})
    c.sort_values(['quantity'],ascending=False,inplace=True)
    print(c.head())

    步骤10 在item_name这一列中,一共有多少种商品被下单? nunique()去重计数

    print(chipo['item_name'].nunique())

    步骤11 在choice_description中,下单次数最多的商品是什么?

    b=chipo['choice_description'].value_counts().head()
    print(b)

    步骤12 一共有多少商品被下单?

    print(chipo['quantity'].sum())

    步骤13 将item_price转换为浮点数

    print(chipo['item_price'].head())
    fd=lambda x:float(x[1:-1])
    chipo['item_price']=chipo['item_price'].apply(fd)
    print(chipo['item_price'].head())

    步骤14 在该数据集对应的时期内,收入(revenue)是多少

    chipo['total_sum']=round(chipo['quantity']*chipo['item_price'],2)
    a=chipo['total_sum'].sum()
    print(a)

    步骤15 在该数据集对应的时期内,一共有多少订单?

    e=chipo['order_id'].nunique()
    print(e)

    步骤16 每一单(order)对应的平均总价是多少?

    print(a/e)
    or
    f=chipo[['total_sum','order_id']].groupby('order_id').agg({'total_sum':'sum'})['total_sum'].mean()
    print(f)

    步骤17 一共有多少种不同的商品被售出?

    print(chipo['item_name'].nunique())

    输出

    #步骤4
       order_id  ...  item_price
    0         1  ...      $2.39 
    1         1  ...      $3.39 
    2         1  ...      $3.39 
    3         1  ...      $2.39 
    4         2  ...     $16.98 
    [5 rows x 5 columns]
    #步骤6
    5
    #步骤7
    Index(['order_id', 'quantity', 'item_name', 'choice_description',
           'item_price'],
          dtype='object')
    #步骤8
    RangeIndex(start=0, stop=4622, step=1)
    #步骤9
                         quantity
    item_name                    
    Chicken Bowl              761
    Chicken Burrito           591
    Chips and Guacamole       506
    Steak Burrito             386
    Canned Soft Drink         351
    #步骤10
    50
    #步骤11
    [Diet Coke]                                                                          134
    [Coke]                                                                               123
    [Sprite]                                                                              77
    [Fresh Tomato Salsa, [Rice, Black Beans, Cheese, Sour Cream, Lettuce]]                42
    [Fresh Tomato Salsa, [Rice, Black Beans, Cheese, Sour Cream, Guacamole, Lettuce]]     40
    Name: choice_description, dtype: int64
    #步骤12
    4972
    #步骤13
    0     $2.39 
    1     $3.39 
    2     $3.39 
    3     $2.39 
    4    $16.98 
    Name: item_price, dtype: object
    0     2.39
    1     3.39
    2     3.39
    3     2.39
    4    16.98
    Name: item_price, dtype: float64
    #步骤14
    39237.02
    #步骤15
    1834
    #步骤16
    21.39423118865867
    #步骤17
    50
    

    相关文章

      网友评论

          本文标题:pandans_数据查看

          本文链接:https://www.haomeiwen.com/subject/dhqacdtx.html