数据分析案例（USDA食品数据）

作者: GHope | 来源:发表于2018-11-19 11:05 被阅读81次

数据分析案例（USDA食品数据）
数据分析案例--USDA食品数据库
USDA食品数据库分析
数据分析实例 USDA 数据
利用Python进行数据分析第二版复现（十三）_4
spark第二天作业
萨恩斯：硕士案例研究中的数据分析方法
200个数据分析方法、模型和案例
案例解析：海底捞、银行、商务酒店、香水单品市场、运营和销售数据挖
第四阶段爬虫整理

美国农业部（USDA）制作了一份有关食物营养信息的数据库。

{  "id": 21441,
  "description": "KENTUCKY FRIED CHICKEN, Fried Chicken, EXTRA CRISPY, Wing, meat and skin with breading", 
 "tags": ["KFC"],  
"manufacturer": "Kentucky Fried Chicken",
 "group": "Fast Foods", 
 "portions": [{"amount": 1,     
                "unit": "wing, with skin",
                 "grams": 68.0   
    ... 
 }, ], 
 "nutrients": [ { "value":20.8,    
                   "units": "g",
                  "description": "Protein",
                   "group": "Composition"    },
    ... 
 ] }

每种食物都带有若干标识性属性以及两个有关营养成分和分量的列表

import json

db = json.load(open('datasets/usda_food/database.json'))

数据加载

b中的每个条目都是一个含有某种食物全部数据的字典。nutrients字段是一个字典列表，其中的每个字典对应一种营养成分

nutrients = pd.DataFrame(db[0]['nutrients'])

info_keys = ['description', 'group', 'id', 'manufacturer']

info = pd.DataFrame(db, columns=info_keys)

数据规整

通过value_counts，你可以查看食物类别的分布情况

pd.value_counts(info.group)[:10]

食物类别的分布情况

首先，将各食物的营养成分列表转换为一个DataFrame，并添加一个表示编号的列，然后将该DataFrame添加到一个列表中。后通过concat将这些东西连接起来就可以了。由于两个DataFrame对象中都有”group”和”description”, 需要对它们进行重命名。

col_mapping = {'description' : 'food','group' : 'fgroup'}

info = info.rename(columns=col_mapping, copy=False)

nutrients = []

for rec in db:
   fnuts = pd.DataFrame(rec['nutrients']) 
   fnuts['id'] = rec['id'] 
   nutrients.append(fnuts) 

nutrients = pd.concat(nutrients,ignore_index = True)

col_mapping = {'description' : 'nutrient','group' : 'nutgroup'}

nutrients = nutrients.rename(columns=col_mapping, copy=False)

简单数据清洗

将info跟nutrients合并起来

ndata = pd.merge(nutrients, info, on='id', how='outer')

合并info和nutrients

根据食物分类和营养类型画出一张中位值图

result = ndata.groupby(['nutrient', 'fgroup'])['value'].quantile(0.5)

result['Zinc, Zn'].sort_values().plot(kind='barh')

食物分类和营养类型的中位值图

网友评论

冷冬年:读读文，点点赞，今日阳光又灿烂！🌺🌺🌺
GHope:

web服务器

本文标题：数据分析案例（USDA食品数据）

本文链接：https://www.haomeiwen.com/subject/uxpefqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

数据分析案例（USDA食品数据）

相关文章