美文网首页
Code笔记

Code笔记

作者: Helen焕焕 | 来源:发表于2019-06-23 22:38 被阅读0次

    1. 数据导入

    利用pandas读取数据:
    import pandas as pd

    csv:data=pd.read_csv('路径')
    excel:data=pd.read_excel('路径')
    excel第几个sheet: data=pd.read_excel('路径', sheet_name='sheet名字')
    jason:data=pd.read_jason('路径')
    html: data=pd.read_html('网址')

    读取SQL:

    import pymysql
    import sqlalchemy
    from sqlalchemy import create_engine

    读取MongoDB:

    import json
    from pymongo import MongoClient

    2. 数据探索

    - data.head() #前五行数据
    - data.sample() #随机抽样五条数据
    - data.info()  #数据集的信息
    - data.describe() #数据型数据的描述统计
    - data.shape #数据集的维度
    -type(data['column']) #数据类型

    3. code

    unique:查看唯一值:文件名['column'].unique()
    替换:data[‘column'].str.replace('替代前的值', '替代后的值')
    去掉间隔符:data[‘column'].str.split('-', expand=True )
    分类:data.groupby()
    排序:data.sort_values(ascending=False)
    数数:data['column'].value_counts()
    查看空值数量:data.isnull().sum()
    丢弃值:data.dropna()

    相关文章

      网友评论

          本文标题:Code笔记

          本文链接:https://www.haomeiwen.com/subject/qltgqctx.html