美文网首页
python 数据处理

python 数据处理

作者: 似水之星 | 来源:发表于2018-03-15 20:10 被阅读0次
import pandas as pd
import numpy as np
import statsmodels.api as sm #统计运算
import scipy.stats as scs #科学计算
import matplotlib.pyplot as plt #绘图
import csv

#导入csv数据,daype设置数据列的数据类型
daily_quote = pd.read_csv('factor/daily_quote2.csv', dtype={'symbol':str,'tickerid':str})

#输出数据的头五行和后10行
print daily_quote.head()
print daily_quote.tail(n=10)

#得到数据的index(行名)和columns(列名)
print daily_quote.columns
print daily_quote.index

#通过索引得到需要的行和列,得到数据的描述
print daily_quote.loc[1:70,['tickerid','symbol']]
print daily_quote.describe()

#得到股票的tickerid,tradetime,close
print daily_quote.loc[:,['tickerid','tradetime','close']]
daily_quote_close = daily_quote.loc[:,['tickerid','tradetime','close']]

#重设数据索引(index),得到多层索引的数据
daily_quote_close_ticker = daily_quote_close.set_index(["tickerid", "tradetime"])

#多重索引Series转换为DataFrame,第二层索引为列。空数据用0替换。行转列
daily_quote_tradedate =daily_quote_close_ticker.unstack().fillna(0)
print daily_quote_tradedate.head()

email:526270285@qq.com

相关文章

网友评论

      本文标题:python 数据处理

      本文链接:https://www.haomeiwen.com/subject/yoghqftx.html