继续前面的练习,之前的文章参考:
- pandas实例-了解你的数据-Chipotle
- pandas实例-筛选与排序-Chipotle
- pandas实例-数据可视化-Chipotle
- pandas实例-了解你的数据-Occupation
- pandas实例-筛选与过滤-Euro 12
- pandas实例-筛选与过滤-Fictional Army
- pandas实例-聚合-Alcohol Consumption
- pandas实例-聚合-Occupation
- pandas实例-聚合-Regiment
- pandas实例-Apply-Student Alcohol Consumption
- pandas实例-Apply-Crime Rates
- pandas实例-Merge-MPG Cars
- pandas实例-Merge-Fictitious Names
- pandas实例-merge-House Market
- pandas实例-Stats-US_Baby_Names
- pandas实例-Stats-Wind Statistics
- pandas实例-Visualization-Titanic_Desaster
- pandas实例-Visualization-Scores
- pandas实例-Visualization-Online Retail
- pandas实例-Visualization-Tips
好了,这一篇开始时间序列,这个前面也有题目,这里再次开始练习下
先看看我们的数据集:
df = pd.read_csv(data_path)
这个是苹果股票的每一天的股价信息
开盘价、最高价、最低价、收盘价、成交量,那个Adj Close不太清楚是什么,调整收盘价?
1. Transform the Date column as a datetime type
这个Date
column是日期,但是字段类型却不是日期型
df.info()
这里被识别为Object
df['Date'] = pd.to_datetime(df['Date'])
这里使用了to_datetime
函数
2. Set the date as the index
重置一下index
df.set_index('Date' , inplace=True)
3. Is there any duplicate dates?
这个没用过,记录下
df.index.is_unique
4. Ops...it seems the index is from the most recent date. Make the first entry the oldest date.
好像是,还没主意,那就重新排个序
df.sort_index(ascending=True , inplace=True)
5. Get the last business day of each month
获取每个月的最后一个交易日
关于时间序列有很多的DateOffsets
,可以参考官方文档:https://pandas.pydata.org/pandas-docs/stable/user_guide/timeseries.html#dateoffset-objects
关于resample 函数,可以参考:
-
pandas-时间序列重构-resample
这里只说获取最后1个交易日,但是没有说要对这个数据怎么处理
df.resample('BM').mean()
6. What is the difference in days between the first day and the oldest
df.index.max()-df.index.min()
7. How many months in the data we have?
df.resample('BM').count().shape
8. Plot the 'Adj Close' value. Set the size of the figure to 13.5 x 9 inches
ax = df['Adj Close'].plot.line()
ax.set(title='apple')
fig = ax.get_figure()
fig.set_size_inches(13.5, 9)
小结一下,这个题目有些地方的确不清楚,主要还是函数的熟练使用
网友评论