美文网首页
一些Pandas的Trick

一些Pandas的Trick

作者: 弦好想断 | 来源:发表于2020-10-18 14:38 被阅读0次
def generate_sample_data(): # creates a fake df for testing
    number_or_rows = 20
    num_cols = 7
    cols = list("ABCDEFG")
    df = pd.DataFrame(np.random.randint(1, 20, size = (number_or_rows, num_cols)), columns=cols)
    df.index = pd.util.testing.makeIntIndex(number_or_rows)
    return df

# check Trick 91 for an example
def generate_sample_data_datetime(): # creates a fake df for testing
    number_or_rows = 365*24
    num_cols = 2
    cols = ["sales", "customers"]
    df = pd.DataFrame(np.random.randint(1, 20, size = (number_or_rows, num_cols)), columns=cols)
    df.index = pd.util.testing.makeDateIndex(number_or_rows, freq="H")
    return df

日期时间类型接口一览表(衍生特征可以糊好多)

df = generate_sample_data_datetime().reset_index()
df = df.sample(500)
df["Year"] = df["index"].dt.year
df["Month"] = df["index"].dt.month
df["Day"] = df["index"].dt.day
df["Hour"] = df["index"].dt.hour
df["Minute"] = df["index"].dt.minute
df["Second"] = df["index"].dt.second
df["Nanosecond"] = df["index"].dt.nanosecond
df["Date"] = df["index"].dt.date
df["Time"] = df["index"].dt.time
df["Time_Time_Zone"] = df["index"].dt.timetz
df["Day_Of_Year"] = df["index"].dt.dayofyear
df["Week_Of_Year"] = df["index"].dt.weekofyear
df["Week"] = df["index"].dt.week
df["Day_Of_week"] = df["index"].dt.dayofweek
df["Week_Day"] = df["index"].dt.weekday
df["Week_Day_Name"] = df["index"].dt.weekday_name
df["Quarter"] = df["index"].dt.quarter
df["Days_In_Month"] = df["index"].dt.days_in_month
df["Is_Month_Start"] = df["index"].dt.is_month_start
df["Is_Month_End"] = df["index"].dt.is_month_end
df["Is_Quarter_Start"] = df["index"].dt.is_quarter_start
df["Is_Quarter_End"] = df["index"].dt.is_quarter_end
df["Is_Leap_Year"] = df["index"].dt.is_leap_year

相关文章

  • 一些Pandas的Trick

    日期时间类型接口一览表(衍生特征可以糊好多)

  • 一些小trick

    解决matplotlib画图,保存svg格式不完整办法 plt.savefig('test.jpg', dpi=2...

  • 一些trick的代码

    key = key.replace(/\_(\w)/g, (all, letter) => letter.toUp...

  • Pandas里面常用的一些数据分析函数总结

    Pandas里面常用的一些数据分析函数总结 import pandas as pdimport numpy as ...

  • 技能树

    此外,训练网络时,一些trick也很值得研究,例如:数据增强、warmup等。

  • Nodejs中的一些小trick

    之前常常因为不注意,习惯用写PHP或者Java的方式来写nodejs,产生了了一些错误,这里总结一些小小的tric...

  • spider中的一些trick

    在使用spider进行网页爬取前,先对网站进行分析,主要的看以下这些: mete原标签、charset字符集、co...

  • pandas to sql slow

    收集关于pandas to sql 慢的一些讨论:https://github.com/pandas-dev/pa...

  • 每天学一个小知识

    用TRICK教养法,成功养育孩子 TRICK是什么? -TRICK的终极目标是在一个负责任的世界里培养出负责任的人...

  • Trick

    1.Problem: ubutu "sudo pip command not found" Solution:...

网友评论

      本文标题:一些Pandas的Trick

      本文链接:https://www.haomeiwen.com/subject/eqizpktx.html