美文网首页
python-pandas-常用代码

python-pandas-常用代码

作者: logi | 来源:发表于2020-05-11 20:44 被阅读0次

1. 读取数据

 user_feature = pd.read_csv(self.feature_path + '/underexpose_user_feat.csv',
                                            header=None,
                                            names=['user_id', 'user_age_level', 'user_gender', 'user_city_level'],
                                            na_values=['']
                                            )

  item_feature = pd.read_csv(path, sep=',\[|\],|,' ,engine='python',
                               header=None, names=['item_id'] +  ['emb_1_'+ str(i) for i in range(128)] + ['emb_2_' + str(i) for i in range(128)])



2. 存储数据

train_data.to_csv(self.sample_save_path + "_train", index=False, header=True)

3. group by

user_item_ = pos_data.groupby('user_id')['item_id'].agg(set).reset_index()
        user_item_dict = dict(zip(user_item_['user_id'], user_item_['item_id']))


4. merge

  pre_sample = pd.merge(d_a, self.item_feature, on='item_id', how='left')

5. fill na

def _fill_NA(df):
    rand_value = np.random.uniform(-1, 1, size=(128))
    values= {"user_id": -1, 'item_id': -1,
     'user_city_level': '-1',
     'user_age_level': '-1', 'user_gender': 'O'}

    emb_dict = {'emb_1_'+ str(i):0 for i in range(128) } # TODO:拥均值 or rankd ??
    emb_dict2=  {'emb_2_'+ str(i):0 for i in range(128) }
    emb_all = emb_dict.copy()
    emb_all.update(emb_dict2)

    values_merge = values.copy()
    values_merge.update(emb_all)

    return df.fillna(value=values_merge)

相关文章

  • python-pandas-常用代码

    1. 读取数据 2. 存储数据 3. group by 4. merge 5. fill na

  • 常用代码

    手机号输入框

  • 常用代码

    大幅度达到

  • 常用代码

    UITableView 侧滑返回执行协议方法

  • 常用代码

    记录一些平时项目中用到的代码 ES7相关 Async/Await await可以把asnyc当成一个同步函数处理,...

  • 常用代码

    1.设置渐变色

  • 常用代码

    简单代码汇总 1.jQuery定时器 2.判断是否是手机访问 3.判断是否是微信浏览器 4.低版本IE判断 5.判...

  • 常用代码

    个人经常用到又经常忘记的代码,记录在这里,不用一遍遍的去网上查。 UITableview 刷新 滑动到某个位置 U...

  • 常用代码

    异或运算加密 CRC8校验

  • 常用代码

    1.获取前一天日期,格式:2019-08-03 2.基于Gson的Json工具类 3.restTemplate添加...

网友评论

      本文标题:python-pandas-常用代码

      本文链接:https://www.haomeiwen.com/subject/uyvpnhtx.html