美文网首页
7、tf 特征处理

7、tf 特征处理

作者: 是黄小胖呀 | 来源:发表于2020-12-13 16:00 被阅读0次

使用特征列可以将类别特征转换为one-hot编码特征,将连续特征构建分桶特征,以及对多个特征生成交叉特征等等。

要创建特征列,请调用 tf.feature_column 模块的函数。

该模块中常用的九个函数如下图所示,所有九个函数都会返回一个 Categorical-Column 或一个

Dense-Column 对象,但却不会返回 bucketized_column,后者继承自这两个类。

注意:所有的Catogorical Column类型最终都要通过indicator_column转换成Dense Column类型才能传入模型!

9种函数

1、numeric_column 数值列,最常用。

2、bucketized_column 分桶列,由数值列生成,可以由一个数值列出多个特征,one-hot编码。

3、categorical_column_with_identity 分类标识列,one-hot编码,相当于分桶列每个桶为1个整数的情况。

4、categorical_column_with_vocabulary_list 分类词汇列,one-hot编码,由list指定词典。

5、categorical_column_with_vocabulary_file 分类词汇列,由文件file指定词典。

6、categorical_column_with_hash_bucket 哈希列,整数或词典较大时采用。

7、indicator_column 指标列,由Categorical Column生成,one-hot编码

8、embedding_column 嵌入列,由Categorical Column生成,嵌入矢量分布参数需要学习。嵌入矢量维数建议取类别数量的 4 次方根。

9、crossed_column 交叉列,可以由除categorical_column_with_hash_bucket的任意分类列构成。

特征列使用范例,以下是一个使用特征列解决Titanic生存问题的完整范例。

见:https://www.kesci.com/mw/project/5ea6af0a564b12002c0977b6

相关文章

  • 7、tf 特征处理

    使用特征列可以将类别特征转换为one-hot编码特征,将连续特征构建分桶特征,以及对多个特征生成交叉特征等等。 要...

  • tf.feature_column实用特征工程总结

    tf.feature_column特征处理功能预览 tf.feature_column主要针对离散特征和连续特征,...

  • 学习笔记:三大特征抽取器比较

    地址:放弃幻想,全面拥抱Transformer:自然语言处理三大特征抽取器(CNN/RNN/TF)比较, NLP任...

  • Task3

    特征选择 TF-IDF原理以及利用其进行特征筛选 互信息的原理以及利用其进行特征筛选 TF-IDF 原理: 如何提...

  • MBTI职场性格测试

    MBTI职场性格测试 SN:-2 IE:5 TF:7 JP:4 type:INTJ 主要特征 1、从整体角度去看待...

  • TaskThree-20190307

    特征选择 1、TF-IDF原理TF-IDF(Term Frequency-Inverse Document Fre...

  • TensorFlow 特征列

    TensorFlow 特征列 深度神经网络的输入 深度神经网络可以处理哪类数据?答案当然是数字(例如 tf.flo...

  • Spark-特征抽取(TF-IDF)

    mac单机简单实现一个Spark-特征抽取(TF-IDF)。 TF-IDF原理: 词频TF(t,d)是某个词t在文...

  • 某公司自然语言处理算法笔试题

    1 请列出几种文本特征提取算法 答:文档频率、信息增益、互信息、X^2统计、TF-IDF 2 简述几种自然语言处理...

  • MBTI职业性格测试

    SN:4 IE:9 TF:-7 JP:-2 type:ISFP 主要特征 1、有内在的坚定价值观,并非常受它支配,...

网友评论

      本文标题:7、tf 特征处理

      本文链接:https://www.haomeiwen.com/subject/zkpegktx.html