美文网首页
用tf.data API做数据增强

用tf.data API做数据增强

作者: LabVIEW_Python | 来源:发表于2021-10-04 16:51 被阅读0次

为什么要用tf.data API

  • 可以以快速且可扩展的方式加载和预处理数据
  • 大型数据集 vs 小型数据集(用numpy即可)
  • 支持分布式训练

数据增强(Data augmentation) Keras提供两种实现数据增强的方式:

  1. 将数据增强层在模型中实现,代码如下所示:
model = tf.keras.Sequential([
  resize_and_rescale,
  data_augmentation,
  layers.Conv2D(16, 3, padding='same', activation='relu'),
  layers.MaxPooling2D(),
  # Rest of your model
])

这种方式的好处是,数据增强可以在GPU中计算,训练速度会更快。使用TensorFlow做部署时,在推理模式下,数据增强层会自动变为恒等输出。当使用其它软件工具部署模型时,例如:OpenVINO,则内嵌入模型的数据增强层行为变得未知

  1. 不将数据增强功能集成到模型里面,仅仅作用于训练数据,代码如下所示:
aug_ds = train_ds.map(
lambda x, y: (resize_and_rescale(x, training=True), y))

这种方式的好处是,数据增强在CPU中异步执行,可以更好的利用 Dataset.prefetch的优势;另外,数据增强与模型分离,方便模型用第三工具进行部署。本文选用第二种方式实现数据增强

完整范例代码:

data_augmentation = tf.keras.Sequential([
  layers.experimental.preprocessing.RandomFlip("horizontal_and_vertical"),
  layers.experimental.preprocessing.RandomRotation(0.2),
])

train_dataset = train_dataset.map(lambda x,y: (data_augmentation(x, training=True), y), num_parallel_calls=tf.data.AUTOTUNE)
train_dataset = train_dataset.shuffle(1000).batch(batch_size).prefetch(buffer_size=tf.data.AUTOTUNE)

相关文章

  • 用tf.data API做数据增强

    为什么要用tf.data[https://www.tensorflow.org/api_docs/python/t...

  • [0.2] Tensorflow踩坑记之头疼的tf.data

    今天尝试总结一下 tf.data 这个API的一些用法吧。之所以会用到这个API,是因为需要处理的数据量很大,而且...

  • tf.data库简介

    为什么要设计tf.data库? 机器学习模型需要一个强大高效的管道式数据读取工具,把数据从硬盘读取到模型。直接用P...

  • tf.data获取数据

    承接上文, 将数据存储为tfrecords文件之后, 在从tfrecords文件中读取数据训练模型, 这里尝试使用...

  • TF2.0:解决网络只训练完一个epoch就停止的问题

    在用tf2.0进行自定义训练的时候,用tf.data模块进行输入数据的创建!结果在训练的时候出现:训练完第一个ep...

  • keras 用迁移学习做图片分类+数据增强

    keras 用迁移学习做图片分类+数据增强(天池雪浪制造复赛0.71 top50) 本文结构,首先构建模型,从文件...

  • data for echarts

    场景是提供 api 给前端做数据统计展示, 用的工具是 echarts , 要求就是在某个日期没有数据的时候不能留...

  • NLP中的数据增强

    最近有同学问nlp中如何做data augmentation,这篇总结下目前知道的方法。 数据增强 数据增强技术已...

  • 4_datasets_quickstart

    tf.data模块包含一系列类,用于加载数据、操作数据并通过管道将数据传送给模型。本文主要介绍之前提到的iris_...

  • swift4.0-tableView显示数据

    用tableView很简单的显示数据,主要是熟悉API 代码:

网友评论

      本文标题:用tf.data API做数据增强

      本文链接:https://www.haomeiwen.com/subject/hzhggltx.html