最近读取TFRecord文件出现问题,每次运行代码的时候,一开始,读取的队列就出现问题,然后退出了程序,具体的报错信息为:
OutOfRangeError: RandomShuffleQueue ‘_1_shuffle_batch/random_shuffle_queue’ is closed and has insufficient elements (requested 64, current size 0)
大致的意思就是,在获取第一个batch的64个数据的时候,队列就关闭了,并且队列中没有存储数据。可以确认,应该是读取数据出现问题,
1.首先要确保队列的启动:
coord = tf.train.Coordinator()
threads = tf.train.start_queue_runners(sess=self.sess, coord=coord)
2.读取TFRecord的阅读器tf.TFRecordReader需要与TFRecord的数据相匹配
tf.TFRecordReader在初始化中有options的选项,对应的是TFRecord的options的选项,也就是指定压缩选项:
init(
name=None,
options=None
)
Create a TFRecordReader.
Args:
name: A name for the operation (optional).
options: A TFRecordOptions object (optional).
比如在创建TFRecord文件的时候使用的代码是:
writer= tf.python_io.TFRecordWriter(record_name, tf.python_io.TFRecordOptions(1))
example = tf.train.Example(
features=tf.train.Features(
feature = {
"label":tf.train.Feature(int64_list=tf.train.Int64List(value=label)),
'img_raw':tf.train.Feature(bytes_list=tf.train.BytesList(value=[img]))
}
)
)
writer.write(example.SerializeToString())
那么在读取TFRecord文件的时候使用的代码配置如下:
file_queue = tf.train.string_input_producer([record_name])
reader = tf.TFRecordReader(tf.python_io.TFRecordOptions(1))
_, serialized_example = reader.read(file_queue)
3.确保读取过程中不会出现其他问题,导致读取出错致使队列退出
出现上述问题难以查找,这块问题出在Tensorflow的队列设计中,队列使用的文档中说明,队列内部会自行处理错误与异常,这就导致了与队列相关的,数据读取的异常处理被封装在了队列内部,外层很难获取其具体的信息,只能看到最终队列由于内部发生了异常,导致队列抛出处理后的异常,从而停止了工作,但这样丢失了原始的错误信息,调试起来相当麻烦,因而现在新的Tensorflow的版本中,已经不再更新维护原来的队列读取这套流程了。
网友评论