- Tensorflow通过tf.gfile.FastGFile(filename,’rb’).read()读取的图像,是图像的原始数据,还需要经过解码,才能获取图像的数据,数据的格式为RGB(三通道图像),这一点是与Opencv不同。 Tensorflow提供了对jpeg和png格式图片的解码函数,例如“decode_jpeg”对jpeg格式的图片进行解码,使用encode_jpeg编码,将图像保存到本地。
- 图片都是存储为rgb格式。由于tf.gfile.FastGFile直接从img_path读取图片,并不像opencv会转换成bgr,所以tfrecord一般存的都是rgb格式。因此,采用tfrecord方案的模型往往都是在rgb上训练的,这是惯例。如果测试阶段是opencv读图,则需要做一下通道转换( input_img = input_img[:, :, :, ::-1] )。
- 颜色通道(bgr还是rgb)、归一化方式(输入是归一化到[-1, 1]、[0, 1],还是不做归一化)、输出(是左pts右cls还是左cls右bgr),不管是自己从头train、finetune,还是test,都要细心确定清楚!
【tensorflow】直接读取图片
2020-04-25 13:20:15
浏览数 (1)