论文1

作者: BG大龍 | 来源:发表于2019-12-29 16:49 被阅读0次

    ==文献地址:==
    https://arxiv.org/pdf/1907.01377.pdf

    在这里插入图片描述

    摘要

    • THz新兴技术,广泛用到不同应用场景。

    • 然而,为这些应用场景,提取可解释的和物理上有意义的参数,需要解决一个反问题:由这些参数确定的模型函数,需要拟合到测量数据。

    • 由于基础的优化问题是非凸的,求解成本很高,作者建议直接从实测数据中学习合适参数的预测

    • 更准确地说,作者开发了一个基于模型的自动编码器AE,
      ==编码器==——编码网络预测合适的参数,
      ==解码器==解码环节被固定到一个物理上有意义的模型函数上,这样我们可以在无监督的方式下训练编码网络

    • 作者用数值方法来说明,结果表明,
      ==优化速度==——网络的速度比经典的优化技术,快140多倍
      ==优化的目标值==——而预测的目标值,仅略高一些

    • ==论文的意义==
      使用这些预测的目标值,作为局部优化技术的起点,可以使我们在不使用基于网络的初始化的情况下,以大约两倍于优化的速度收敛到更好的局部最小值。

    1、Introduction

    • ==【基于什么问题?】== 在这里插入图片描述
    • 新兴传感技术,多个应用领域,有应用价值。
    • 然而,与上述应用相关的物理可解释量,并不总是可以直接测量的
    • 相反,在THz成像系统中,每个像素都隐含着这些物理量的信息。
    • 这使得从每个像素中推导这些物理量的逆问题(也就是说,每个像素怎么得到相关物理量?从相关物理量怎么得到各个像素?),成为一个具有高度现实意义且有难度的问题。
    • ==【公式1:有这样的参数P(X)关系】==
    • 在每个像素位置x上,所需(未知)参数之间的关系, 在这里插入图片描述
    • ==【公式2:有这样的模型,f(Zi)。==
    • z_{i},是一个设备相关的采样网格 在这里插入图片描述
    • ==【公式3:要解决的参数优化问题】==
    • 通过反向传播算法,最小化损失函数时,四个参数的取值,是我们需要的。
      在这里插入图片描述
      考虑到像素的个数(n x*n y),即公式(3)所要解决的优化问题,一般是数十万到数百万的数量级,即使是损失函数的简单选择,如2平方损失(MSE),最终的拟合问题也是高度非凸的,全局解会变得相当昂贵
    • ==【论文怎么解决?】==
      在这里插入图片描述
      论文中,作者提出训练一个神经网络(基于模型的AE),来直接解决优化问题(无监督的预训练作为优秀的初始化方案)
      ——获得更低的损失Loss
      ——收敛速度比经典优化快2倍

    2、THz成像系统

    • ==1——成像方式==
    • 实现THz成像,有几种方式,飞秒激光扫描系统、合成孔径系统、混合系统……
    • 典型的THz成像方法是基于调频的连续波(FMCW)的概念,
    • 它使用主动调频的THz信号,来感觉来自物体的反射信号。
      反射能量和由于信号路径长度引起的相位偏移使得三维THz成像成为可能
    • ==2——THz三维成像系统==
      在这里插入图片描述

    发射机(Tx)和接收机(Rx)都安装在同一平台上。
    成像单元由Tx、Rx和光学组件组成,使用步进电机和线性级沿x和y方向移动。
    该成像单元在每个横向位置获取物体的深度剖面,以获得完整的图像太赫兹的3d图像

    • ==3——信号变换==

      在这里插入图片描述
    • g t (x,t)——表示FMCW系统横向位置,反射电场振幅的实测解调时域信号

    • g c (x,z)——在FMCW雷达信号处理中,通过傅里叶变换将连续波时域信号转换为频域信号[9,10]。

    • 由于线性扫频在z方向上的每个空间位置,都有唯一的频率,所以转换后的频域信号与空间方位(z方向)域信号直接相关

      在这里插入图片描述
    • 由此得到的三维图像g c∈C^{n_{x}*n_{y}*n_{z}}是空间域中的复杂数据,表示THz能量的逐像素复反射率。

      在这里插入图片描述
    • n_{x}*n_{y}*n_{z}分别类似于垂直、水平和深度方向的离散化。同样地,我们可以通过把实部和虚部看作两个独立的通道来表示g c,得到一个4D的实数据张量

    • ==4——解释物理模型==

      在这里插入图片描述
    • A——电场振幅,是材料的反射系数,它依赖于材料的复介电常数,有助于对材料进行识别和分类。
      µ——深度位置,最大反射发生的位置,即,最大反射THz能量的表面位置
      σ——脉冲宽度,其中包括材料的色散特性的信息
      φ——反射波的相位,取决于材料的介电性能的实部、虚部之比
      w——频率
      z—— z_{i},是一个设备相关的采样网格

    • 参数P =(A,σ,µ,φ),包含实验对象的几何形状以及材料成像的重要信息

    3、Related Work

    4、基于模型的自编码器

    • ==1——==

    • 输入的THz数据,通过这样形式来表示,

      在这里插入图片描述
    • 考虑四个未知参数(A,σ,µ,φ),在n_{x}*n_{y}这样的像素矩阵中,允许在每个像素处改变每个参数

    • 4个参数,即,有4个参数矩阵,那么连接这四个参数矩阵成一个简单的参数张量矩阵P

      在这里插入图片描述
      那么,我们的目的就是,找到这样的P,使得输入数据g
      在这里插入图片描述
    • ==2——有监督==

    • 以THz图像重建为例,用经典的监督机器学习方法,解决已知前向算子的问题,如图所示

      在这里插入图片描述
    • 明确的前向模型f,从已知参数P,用来模拟一个巨大的的图像集g。

    • 随后,被用作训练数据,通过取决于权重θ的神经网络G(g;θ),来预测参数P

    • 这种带有模拟训练数据的监督方法,常用于其他图像重建领域,如超分辨率[22,23]或图像去模糊[24,25]。

    • 然而,在模拟数据上训练的网络的准确性,关键依赖于对前向模型和模拟噪声的精确知识。在[26]中,当深度去噪网络训练高斯噪声时,BM3D在处理真实的传感器噪声时表现得更好。

    • ==3——论文所提无监督方法==

      在这里插入图片描述
    • 不是追求上述监督学习方法,我们将用一种神经网络来替换优化方法(3)中的P =(A,σ,µ,φ)

    • 这个神经网络,取决于原始输入数据g和可学的参数θ。可以用无监督的方式在真实的数据上进行训练。

    • 假设我们有多个THz数据的样本g^{k},并选择(3)中的损失函数作为‘2平方损失’,产生无监督训练问题

      在这里插入图片描述
    • 正如在图3中所示,这种训练类似于AE架构——网络的输入是数据g^{k},它被映射到参数P。参数P再输入到模型函数f时,应该重构输出g^{k}*,

      在这里插入图片描述
    • 与直接监督学习方法相比,所提出的无监督方法(5)有两个显著的优点:

      在这里插入图片描述
    • 允许我们用无监督的方式在真实数据上进行训练,

    • (5)中的代价函数隐式地处理不同参数的缩放,从而避免了在参数空间中定义有意义的代价函数的问题。如:简单的参数差异,就像\left \| P1-P2 \right \|^2
      2两组不同的参数P1和P2,在很大程度上取决于单个参数的缩放程度,甚至可能是毫无意义的,例如φ的相位差这样的循环参数。

    5、网络的搭建和训练

    5.1 数据预处理

    • 如图4,示例性测得的THz信号的幅值图如下所示,THz能量主要集中在sinc函数的主瓣和第一旁瓣
      在这里插入图片描述
    • 由于物理模型主要在主瓣的附近有效,我们通过裁剪一个小的窗口(通常是9个测量点宽度的窗口),
    • ==裁剪窗口==,是在每像素的12600个测量值的大范围外的窗口。在每个像素处,裁剪窗口集中在信号最大的位置。
    • 如上所述,我们将THz数据表示为4D实张量g c∈C^{n_{x}*n_{y}*n_{z}*2},其中n_{x} =n_{y}= 446,n_{z}为裁剪窗口的大小,在本例中为91。

    5.2 编码网络搭建与训练

    • ==1==
    • 编码器网络G (g,θ),选一个空间分离的架构,只在g上使用1×1的卷积,导致signal-by-signal的重建机制,允许高水平的并行性,因此最大限度地在GPU上提升重建速度
    • 具体的架构(如图5所示)——
    • 在连接激活之前,在实部和虚部分别应用第一组卷积滤波器,并在连接的结构上应用三个进一步的卷积滤波器。
    • 我们在每次卷积后使用批处理归一化(BN)[27],并使用漏整流线性单元(LeReLU)[28]作为激活剂。最后,全连接层将尺寸降低到每个像素四个输出参数的期望大小。确保振幅具有物理意义,即在非负的情况下,我们对第一个分量应用一个绝对值函数。有趣的是,当网络被训练时,这个选择与一个简单的直线单元相比是有利的。
    • 结构编码网络G (G;θ),预测参数:在每个像素提取实部和虚部,通过三卷积,卷积、连接和加工1完全连接层。为了获得物理上有意义的(非负的)振幅,我们对第一个分量应用一个绝对值函数
    • ==2==
      待续…………

    6、数值实验

    7、总结与展望

    相关文章

      网友评论

          本文标题:论文1

          本文链接:https://www.haomeiwen.com/subject/nuoyoctx.html