一、AN EFFICIENT FAST ENCODING ALGORITHM FOR VECTOR QUANTIZATION(论文文献综述)
殷迅[1](2019)在《基于嵌入式GPU平台深度学习算法的加速与优化》文中指出近些年来,随着计算能力的大幅提升,深度学习网络得以快速的发展,已经被广泛应用于语音识别、计算机视觉、自然语言处理等研究。为了提取更加有效的特征,深度学习网络的层数增长较快,并且具有计算量大、参数多的特点,需要高性能的GPU等设备为其提供算力的支持。另一方面,随着无人机、机器人、智能手机等嵌入式或移动设备的快速发展,在这些设备上部署深度学习网络的需求也变得更加强烈。然而这些实时应用平台上的资源(例如存储、计算以及电池功率等)都非常有限,因此在这些平台上加速与优化深度学习网络变成了学术界和工业界共同关注的研究课题。基于此,越来越多的网络加速与优化算法被提出,但是目前这些算法基本都是针对图像分类网络,与目标检测任务相结合,并且在同一任务中使用多种优化方法的深度学习模型相对较少,这也是本文的研究重点。本文首先介绍了深度学习网络加速与优化的研究背景与发展趋势,对当前所存在的主要模型加速与优化算法进行了全面的总结与阐述。接着针对目标设备嵌入式GPU平台Jetson TX2,主要完成了以下两点工作:第一,对于经典的目标检测任务PASCAL VOC,本文比较了目前流行的基于深度学习的目标检测算法的Roofline模型的测试结果,同时在Jetson TX2上进行了实际的部署与验证。综合考虑不同算法的精度、效率与模型大小,最终用深度可分离卷积的方法来重新设计一种高效的目标检测网络。与YOLOv2相比,新网络的检测准确率下降5%,但是检测速度提升了150%,并且模型的大小压缩了80%。接着在已有的新检测网络的基础上采用滤波器级的剪枝方法对模型进行进一步的压缩与加速,最终使得网络的检测速度又提升了20%,同时存储空间下降了约55%。第二,本文以真实监控摄像头下的微小人脸检测为背景,选择S3FD为基础检测算法并对其进行优化。优化的一方面是基于CUDA添加S3FD缺失的网络层,并对其计算图进行优化,使得在Jetson TX2平台上每帧的检测时间由0.69s提升到0.45s。另一方面是使用INT8及FP16数据类型进行网络的量化加速,经过校准等一系列操作后,可以使得每帧的检测时间提升为0.27s(FP16)和0.14s(INT8)。最后基于优化后的检测网络搭建微小人脸自动检测系统,实现了在PC端(GTX 1080Ti)四路实时的效果。
刘丽娟[2](2004)在《矢量量化编码算法及其VLSI结构设计的研究》文中认为数字静止摄像机以及数字文件系统的广泛应用使图像压缩技术变得越来越重要。在数字图像压缩领域里,矢量量化算法简单、有效,是一种比较有吸引力的方法。矢量量化通常使用两种距离测度:绝对误差测度和平方误差测度。多年来,对基于平方误差测度的矢量量化的研究大多集中于以软件实现的快速编码算法。基于平方误差距离测度的矢量量化基本算法――全搜索算法,虽然解码简单,编码质量高,但是需要计算输入矢量和每个码字之间的平方误差,其计算复杂度和编码时间随着码书尺寸的增加而迅速增加,这限制了它的实际应用,因为高效的矢量量化编码系统往往采用大尺寸的码书。基于绝对误差测度的矢量量化主要用于矢量量化编码处理器,因为绝对误差测度计算简单方便,比较适合硬件实现,但是,基于绝对误差测度的编码算法较基于平方误差测度的编码算法的重构图像质量有所下降,并行距离计算占用较多的硬件资源。本文研究了基于平方误差测度的矢量量化快速编码算法及其VLSI结构。本文首先以LBG码书设计算法设计了码书,然后,提出了适于硬件实现的保持全搜索算法编码精度的基于平方误差测度的矢量量化快速编码算法,同时提出了删除不可能匹配码字的删除准则、有效的候选码字搜索方式、减少计算存储量的的索引空间的处理方式进一步提高了编码速度,最后,给出了该快速编码算法的VLSI体系结构,并对设计的结构成功地进行了功能仿真和验证。本文的创新点主要集中于以下几方面:首先,提出了一种新的图像金字塔数据结构,该结构符合图像金字塔结构的定义,金字塔较低层的数据是相邻较高层对应4个数据的L2-范数的一半,金字塔内所有数据刚好都在0(255灰度等级范围内,减少了存储量开销,适于硬件实现。在提出的金字塔结构的基础上,推出了实现快速编码的多级不等式条件。当利用该不等式进行码字匹配时,如果码字金字塔和输入矢量金字塔较低层之间的距离大于或等于当前最小距离,则结束该码字的匹配,减少了金字塔其它高层之间的距离计算量。为了进一步提高编码速度,提出了有效的候选码字搜索方式、强有力的码字删除准则和有效地节<WP=4>省存储空间的索引空间的概念。由于码字金字塔和输入矢量金字塔顶层之间距离的特殊性,选择范数距离输入矢量范数最近的码字作为候选码字的搜索方式可以使相对于其它所有未被排除的码字,该候选码字金字塔和输入矢量金字塔顶层之间距离最小,以尽快地找到最佳匹配码字,减少编码时间。根据提出的不等式及搜索方式,一旦判断有码字满足提出的删除准则,则立即删除其它所有不可能匹配的码字,结束当前输入矢量的编码,因而可省去大量的不必要的码字匹配。按照算法的要求,输入矢量编码期间,需要不断地从码书中删除已经比较过的码字,直到码书空为止,该码书与预处理码书相同,所占空间较大,当码书空间由码字索引组成的索引空间代替后,显着降低了存储量需求,进一步提高了编码速度。 其次,研究了矢量量化快速编码算法的VLSI体系结构,该结构的运算处理单元与影响编码质量的码书尺寸无关,很容易扩展到任意数目的码字而不增加额外的运算硬件,在改善编码质量增加码书大小方面具有一定的优越性。流水线处理、并发操作和分时复用技术的使用既提高了系统的处理速度,又充分利用了现有硬件资源,与先前的基于绝对误差测度的编码处理器不同,本文设计的结构基于平方误差测度,既保证了较高的图像质量,实现了快速编码,又具有较小的硬件体积。 最后,对设计的结构成功地进行了功能仿真和验证,设计了矢量量化静止图像编码系统。针对VLSI结构设计中的各个模块分别以可综合的Verilog HDL建模,完成了VLSI电路设计,成功地通过了功能仿真,并用可编程逻辑器件(CPLD)进行了验证,结果表明,设计的VLSI结构是可行的,具有可实现性,因此,本文提出的矢量量化编码算法及其VLSI结构是正确的、有效的。
冯栋[3](2021)在《基于机器视觉的目标检索方法研究》文中研究说明随着新一代信息技术的蓬勃发展,服务于城市治理的智能高清摄像头建设规模日渐庞大,催生出爆炸式增长的视频图像数据,同时高清的视图画面中不同尺度目标和场景细节也得以呈现。如何高效处理海量视频和图像数据,从中建立目标个体和群体的联系,并挖掘出更多有价值的信息变得愈发重要。基于视觉的目标图像检索技术正是解决这一问题的关键钥匙。视觉目标检索是计算机视觉领域和数字图像处理任务中最具有挑战性的工作之一,它的研究内容包含如何高效地构建待检索目标特征数据库和精准且快速地检索出相同或相似的目标图像两项任务。在实际工业应用环境中,受数据接入规模和复杂场景影响,使得待检索库庞大(亿级以上)且噪声数据干扰严重,从而导致构建快速、精准的视觉目标检索系统面临更严峻的考验。本学位论文围绕目标建库和目标检索两个环节来展开研究,主要有以下四方面的创新型工作:(1)针对待检索目标特征数据库噪声数据干扰严重的问题,在目标建库环节加入目标检测任务的研究,提出了一种EASNet网络的单阶目标检测方法。分别从主干网络结构设计、特征融合模块设计、损失函数设计三个方面开展深度优化工作,实验表明,该方法有利于克服不同分辨率下多尺度干扰、定位不精确、样本不均衡的问题;(2)为保障精准返回检索结果,提出了一种基于深度神经网络的多层特征融合方法,可融合底层局部特征和高层语义特征。该方法使用词袋模型和汉明嵌入方法对特征进行聚合以及细粒度量化,并采用正则化扩散方法对相似度得分结果重排序来提高检索精度。实验表明,该方法可有效提高检索精度;(3)针对海量视觉目标检索底库下的计算开销大和返回结果慢的问题,提出了一个分块多叉字典树MBNT的特征索引结构方法,并将其用来加速汉明空间下目标矢量特征的检索比对。通过对比实验表明,该方法在解决查找不命中问题的同时内存占用和计算开销更小。此外,本文还发现当二值矢量特征越来越紧凑且细节区分度更好时,精确r近邻搜索比近似r近邻搜索对视觉目标检索的速度优势越来越明显;(4)面向公安视频实战侦察场景,搭建视频目标检测和检索应用系统。该系统包含视图解析和目标检索两个子系统,其中EASNet视觉目标检测算法在视图解析子系统中被实现和使用,而基于深度神经网络的多层特征融合方法和分块多叉字典树MBNT的特征索引结构在目标检索子系统中被集成。该系统已在多地公安系统上测试,并取得了一定实战效果。
何恒涛[4](2020)在《面向智能通信的先进收发机理论与关键技术》文中认为2019年商用的第五代移动通信(5G,5th Generation Mobile Communication Systems)系统通过大规模多输入多输出(MIMO,Multiple Input Multiple Output)、毫米波通信、以及超密集组网实现空口增强、频谱扩展、以及网络密集化。但是随着5G商用系统的初步部署,主要核心使能技术的优缺点也日益显着,移动通信面临发展模式、架构、以及安全等多方面挑战,难以满足移动数据流量爆炸式增长以及业务多样化的需求。因此,迫切需要开启第六代移动通信系统(6G,6th Generation Mobile Communication Systems)的研究。在6G众多候选技术中,以利用人工智能提升无线传输效能的智能通信成为国际前沿。目前,在物理层中相关理论方法和关键技术尚处于起步阶段,需要进行大量的研究工作。本论文以模型驱动深度学习为核心,对面向智能通信的先进收发机理论与关键技术展开研究。首先,面向智能通信物理层研究基于模型驱动深度学习的先进收发机设计。在详细介绍模型驱动深度学习概念和原理之后,针对数据驱动深度学习网络没有引入通信领域专家知识等问题,提出基于模型驱动深度学习的收发机设计,从MIMO检测器、OFDM接收机设计、大规模MIMO信道状态信息(CSI,Channel State Information)反馈和预编码设计阐述基于模型驱动深度学习的收发机理论与关键技术,为后续研究面向智能通信的先进收发机设计指明方向。其次,面向毫米波低精度量化MIMO-OFDM系统研究先进接收机设计。针对低精度量化带来的信号失真问题,提出期望一致性信号恢复(GEC-SR,Generalized Expectation Consistent Signal Recovery)算法,实现毫米波低精度量化MIMO-OFDM系统最优检测,利用统计物理学中的副本方法,推导GEC-SR算法的状态演化方程,基于此分析框架证明3比特量化带来的误符号率(SER,Symbol Error Rate)性能损失不超过1.02 d B,揭示高精度模数转换器(ADC,Analog to Digital Converter)和低精度射频链路对系统SER性能的影响。仿真结果证明所提算法的有效性和分析框架的准确性。随后,面向毫米波波束域大规模MIMO系统研究基于模型驱动深度学习的信道估计方法。针对窄带三维透镜天线毫米波大规模MIMO系统,提出一种基于学习去噪近似消息传递算法的信道估计网络,实现精确CSI的获取,进一步考虑宽带毫米波系统中波束斜射现象带来的挑战,提出一种基于学习去噪期望一致性信号恢复算法的信道估计网络,利用Steins无偏估计器实现网络的无监督训练,在少量射频链路和低精度ADC下仍然能够获得精确CSI。仿真结果表明:两种基于模型驱动深度学习的信道估计网络性能明显优于传统的压缩感知算法。然后,面向点对点MIMO系统研究基于模型驱动深度学习的MIMO检测算法。将传统的正交近似消息传递MIMO检测器展开成深度神经网络,合理地引入可训练参数提升检测性能,进一步考虑不完美的CSI,在基于模型驱动深度学习MIMO检测器中引入信道估计误差,通过数据辅助的信道估计方法提升信道估计性能,实现MIMO系统联合信道估计和信号检测。仿真结果验证模型驱动深度学习可以加速迭代MIMO检测器收敛,提升信号检测性能,并展现对系统参数失配的鲁棒性。最后,面向多用户大规模MIMO系统研究基于模型驱动深度学习的有限字符和恒包络预编码方法。针对传统的迭代预编码算法需要大量的迭代次数和计算开销等问题,提出基于模型驱动深度学习的多用户大规模MIMO预编码方法。将传统的迭代离散信号估计和黎曼流形优化预编码器展开成深度神经网络,添加可训练参数来调整搜索步长、梯度方向和阻尼因子,降低多用户干扰并减少计算开销和迭代次数。仿真结果表明:两种基于模型驱动深度学习的预编码器能显着提升误码率性能,对信道估计误差和信道模型失配展现鲁棒性。
秦鹏程[5](2020)在《高光谱遥感图像压缩自适应预测器优化研究》文中研究指明针对高光谱图像海量数据的存储和数据无损压缩比较低的问题,从三维数据的角度出发,提出一种对自适应预测器进行优化的高光谱遥感图像压缩算法。首先,计算各个波段之间的相关性,按照最优波段相关性建立参考波段索引表,依据最优参考波段索引表进行谱间预测,得到谱间预测后的残差图像。其次,依据图像自身的特征选择三维空间预测器或者谱空联合预测器对最优参考波段谱间预测后的残差图像数据再次进行预测处理,其中三维空间预测器与谱空联合预测器的选择是参考最优参考波段索引表的统计,在各个波段之间都处在较大的相关性时,表明数据在三维空间内存在较大的相关性,选择三维空间预测器,否则选择谱空联合预测器,这两种优化后的预测器兼顾了不同类型的数据压缩。最后,生成的残差图像中的信息熵相对原图已经有大幅度的降低,对残差图像进行算术编码,得到压缩后的数据。由实验分析可得,在优化的自适应预测器算法中的两个预测器得到的压缩效果差别不大,通过优化自适应预测器压缩算法得到的压缩效果,与普通的相类似压缩算法相比,压缩比有明显地提高,可以得出本文中的算法为有效的高光谱遥感图像无损压缩算法。该论文有图23幅,表11个,参考文献67篇。
韩瑜[6](2020)在《低成本大规模MIMO无线传输理论与关键技术研究》文中研究表明移动通信发展至今,已渗透到人类社会的方方面面。移动社交网络、移动多媒体等业务的兴起对数据传输速率的提升、应用类型的多样化提出更高要求。为满足客户日益增长的移动通信需求,大规模多输入多输出(MIMO,Multiple Input Multiple Output)技术应运而生。通过在基站端配置大量天线,大规模MIMO可以充分挖掘空间自由度,增强空间分集与复用技术,显着提升频谱效率。大规模MIMO技术虽已证明其有效性并初步投入商用,但在进一步大规模部署过程中仍存在成本过高的问题,主要体现在射频链路造价过高、密集布站成本过高、信道估计开销过大、以及估计算法耗时过长等方面。本文将针对上述问题,从硬件成本、资源开销、算法复杂度等多个角度寻找节约成本的方法,研究低成本的大规模MIMO无线传输理论与关键技术。首先,研究基于离散傅里叶变换(DFT,Discrete Fourier Transform)的混合波束成形多用户传输系统,从硬件方面降低成本,解决射频链路造价过高问题。为设计其模拟波束选择方案,首先固定波束,分析此时上下行链路分别采用迫零和最大比合并接收机、以及迫零和最大比发送预编码器下的遍历可达速率近似值。基于上述理论结果,设计最大化遍历可达速率的波束选择方法,重点提出一种两步波束选择算法,能够在较短时间内获得近似最优的波束选择结果。仿真结果证明了遍历可达速率的紧性以及所提出的两步选择方案的有效性。其次,研究大规模智能超表面(LIS,Large Intelligent Surface)辅助型大规模MIMO系统,从硬件方面降低成本,解决密集布站成本过高问题。为提升LIS辅助型大规模MIMO系统遍历频谱效率,首先研究基站端发送机制,在推导不同预编码方案的遍历可达速率上界后,发现同时利用原始链路与辅助链路的预编码方案具有最优性。随后研究LIS相移机制,提出基于统计信道状态信息的最优相移设计方案,并考虑硬件限制,进一步推导出LIS移相器量化比特数与遍历频谱效率损失量的关系式。仿真结果证明了2比特量化即可保证遍历频谱效率损失不超过1 bit/s/Hz。随后,面向频分双工(FDD,Frequency Division Duplex)多天线系统,研究一种上行辅助的下行信道重建方法,从资源消耗方面降低成本,解决信道估计开销过大问题。基于FDD上下行信道空间互易性,利用路径时延和角度的频率无关性,通过上行探测过程估计这两种频率无关性参数。在证明了下行估计路径复衰落因子的必要性后,通过下行训练将其估计并反馈至基站,此时导频及反馈开销均较低。为同时估计时延和角度,引入并增强了牛顿正交匹配追踪(NOMP,Newtonized Orthogonal Matching Pursuit)算法,并理论证明了增强型NOMP算法的准确性。软件仿真和硬件实测结果表明,所提的上行辅助的下行信道重建方法可以获得近似于真实信道的重建结果。接下来,研究上行辅助的下行信道重建方法在FDD三维(3D,3-Dimensional)多用户大规模MIMO系统中的应用。针对3D多用户场景,提出一种高效的下行训练方案,从资源消耗方面降低成本,解决信道估计开销过大问题。首先提出e NOMP算法,可以同时估计时延、下倾角、和方位角这三种频率无关性参数。进一步提出了一种低开销的下行训练方案,基于码本,化用户专用导频为小区公共导频,保证仅用少量导频即可将复衰落因子的估计误差控制在可接受范围内,完成多用户下行信道的低开销重建。仿真结果证明了e NOMP算法的估计准确性,并且证实了利用重建信道以及利用完美CSI来设计下行链路多用户传输方案,可以得到近似相同的多用户系统可达速率。之后,面向FDD多用户大规模MIMO系统,提出一种下行时变信道跟踪方法,从资源消耗和算法复杂度两个方面降低成本,同时解决信道估计开销过大和接收机算法耗时过长这两种问题。上行链路以较低的算法复杂度跟踪每个用户的频率无关性参数,利用前序时刻参数跟踪结果,仅依托稀疏的上行探测信号即可高效地跟踪已有路径,找出消失路径,并检测新生路径。下行链路以较低的导频开销估计所有用户的复衰落因子,采用K均值聚类算法进行导频设计,使导频数目可预设。仿真结果证实了所提跟踪方法的有效性及鲁棒性,并建议频繁跟踪信道,以维持较高的多用户频谱效率。最后,面向FDD超大规模MIMO系统,提出一种模型驱动的基于深度学习的下行信道重建方案,进一步从算法复杂度方面降低成本,解决信道估计算法耗时过长问题。考虑到超大规模MIMO系统空间非平稳特性,同时为加速信道重建过程,引入一种高效的目标检测神经网络,实现角度、时延的快速检测以及空间非平稳的识别。为提升估计精度,配合使用一种低复杂度的基于算法的优化模块,将网络所得参数估计值进一步精调。仿真结果表明,该方案可以快速准确地重建非平稳信道,回退到空间平稳场景后,可在百分之一的时间开销内达到和增强型NOMP算法相同的重建准确性。
朱志强[7](2020)在《隧道视觉检测中的图像高压缩比算法研究》文中进行了进一步梳理传统的隧道检修方法主要依靠经验丰富的检修工人搭载云梯车去完成,这种检修方法效率不高。随着智能制造技术的不断发展成熟,基于视觉的隧道检修方法逐渐成为一种新的趋势,并逐渐代替传统的人工检修方法。但是基于视觉的隧道检测系统往往会产生数以万计的隧道图像,导致巨大的图像存储空间开销。通用图像压缩方法未考虑隧道表面图像的特性,其压缩比还不够显着减少隧道图像存储开销。因此,本文针对此问题研究高压缩比的隧道图像压缩方法。论文的主要工作和创新点如下:(1)提出了一种基于稀疏编码方法的隧道图像高压缩比方法。分析了隧道图像一致性强和同质性高的特点,同时考虑隧道图像内容中不同图像块之间的差异性,设计了一种基于图像内容差异性的自适应编码算法,即对于包含图像内容丰富的纹理区域分配较多的编码系数,相反对于类似背景等区域则分配较少的编码系数。此外,针对稀疏编码系数本身设计了一种简单高效的非均匀量化方法,进一步提高编码效率。通过和现有的压缩方法相比,本文提出的隧道图像压缩方法实现了更好的压缩比以及更好的重构图像质量,尤其是在比特率低于0.05bpp时,本文提出的基于稀疏编码的隧道图像压缩方法获得了较JPEG和JPEG2000相比更高的峰值信噪比和更好的图像质量。(2)提出了一种基于变分自编码器的隧道图像压缩方法。该方法应用深度学习技术,首先,在编码阶段,将待压缩的隧道图像输入编码网络,然后经过一系列的卷积神经网络进行特征提取,不断的降低输入隧道图像的空间分辨率,得到隧道图像在隐空间的特征表示,最后利用量化技术得到压缩之后的数据。在解码阶段,首先将量化之后的数据进行反量化操作,然后将反量化之后的数据输入到解码网络,利用解码网络对特征图进行上采样操作,得到重构之后的图像。在实验阶段,通过将提出的基于变分自编码网络的隧道图像压缩方法和其他的图像压缩方法进行比较,验证提出方法的有效性。
包文博[8](2020)在《视频帧率上变换的递推建模与深度学习方法研究》文中研究说明近年来随着高品质显示设备的快速发展,为它们提供具有更高时间和空间分辨率的高质量视频源成为学术界和工业界迫在眉睫的研究课题。然而受制于高质量视频对视频采集、编码、传输、解码等各阶段所需要的计算能力和传输带宽的苛刻要求,将现有海量的中低质量视频通过数字信号处理的方式合成转换为高质量视频成为最可行的方案之一。在视频质量提升的研究中,从时间域上对视频的帧率进行提升是其中最具挑战的问题之一,也是最能直接给用户带来沉浸式视觉体验的关键技术。具体来讲,视频帧率上变换的目标就是在低帧率如30Hz的视频源中插入一些额外的图像帧而得到高帧率如60Hz或120Hz的高帧率视频。插入的额外的视频图像帧能够使帧间物体位移更精细,物体运动过渡的视觉效应更为平滑,从而显着改善运动视频的观赏体验。视频帧率上变换中的两个核心步骤分别是运动估计和运动补偿插帧。其中运动估计又被称为光流估计,目的是估计出原始视频帧中物体的二维运动矢量,也称光流矢量。由于光流估计是补偿插帧的前置步骤,所以由它计算出的运动矢量的优劣直接关系到最终内插帧的质量。本论文针对运动估计问题,首次对光流估计进行了基于Kalman滤波的时域递推建模,并提出了对应的递推估计算法,超越了传统光流估计局限于两帧图像之间的单个光流场的估计算法。本文以Kalman滤波系统为基础,利用视频序列中物体运动的时域相关性和空间域上下文信息,对具有连续多帧图像的视频光流场进行最优估计。在所提出的滤波系统中,每一个像素在多帧图像中的运动被定义为一个二阶时变状态向量,根据滤波器的测量噪声水平和系统噪声水平,由最大化后验估计准则最优地估计出状态向量的值。在MPI Sintel、Monkaa和Driving等多个知名视频数据集上的实验结果表明,本文所提出方法的性能超越了当时领先的算法,所生成的视频光流场在时间域上具有更好的连续性,为后续的视频内插帧生成和处理任务奠定了良好的基础。本文接着对于视频运动补偿插帧提出了基于高阶建模和动态滤波的帧率上变换算法,该模型超越了传统视频插帧模型的亮度时间不变性和物体运动线性性两个基本限制,对像素的亮度和运动分别建立高阶模型,将求解中间帧的问题转化为对高阶模型多项式系数的估计,从而使所提出的视频上变换算法能够适应复杂光照、非线性运动等更具挑战的场景。从物理意义上来讲,这些系数分别代表了物体像素亮度的变化率、物体像素的运动速度和加速度等。为了求解这些模型系数,本文提出了两个能量目标函数:第一个能量目标是根据过去的样本,最小化亮度变化率的自回归估计误差,第二个能量目标是在沿着像素运动的轨迹上,最小化图像帧的重构误差。为了高效地求解这两个能量函数,本文从视频的时域相关性出发提出了一种高效的动态滤波方案。大量实验表明,在自然视频数据和合成视频数据上,无论是做主观还是客观视觉质量对比,该算法都取得了当时最好的性能。随着近年来基于深度学习的人工神经网络在自动抽取特征方面的卓越表现,本文通过将深度学习网络整合到经典的运动估计和运动补偿插帧框架中,首次构建了基于运动估计和运动补偿的模型驱动神经网络框架(称为MEMC-Net),提出了一种全新的自适应卷积核补偿采样网络层,用于同时整合光流场和插值卷积核以及合成目标图像的像素。该网络层是完全可微分的,因此用于估计光流和插值核的神经网络能够被联合地训练优化。该框架具有广泛的适应性,不仅可以应用于视频帧率上变换,而且还可以拓展到其它视频增强任务,如视频超分辨、视频去噪以及视频去块效应等等。在大范围的数据集上进行的广泛实验表明,本文所提出的算法的性能超越了目前业界最领先的视频插帧算法和视频增强算法。在MEMC-Net的基础之上,本文进一步提出了基于物体景深感知的视频帧率上变换算法。这是本领域多年来首次探索场景深度信息对视频内插帧合成有效性的研究工作,为相关领域开辟出了一个全新的研究方向。本文通过探索视频场景中物体的深度信息,导出了插帧过程中闭塞信息检测的显式表达式,创新性地提出了一种场景深度感知的光流映射网络层并将它用于合成中间待插视频帧的光流场。该网络层有选择性地对近距离的物体进行采样,而不是远距离的物体进行采样,还通过学习多层次的特征从邻域像素中收集上下文信息。基于前述的自适应卷积核补偿采样网络层,本文提出的模型从输入参考帧像素、场景深度图以及上下文特征中合成出最终的内插帧。在大范围的数据集上的实验表明,本文所提出的算法具有比业界最领先的视频插帧算法和视频增强算法更好的性能。综上所述,本文专注于视频帧率上变换中这个视频质量增强的关键问题,对其运动估计和运动插帧两个核心问题,分别提出了基于Kalman滤波递推新模型的视频运动估计算法和超越传统简单模型的高阶模型和高效动态滤波的插帧方法。基于近年来发展起来的深度学习方法,本文首次对视频帧率转换建立了MEMC模型驱动的深度学习框架,并首次将场景深度感知信息应用于帧频上转换。以上新算法经大范围的数据集验证,取得了超越以往方法的优异性能。
付茜雯[9](2020)在《计算机科技论文摘要的机翻错误类型及译后编辑》文中研究表明科研论文在知识传播过程中作用重大,推动国际范围内的知识共享。摘要是科研论文中必不可少的一部分,既是对论文的概括性总结,也是读者发现和探寻相关领域知识的快捷途径。然而,目前英文摘要的机器翻译质量在精确性和专业性方面都不尽人意,需要通过后期编辑和人工校对才能产出高质量的中文翻译文本。本文以计算机科学论文摘要为例,对谷歌机器翻译的300篇计算机英文论文摘要的中文版本进行了翻译错误类型分析并归类,并提出相应的译后编辑策略。首先在赖斯文本类型理论翻译策略指导下,对机器翻译系统生成的译文进行译后编辑,再邀请计算机专业以及翻译专业的专业人士进行确认。之后以DQF-MQM错误类型分类框架为依据,对机器翻译系统生成的译文中的错误进行分类。研究发现,机器翻译的计算机英文论文摘要的中文版本中存在七大类翻译错误,其中不符合中文表达习惯的翻译错误占比最大,其次是术语误译、误译、欠译、漏译、过译以及赘译。本论文研究发现,由于源文本的信息型学术文本特征,长难句、被动语态以及术语翻译是造成机器翻译错误的主要原因。针对源文本的逻辑缜密、语步序固定等特征,本研究针对性地对各类错误类型提出了相应译后编辑策略。建议译者在译后编辑中通过将隐性连接转换为显性连接从而保持源文逻辑性,通过增加主语以及调整语序处理被动语态保持源文的学术精准,通过恰当选取词意处理半技术词汇等。本研究采用定性和定量分析方法,系统归类了计算机科技文本摘要中机器翻译出现的错误,并提出相应译后编辑策略,为该领域的译者提供参考建议,从而提高该领域的机器翻译质量。
马常月[10](2020)在《视频编码中的精准预测模型研究》文中提出近年来,快速发展的高清电视、视频直播、视频监控等各种视频应用迫切需要拥有更高压缩效率的视频编码技术。当前,国际视频编码标准高性能视频编码(High Efficiency Video Coding,HEVC)基于混合视频编码框架,主要包括基于块的帧内/帧间预测、变换、量化、熵编码以及环路滤波等步骤。在视频信号平稳性的假设前提下,HEVC中的各个模块依据信号处理理论人工设计。然而,实际中的视频信号往往是非平稳信号,这就导致HEVC各个模块的设计不是那么精准,从而无法有效去除视频信号内存在的冗余,限制了视频编码性能的提升。一方面,HEVC帧间预测的参考内容为与当前帧相邻的多参考帧。这些参考帧中的内容往往高度相似,从而造成有限的参考缓存空间的浪费。此外,在交通监控视频中,外表相似的车辆重复出现,背景保持长期稳定,而多参考帧机制无法有效利用这一先验特性;另一方面,HEVC帧内编码模式中采用的离散余弦变换或离散正弦变换为非最优的线性变换,当前变换块变换后的系数间可能依然存在相关性。此外,考虑到HEVC帧内预测为简单的角度预测,当前变换块系数与周围块系数之间的相关性可能依然存在。针对HEVC中存在的上述问题,本文分别提出了基于参考信息建模的帧间预测编码方法和基于深度学习建模的变换系数预测编码方法。其中,前者包含面向通用视频设计的基于图像片的帧间预测参考信息模型和面向交通监控视频设计的基于库的前、背景参考信息模型,后者包含基于深度学习的变换系数熵编码方案和基于深度学习的变换系数预测方案。论文的主要工作和创新如下:(1)本文针对HEVC中多参考帧机制可能存在的参考缓存空间浪费问题提出了基于图像片的帧间预测参考信息模型。在限定的参考缓存空间内,通过将部分的参考帧空间用来存储比参考帧粒度更小的图像片(从参考帧上截取的子图),在平衡视频信号噪声的同时,参考缓存空间中可以包含更多被遮挡物体的露出部分,从而可以为帧间预测建立更加精准的参考信息模型。为了实现基于图像片的帧间预测参考信息模型,本文设计了相应的图像片生成、图像片管理以及图像片利用模块。我们将基于图像片的帧间预测参考信息模型实现在HEVC的编码框架下,实验结果表明,本文提出的基于图像片的帧间预测参考信息模型可以显着提升视频编码的性能。(2)本文基于观察到的交通监控视频中存在的前、背景长期重复特性提出了基于库的前、背景参考信息模型。在交通监控视频的前期,我们将背景和车辆提取出来,分别去除所提背景和车辆之间存在的冗余性,将剩余的车辆和背景保存在数据库中。在后期的交通监控视频编码中,待编码视频帧分割出的车辆和背景可以通过检索匹配数据库中的车辆和背景,从而为待编码视频帧提供更加精准的参考信息。我们将基于库的前、背景参考信息模型实现在HEVC的编码框架下,实验结果表明,本文为交通监控视频提出的基于库的前、背景参考信息模型在实际拍摄的交通监控序列上可以显着提升视频编码的性能。(3)本文针对HEVC中变换系数之间仍然存在的相关性提出了基于深度学习建模的变换系数预测编码方法。由于变换系数之间的相关性采用传统方法难以描述,本文采用深度学习技术中的神经网络对当前变换块系数之间、当前变换块系数与周围块系数之间的相关性进行精准的建模。具体的,通过采用神经网络对各个帧内预测残差变换系数的概率分布进行估计,本文提出了基于深度学习的帧内预测残差变换系数熵编码方案;通过采用神经网络对各个帧内预测残差变换系数的值进行估计,本文提出了基于深度学习的帧内预测残差变换系数预测方案。我们将上述基于深度学习的帧内预测残差变换系数熵编码方案和预测方案分别实现在HEVC的编码框架下,实验结果表明,两种方案都可以明显提升视频编码的性能。
二、AN EFFICIENT FAST ENCODING ALGORITHM FOR VECTOR QUANTIZATION(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、AN EFFICIENT FAST ENCODING ALGORITHM FOR VECTOR QUANTIZATION(论文提纲范文)
(1)基于嵌入式GPU平台深度学习算法的加速与优化(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 研究现状与问题 |
1.3 GPU及嵌入式GPU概述与对比 |
1.3.1 GPU与深度学习 |
1.3.2 嵌入式GPU平台Jetson TX2 |
1.4 论文的主要内容及组织结构 |
第二章 深度学习网络加速与优化方法综述 |
2.1 网络结构设计 |
2.2 网络剪枝 |
2.2.1 细粒度剪枝 |
2.2.2 矢量级剪枝和内核级剪枝 |
2.2.3 群组级剪枝 |
2.2.4 滤波器级剪枝 |
2.3 低秩近似 |
2.3.1 二组分解 |
2.3.2 三组分解 |
2.4 网络量化 |
2.4.1 标量和矢量量化 |
2.4.2 定点数量化 |
2.5 底层平台优化 |
2.5.1 硬件加速 |
2.5.2 编译优化 |
2.6 其他方法 |
2.6.1 蒸馏网络 |
2.6.2 自动网络压缩 |
2.7 本章小结 |
第三章 基于嵌入式GPU平台目标检测算法的设计与优化 |
3.1 基于深度学习的目标检测算法 |
3.1.1 一步目标检测算法 |
3.1.2 两步目标检测算法 |
3.2 主流目标检测算法在Jetson TX2 平台上的部署与测试 |
3.2.1 Roofline测试模型 |
3.2.2 一步目标检测算法的Roofline测试分析 |
3.3 高效目标检测算法 |
3.3.1 深度可分离卷积 |
3.3.2 基本网络结构 |
3.3.3 通道剪枝 |
3.3.4 整体网络剪枝策略 |
3.4 算法训练、部署与评估 |
3.4.1 算法训练与部署 |
3.4.2 算法性能测试 |
3.5 本章小结 |
第四章 微小人脸检测系统及其性能优化 |
4.1 基础算法介绍 |
4.1.1 SSD目标检测算法 |
4.1.2 S3FD人脸检测算法 |
4.2 基于TensorRT的微小人脸检测 |
4.2.1 TensorRT简介 |
4.2.2 基于CUDA的网络层添加 |
4.2.3 模型的实际优化 |
4.3 微小人脸检测量化模型 |
4.3.1 INT8及FP16 量化原理 |
4.3.2 模型的实际优化 |
4.4 微小人脸检测系统框架 |
4.5 本章小结 |
第五章 总结与展望 |
5.1 本文主要工作总结 |
5.2 后续研究方向 |
参考文献 |
致谢 |
攻读学位期间发表的学术论文 |
(2)矢量量化编码算法及其VLSI结构设计的研究(论文提纲范文)
摘 要 |
Abstract |
1 绪 论 |
1.1 课题研究的目的和意义 |
1.2 矢量量化技术的发展历程 |
1.3 矢量量化编码算法的研究现状 |
1.4 矢量量化VLSI结构的研究现状 |
1.5 本文主要工作及结构安排 |
2 图像压缩方法回顾 |
2.1 引言 |
2.2 离散余弦变换 |
2.3 离散小波变换 |
2.4 矢量量化 |
2.5 本章小结 |
3 矢量量化的码书设计 |
3.1 引言 |
3.2 常用的初始码书的生成方法 |
3.3 码书设计方法回顾 |
3.4 码书设计 |
3.5 码书设计的仿真结果 |
3.6 本章小结 |
4 矢量量化编码算法 |
4.1 引言 |
4.2 快速编码算法回顾 |
4.3 金字塔数据结构 |
4.4 基于金字塔结构的多级不等式 |
4.5 初始匹配码字的选取 |
4.6 码字搜索方式 |
4.7 码字删除准则 |
4.8 码字索引空间 |
4.9 算法描述 |
4.10 仿真实验 |
4.11 性能分析 |
4.12 本章小结 |
5 矢量量化编码算法的VLSI结构设计 |
5.1 引言 |
5.2 矢量量化编码算法结构设计的关键技术 |
5.3 矢量量化编码算法的体系结构 |
5.4 存储模块 |
5.5 控制模块 |
5.6 平方和累加模块 |
5.7 平方根模块 |
5.8 初始码字匹配模块 |
5.9 码字循环匹配模块 |
5.10 本章小结 |
6 矢量量化编码算法的VLSI实现与仿真验证 |
6.1 引言 |
6.2 矢量量化静止图像编码系统 |
6.3 功能仿真 |
6.4 设计验证 |
6.5 本章小结 |
7 总结与进一步的工作 |
7.1 本文的研究工作 |
7.2 本文的创新点 |
7.3 进一步的工作 |
致 谢 |
参考文献 |
附录1 攻读博士学位期间发表的论文目录 |
(3)基于机器视觉的目标检索方法研究(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景及意义 |
1.2 当前研究现状 |
1.3 主要研究内容 |
1.4 论文组织结构 |
2 相关研究基础 |
2.1 引言 |
2.2 目标检测方法研究 |
2.2.1 双阶目标检测技术 |
2.2.2 单阶目标检测技术 |
2.3 特征表达 |
2.3.1 基于传统的手工特征提取 |
2.3.2 基于深度学习的特征提取 |
2.4 目标检索 |
2.4.1 简单相似图像检索 |
2.4.2 多标签图像检索 |
2.4.3 相似性度量方法 |
2.4.4 图像检索数据集 |
2.4.5 性能评价指标 |
2.5 本章小结 |
3 基于空洞卷积和上下文信息的目标检测算法研究 |
3.1 引言 |
3.2 空洞卷积 |
3.3 条纹池化 |
3.4 基于空洞卷积和上下文信息的目标检测方法研究 |
3.4.1 EASNet主干网络结构的构建 |
3.4.2 EASModule特征融合 |
3.4.3 EASHead损失函数设计 |
3.5 实验结果与分析 |
3.5.1 实验设置 |
3.5.2 实验结果及对比 |
3.6 本章小结 |
4 基于多层级的特征融合方法研究 |
4.1 引言 |
4.2 多层级特征融合结构 |
4.3 基于卷积神经网络的分层池化和量化 |
4.4 多层级特征融合方法 |
4.5 实验与分析 |
4.5.1 实验设置 |
4.5.2 实验结果与评价 |
4.6 本章小节 |
5 基于哈希索引的大规模目标快速检索方法研究 |
5.1 引言 |
5.2 哈希算法 |
5.3 汉明空间近邻搜索 |
5.4 基于分块字典树的精确r近邻搜索 |
5.4.1 目标搜索流程 |
5.4.2 分块多叉字典树 |
5.4.3 基于MBNT的精确r近邻搜索 |
5.5 实验结果与分析 |
5.5.1 数据集选择和评测指标 |
5.5.2 多尺度目标搜索的平均准确率 |
5.5.3 MBNT索引结构关键参数设置 |
5.5.4 多尺度目标搜索的平均检索时间 |
5.5.5 近似搜索和精确搜索算法对比 |
5.6 本章小结 |
6 面向公安场景的视频目标检测与检索应用 |
6.1 引言 |
6.2 视频目标检测与检索应用系统设计 |
6.2.1 系统架构设计 |
6.2.2 视图解析子系统 |
6.2.3 目标检索子系统 |
6.3 实验应用效果 |
6.3.1 硬件环境配置 |
6.3.2 验证场景说明 |
6.3.3 验证方案设计 |
6.3.4 验证结果说明 |
6.4 本章小节 |
7 总结与展望 |
7.1 工作总结 |
7.2 工作展望 |
参考文献 |
作者简历及攻读博士学位期间取得的研究成果 |
学位论文数据集 |
(4)面向智能通信的先进收发机理论与关键技术(论文提纲范文)
摘要 |
abstract |
英文缩略语 |
第一章 绪论 |
1.1 论文的研究背景 |
1.2 6G的发展现状 |
1.2.1 6G愿景 |
1.2.2 6G技术指标与应用场景 |
1.2.3 6G主要技术方向 |
1.3 智能通信的研究现状 |
1.3.1 深度学习技术 |
1.3.2 基于自动编码器的通信系统设计 |
1.4 论文的主要工作 |
1.5 符号说明 |
第二章 基于模型驱动深度学习的先进收发机设计 |
2.1 引言 |
2.2 模型驱动深度学习 |
2.3 基于数据驱动深度学习的收发机设计 |
2.3.1 基于数据驱动深度学习的联合信道估计和信号检测 |
2.3.2 基于数据驱动深度学习的信道估计和跟踪 |
2.3.3 基于数据驱动深度学习的信号检测 |
2.3.4 基于数据驱动深度学习的MIMO预编码 |
2.4 基于模型驱动深度学习的收发机设计 |
2.4.1 基于模型驱动深度学习的MIMO检测器 |
2.4.2 基于模型驱动深度学习的OFDM接收机设计 |
2.4.3 基于模型驱动深度学习的CSI反馈 |
2.4.4 基于模型驱动深度学习的大规模MIMO预编码 |
2.5 本章小结 |
第三章 毫米波低精度量化MIMO-OFDM系统先进接收机设计 |
3.1 引言 |
3.2 系统模型 |
3.3 贝叶斯最优接收机 |
3.3.1 贝叶斯接收机 |
3.3.2 期望一致性信号恢复算法 |
3.3.3 基于OFDM技术的低复杂度实现 |
3.3.4 混合精度ADC信号检测 |
3.4 状态演化分析 |
3.4.1 易拓展性 |
3.4.2 最优性 |
3.4.3 通用性和计算简单性 |
3.5 数值结果 |
3.5.1 解析结果的精确性 |
3.5.2 混合精度ADC性能 |
3.6 本章小结 |
3.7 附录 |
3.7.1 命题1的证明 |
3.7.2 自由能鞍点的推导 |
第四章 基于模型驱动深度学习的毫米波波束域大规模MIMO系统信道估计 |
4.1 引言 |
4.2 窄带毫米波波束域大规模MIMO系统信道估计 |
4.2.1 系统模型 |
4.2.2 基于LDAMP网络的信道估计器 |
4.2.3 状态演化分析 |
4.2.4 数值结果 |
4.3 宽带毫米波波束域大规模MIMO系统信道估计 |
4.3.1 系统模型 |
4.3.2 基于LDGEC网络的信道估计器 |
4.3.3 数值结果 |
4.4 本章小结 |
第五章 基于模型驱动深度学习的MIMO系统信号检测 |
5.1 引言 |
5.2 联合信道估计和信号检测 |
5.2.1 系统模型 |
5.2.2 考虑信道估计误差的信号检测 |
5.2.3 数据辅助的信道估计 |
5.3 LMMSE信道估计器 |
5.4 基于模型驱动深度学习的MIMO检测器 |
5.4.1 OAMP检测器 |
5.4.2 线性估计器 |
5.4.3 非线性估计器 |
5.4.4 OAMP-Net2 检测器 |
5.4.5 复杂度分析 |
5.4.6 软输入软输出 |
5.4.7 训练部署 |
5.5 数值结果 |
5.5.1 实现细节 |
5.5.2 完美CSI下OAMP-Net2检测器性能 |
5.5.3 JCESD性能 |
5.5.4 鲁棒性分析 |
5.6 本章小结 |
5.7 附录 |
5.7.1 附录A:协方差矩阵的推导 |
5.7.2 附录B:误差方差估计量的推导 |
第六章 基于模型驱动深度学习的多用户大规模MIMO系统预编码 |
6.1 引言 |
6.2 多用户大规模MIMO系统有限字符预编码 |
6.2.1 系统模型 |
6.2.2 问题表述 |
6.2.3 IDE2预编码器 |
6.2.4 数值结果 |
6.3 多用户大规模MIMO系统恒包络预编码 |
6.3.1 系统模型和问题表述 |
6.3.2 CEPNet |
6.3.3 数值结果 |
6.4 本章小结 |
第七章 总结与展望 |
7.1 全文总结及主要贡献 |
7.2 未来工作展望 |
参考文献 |
作者攻读博士学位期间的研究成果 |
致谢 |
(5)高光谱遥感图像压缩自适应预测器优化研究(论文提纲范文)
致谢 |
摘要 |
abstract |
变量注释表 |
1 绪论 |
1.1 研究背景 |
1.2 课题研究的意义 |
1.3 课题国内外研究现状 |
1.4 论文结构安排 |
2 高光谱遥感图像压缩相关理论 |
2.1 数据压缩的相关理论 |
2.2 本文中用到的编码介绍 |
2.3 图像压缩标准中的无损压缩 |
2.4 高光谱数据相关性的定义 |
2.5 本章小结 |
3 自适应预测器的优化设计 |
3.1 三维空间预测方法 |
3.2 谱空联合预测方法 |
3.3 自适应预测器 |
3.4 本章小结 |
4 实验分析与结果 |
4.1 实验数据与环境说明 |
4.2 实验结果对比与分析 |
4.3 本章小结 |
5 结论与展望 |
5.1 本文算法的总结 |
5.2 算法的不足和可扩展研究之处 |
5.3 未来展望和可研究方向 |
参考文献 |
作者简历 |
学位论文数据集 |
(6)低成本大规模MIMO无线传输理论与关键技术研究(论文提纲范文)
摘要 |
Abstract |
英文缩略语 |
第一章 绪论 |
1.1 研究背景 |
1.2 大规模MIMO的成本挑战 |
1.2.1 射频链路造价过高 |
1.2.2 密集布站成本过高 |
1.2.3 信道估计开销过大 |
1.2.4 信道估计算法耗时过长 |
1.3 论文的内容安排 |
1.4 数学符号约定 |
第二章 基于DFT的混合波束成形系统可达速率分析与波束选择 |
2.1 引言 |
2.2 系统模型 |
2.2.1 混合波束成形 |
2.2.2 信道模型 |
2.2.3 信号模型 |
2.3 上行可达速率分析 |
2.3.1 ZF接收机 |
2.3.2 MRC接收机 |
2.4 下行可达速率分析 |
2.4.1 ZF预编码器 |
2.4.2 MRT预编码器 |
2.5 模拟波束选择 |
2.5.1 基于可达速率的穷举搜索 |
2.5.2 基于投影能量的用户独立选择(方法一) |
2.5.3 两步选择(方法二) |
2.6 仿真结果 |
2.6.1 评估遍历可达速率近似解 |
2.6.2 评估波束选择方法 |
2.7 本章小结 |
第三章 LIS辅助型大规模MIMO传输方案设计 |
3.1 引言 |
3.2 系统模型 |
3.3 MRT预编码器设计 |
3.3.1 预编码方案一 |
3.3.2 预编码方案二 |
3.3.3 预编码方案三 |
3.4 LIS相移设计 |
3.4.1 莱斯K因子和相移量的影响 |
3.4.2 最优相移设计 |
3.4.3 量化比特的影响 |
3.5 仿真结果 |
3.5.1 评估MRT预编码方案 |
3.5.2 评估LIS相移设计 |
3.5.3 评估LIS辅助型大规模MIMO系统 |
3.6 本章小结 |
第四章 上行辅助的FDD多天线下行信道重建 |
4.1 引言 |
4.2 信道模型 |
4.3 上行辅助的下行信道重建 |
4.3.1 信道重建流程 |
4.3.2 下行训练及反馈的必要性 |
4.3.3 下行复衰落因子估计 |
4.4 频率无关性参数估计 |
4.4.1 增强型NOMP算法 |
4.4.2 过采样(μ,ν)码本设计 |
4.4.3 增强型牛顿精调过程 |
4.4.4 停止准则 |
4.4.5 算法复杂度分析 |
4.4.6 估计准确性 |
4.5 仿真结果 |
4.5.1 软件仿真结果 |
4.5.2 OTA测试结果 |
4.6 结论 |
第五章 FDD多用户3D MIMO下行信道重建 |
5.1 引言 |
5.2 系统模型 |
5.2.1 信道模型 |
5.2.2 多用户下行信道重建 |
5.3 频率无关性参数提取 |
5.3.1 上行导频模型 |
5.3.2 eNOMP算法 |
5.4 多用户下行信道重建 |
5.4.1 估计成功的条件 |
5.4.2 3D空间网格 |
5.4.3 下行训练策略 |
5.4.4 导频及反馈开销 |
5.5 多用户传输可达速率 |
5.6 仿真结果 |
5.6.1 评估eNOMP算法 |
5.6.2 评估多用户收发机 |
5.7 本章小结 |
第六章 FDD大规模MIMO时变信道跟踪 |
6.1 引言 |
6.2 系统模型 |
6.2.1 时变信道模型 |
6.2.2 信道跟踪流程 |
6.3 频率无关性参数跟踪模块 |
6.3.1 运行周期 |
6.3.2 跟踪频率无关性参数 |
6.4 频率相关性参数估计模块 |
6.4.1 运行周期 |
6.4.2 下行复衰落因子估计 |
6.4.3 下行小区公共导频 |
6.4.4 基于K均值聚类的波束设计方法 |
6.5 仿真结果 |
6.5.1 评估频率无关性参数跟踪模块 |
6.5.2 评估频率相关性参数估计模块 |
6.6 本章小结 |
第七章 基于深度学习的超大规模MIMO信道估计 |
7.1 引言 |
7.2 系统模型 |
7.2.1 空间非平稳 |
7.2.2 信道模型 |
7.3 基于深度学习的参数提取 |
7.3.1 问题描述 |
7.3.2 信道图像生成 |
7.3.3 引入YOLO |
7.3.4 基于YOLO的参数估计 |
7.4 下行信道重建 |
7.4.1 空间非平稳检测模块 |
7.4.2 角度时延精调模块 |
7.4.3 下行复衰落因子估计模块 |
7.4.4 讨论 |
7.5 仿真结果 |
7.5.1 评估基于深度学习的参数估计 |
7.5.2 评估角度时延精调模块 |
7.5.3 评估下行信道重建结果 |
7.6 结论 |
第八章 总结与展望 |
8.1 全文总结及主要贡献 |
8.2 未来工作展望 |
参考文献 |
作者攻读博士学位期间的研究成果 |
致谢 |
(7)隧道视觉检测中的图像高压缩比算法研究(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 传统图像压缩技术 |
1.2.2 基于稀疏编码的图像压缩技术 |
1.2.3 基于深度学习的图像压缩技术 |
1.3 本文主要研究工作 |
1.3.1 本文研究内容及其创新点 |
1.3.2 论文组织结构 |
2 相关研究工作综述 |
2.1 稀疏编码的基本原理 |
2.1.1 稀疏表示的生理基础 |
2.1.2 信号的稀疏表示 |
2.1.3 字典的构建 |
2.1.4 稀疏分解 |
2.2 深度学习理论基础 |
2.2.1 卷积神经网络 |
2.2.2 变分自编码网络 |
2.3 图像压缩的评价指标 |
2.3.1 图像压缩程度的度量 |
2.3.2 图像重构质量的度量 |
2.4 本章小结 |
3 基于稀疏编码的隧道图像压缩方法 |
3.1 引言 |
3.2 基于稀疏编码的隧道图像压缩流程 |
3.2.1 字典训练 |
3.2.2 自适应稀疏编码 |
3.2.3 非均匀量化 |
3.2.4 稀疏重构 |
3.3 实验结果与分析 |
3.3.1 实验设置 |
3.3.2 实验结果与分析 |
3.4 隧道图像压缩系统设计 |
3.5 本章小结 |
4 基于深度学习的隧道图像压缩方法 |
4.1 引言 |
4.2 基于变分自编码的隧道图像压缩流程 |
4.2.1 网络结构 |
4.2.2 损失函数 |
4.3 实验结果与分析 |
4.3.1 实验设置 |
4.3.2 实验结果与分析 |
4.4 本章小结 |
5 结论 |
参考文献 |
作者简历及攻读硕士学位期间取得的研究成果 |
学位论文数据集 |
(8)视频帧率上变换的递推建模与深度学习方法研究(论文提纲范文)
摘要 |
ABSTRACT |
缩略语 |
第一章 绪论 |
1.1 课题研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 基于运动估计与运动补偿的插帧 |
1.2.2 基于深度学习的插帧 |
1.3 论文主要工作 |
1.3.1 上下文感知的Kalman滤波视频光流估计 |
1.3.2 基于高阶模型与动态滤波的视频帧率上变换 |
1.3.3 MEMC模型驱动的深度学习视频帧率上变换 |
1.3.4 融合场景深度的视频帧率上变换 |
1.4 章节安排 |
第二章 上下文感知的Kalman滤波视频光流估计 |
2.1 引言 |
2.2 相关研究工作 |
2.2.1 基于变分优化框架的光流估计 |
2.2.2 基于损失空间搜索的光流估计 |
2.2.3 基于卷积神经网络的光流估计 |
2.3 Kalman滤波视频光流估计 |
2.3.1 视频光流场的Kalman滤波算法 |
2.3.2 视频帧间Kalman滤波器的递推 |
2.4 上下文感知的Kalman滤波器系统噪声估计 |
2.4.1 上下文信息提取 |
2.4.2 系统噪声估计 |
2.5 时域相关性增强的Kalman滤波器的测量噪声估计 |
2.6 实验结果与分析 |
2.6.1 客观指标分析 |
2.6.2 主观质量分析 |
2.6.3 上下文感知模块性能分析 |
2.6.4 参数敏感性分析 |
2.7 本章小结 |
第三章 基于高阶建模与动态滤波的帧率上变换 |
3.1 引言 |
3.2 相关研究工作 |
3.2.1 高阶建模 |
3.2.2 动态滤波 |
3.3 基于高阶模型的帧率上变换模型 |
3.3.1 亮度与运动的高阶建模 |
3.3.2 亮度与运动估计的联合能量函数 |
3.3.3 基于高阶模型的视频帧率上变换 |
3.4 高阶模型的最优估计求解算法 |
3.4.1 先验估计 |
3.4.2 最大似然验估计 |
3.4.3 Kalman滤波器 |
3.4.4 噪声协方差估计 |
3.4.5 能量最小化优化算法 |
3.5 实验结果与分析 |
3.5.1 与现有帧率上变换算法对比 |
3.5.2 高阶运动模型性能评估 |
3.5.3 高阶亮度模型性能评估 |
3.6 本章小结 |
第四章 MEMC模型驱动的深度学习视频帧率上变换 |
4.1 引言 |
4.2 相关研究工作 |
4.2.1 基于运动估计与补偿的经典算法 |
4.2.2 基于神经网络学习的现代算法 |
4.3 MEMC模型驱动的深度学习帧率上变换方法 |
4.3.1 MEMC-Net模型框架 |
4.3.2 基于光流偏移的自适应卷积核采样网络层 |
4.3.3 光流映射网络层 |
4.4 基于MEMC-Net的视频帧率上变换 |
4.4.1 网络模块 |
4.4.2 算法实现细节 |
4.5 MEMC-Net模型在视频增强上的可扩展性 |
4.6 实验结果与分析 |
4.6.1 神经网络模块性能评估 |
4.6.2 视频帧率上变换性能评估 |
4.6.3 MEMC-Net可扩展性分析 |
4.7 本章小结 |
第五章 融合场景深度的视频帧率上变换 |
5.1 引言 |
5.2 相关研究工作 |
5.2.1 视频帧率上变换 |
5.2.2 场景深度估计 |
5.3 融合场景深度的视频帧率上变换方法 |
5.3.1 融合场景深度信息的光流估计 |
5.3.2 融合场景深度的插帧模型 |
5.4 实验结果与分析 |
5.4.1 实验条件与评估指标 |
5.4.2 景深感知的光流映射性能分析 |
5.4.3 多层次上下文提取模块性能分析 |
5.4.4 与当时领先算法的比较 |
5.4.5 场景深度估计性能分析 |
5.4.6 模型参数与运行时间性能分析 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
攻读博士学位期间的科研成果及参与的项目 |
简历 |
(9)计算机科技论文摘要的机翻错误类型及译后编辑(论文提纲范文)
摘要 |
Abstract |
CHAPTER1 INTRODUCTION |
1.1 Research Background and Significance |
1.2 Aims of the Study |
1.3 Organization of the Thesis |
CHAPTER2 LITERATURE REVIEW AND FRAMEWORK |
2.1 Overview on Machine Translation and Post-editing |
2.2 Previous Studies on MT Error Types and Post-Editing Strategies |
2.3 DQF-MQM Error Classification Framework |
2.4 Previous Studies on MT Error Types of Paper Abstracts |
2.5 Text Typology Theory |
2.5.1 Text Typology Theory of Reiss |
2.5.2 Previous Studies on Informative Texts and Translation Principles |
CHAPTER3 METHODOLOGY |
3.1 Source Text and Text Analysis |
3.1.1 Source Text |
3.1.2 Text Analysis |
3.2 Research Method |
3.3 Translation Process |
3.3.1 Translating300 computer science abstracts with MT system |
3.3.2 Post-editing the MT-generated translation based on Text Typology Theory |
3.3.3 Conducting a semi-structured interview for ensuring post-editing quality |
3.3.4 Analyzing and summarizing the errors in300 abstracts |
3.3.5 Preliminary error classifications based on DQF-MQM Framework |
3.3.6 Conducting the2nd semi-structured interview to confirm error classifications |
3.3.7 Quantitative analysis of all MT errors in the300 abstracts |
CHAPTER4 RESULTS AND DISCUSSION |
4.1 Error Types of Machine Translated English Abstracts |
4.1.1 Unidiomatic Translation Errors in MT output |
4.1.2 Terminology Mistranslation Errors in MT Output |
4.1.3 Mistranslation Errors in MT Output |
4.1.4 Under-translation Errors in MT Output |
4.1.5 Omission Translation Errors in MT Output |
4.1.6 Over-translation Errors in MT Output |
4.1.7 Errors of Addition in MT Output |
4.2 Post-editing Strategies for Machine Translated Abstracts |
4.2.1 Post-editing Strategies for Long and Complex Sentences |
4.2.2 Post-editing Strategies for Passive Voice Sentences |
4.2.3 Post-editing Strategies for Technical Terms |
CHAPTER5 CONCLUSION |
5.1 Major Findings |
5.2 Limitations and Suggestions |
References |
Appendix Source Texts and Target Texts of300 Abstracts |
1-20 Abstracts |
21-40 Abstracts |
41-60 Abstracts |
61-80 Abstracts |
81-100 Abstracts |
101-120 Abstracts |
121-140 Abstracts |
141-160 Abstracts |
161-180 Abstracts |
181-200 Abstracts |
201-220 Abstracts |
221-240 Abstracts |
241-260 Abstracts |
261-280 Abstracts |
281-300 Abstracts |
ACKNOWLEDGEMENTS |
(10)视频编码中的精准预测模型研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 研究历史和现状 |
1.3 论文主要工作及内容安排 |
第二章 HEVC和深度学习基础知识 |
2.1 HEVC基本编码框架 |
2.2 HEVC帧内预测技术 |
2.2.1 参考像素生成 |
2.2.2 当前像素预测 |
2.2.3 后处理 |
2.3 EEVC帧间预测技术 |
2.3.1 AMVP技术及运动估计 |
2.3.2 Merge模式 |
2.3.3 运动补偿 |
2.4 HEVC变换技术 |
2.4.1 DCT |
2.4.2 DST |
2.5 HEVC熵编码技术 |
2.5.1 CABAC基本编码流程 |
2.5.2 变换系数熵编码过程 |
2.6 深度学习技术基础 |
第三章 基于图像片的帧间预测参考信息模型 |
3.1 现有参考内容组织技术 |
3.1.1 研究动机 |
3.1.2 现有技术 |
3.1.3 本章贡献 |
3.2 基于图像片的帧间预测参考信息模型框架 |
3.3 包含单一内容的图像片生成算法 |
3.4 包含重复内容的图像片生成算法 |
3.4.1 重复内容检测和重复次数估计 |
3.4.2 重复内容的码率分配 |
3.4.3 包含重复内容的图像片生成 |
3.5 图像片管理算法 |
3.6 图像片利用算法 |
3.6.1 图像片检索 |
3.6.2 图像片上的帧间预测 |
3.6.3 码流结构修改 |
3.7 实验结果 |
3.7.1 实验配置 |
3.7.2 实验性能 |
3.7.3 实验分析 |
3.7.4 实验总结 |
3.8 本章小结 |
第四章 基于库的前、背景参考信息模型 |
4.1 监控视频压缩概述 |
4.1.1 研究动机 |
4.1.2 现有监控视频编码技术 |
4.1.3 本章贡献 |
4.2 基于库的前、背景参考信息模型框架 |
4.3 车辆和背景检索 |
4.3.1 车辆和背景分割 |
4.3.2 车辆检索 |
4.3.3 背景检索 |
4.4 车辆和背景利用 |
4.4.1 相似度分析 |
4.4.2 使用车辆和背景进行帧间预测 |
4.4.3 码流结构修改 |
4.5 数据库建立 |
4.5.1 算法 |
4.5.2 实际应用 |
4.6 实验结果 |
4.6.1 实验配置 |
4.6.2 实验性能 |
4.6.3 实验分析 |
4.6.4 实验总结 |
4.7 本章小结 |
第五章 基于深度学习的变换系数熵编码和预测方案 |
5.1 变换系数编码与深度学习编码技术概述 |
5.1.1 研究动机 |
5.1.2 现有变换系数编码与深度学习编码技术 |
5.1.3 本章贡献 |
5.2 基于深度学习的变换系数熵编码方案 |
5.2.1 理论分析 |
5.2.2 概述 |
5.2.3 实现细节 |
5.3 基于深度学习的变换系数预测方案 |
5.3.1 概述 |
5.3.2 神经网络细节 |
5.4 实验结果 |
5.4.1 实验配置 |
5.4.2 实验性能 |
5.4.3 实验分析 |
5.4.4 实验小结 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 论文总结 |
6.2 未来展望 |
参考文献 |
致谢 |
在读期间发表的学术论文与取得的研究成果 |
四、AN EFFICIENT FAST ENCODING ALGORITHM FOR VECTOR QUANTIZATION(论文参考文献)
- [1]基于嵌入式GPU平台深度学习算法的加速与优化[D]. 殷迅. 上海交通大学, 2019(06)
- [2]矢量量化编码算法及其VLSI结构设计的研究[D]. 刘丽娟. 华中科技大学, 2004(02)
- [3]基于机器视觉的目标检索方法研究[D]. 冯栋. 北京交通大学, 2021(02)
- [4]面向智能通信的先进收发机理论与关键技术[D]. 何恒涛. 东南大学, 2020(02)
- [5]高光谱遥感图像压缩自适应预测器优化研究[D]. 秦鹏程. 辽宁工程技术大学, 2020(02)
- [6]低成本大规模MIMO无线传输理论与关键技术研究[D]. 韩瑜. 东南大学, 2020(02)
- [7]隧道视觉检测中的图像高压缩比算法研究[D]. 朱志强. 北京交通大学, 2020(03)
- [8]视频帧率上变换的递推建模与深度学习方法研究[D]. 包文博. 上海交通大学, 2020(01)
- [9]计算机科技论文摘要的机翻错误类型及译后编辑[D]. 付茜雯. 大连理工大学, 2020(06)
- [10]视频编码中的精准预测模型研究[D]. 马常月. 中国科学技术大学, 2020(01)