2023年广西大学计算机与电子信息学院
信息技术研究生论坛(九)
场次一、
时间:2023年05月05日(星期五)16:30-18:30
地点:计算机与电子信息学院509教室
报告题目一:基于手势识别的人机交互技术综述
报告人:周泓宇
报告简介:在众多人机交互技术中,手势识别占据重要的地位,因为人类经常借助手部动作进行信息的传递与反馈,据研究表明人类在传递信息时,手势占据55%的重要性,而声音和文字仅分别占据剩余的45%,由此可以看出手势在表情达意、言传身教中占据着非常重要的地位,手势识别目前也是人机交互的核心技术,具有简明直接、灵活性高、内涵丰富等优点。现代手势识别技术根据其实现方式的不同,可以大致分为电磁波传感识别、力学传感识别、肌电传感识别及视觉传感识别四类。由于不同手势识别方式具有不同的优势,因此国内外对其的各类实现方法展开了长期的研究,本报告将首先对各类实现技术的现状进行介绍,接着分析比较了各类手势识别技术,然后阐述了人机交互技术的应用领域,最后分析未来人机交互技术的研究方向和面临的挑战。
报告题目二:磁光克尔效应探测系统的搭建
报告人:黄锦炫
报告简介:介绍解释磁光克尔的两种效应:磁圆双折射和磁圆二色性。介绍了磁圆双折射和磁圆二色性是如何导致磁光克尔效应的发生。介绍磁光克尔效应宏观理论:电偶极子模型和介电张量理论,其中介电张量理论是现在比较可靠的模型。电偶极子模型是从唯像的理论出发,用电子之间的运动和磁光的关系推导,证明了入射光受磁场的影响而导致左右圆偏振光的折射率不一样,从而导致克尔效应;介电张量理论从公式进行推导,联合麦克斯韦方程和介电张量从电磁场理论出发推导出磁光克尔转角的存在。介绍磁光克尔探测系统的搭建方法,整个系统的原理细节,包括系统的公式推导,系统元器件、实验器件选型、锁相放大器和光学斩波器的使用
报告题目三:基于可穿戴传感器的人体姿态识别
报告人:农恒昌
简介:人体的姿态运动信息广泛应用于运动康复、人机交互、医疗健康及人体姿态评估等领域。通过检测和识别人体特定动作可以为运动员的训练管理、医院患者的康复提供数据支持,同时在虚拟现实、人机交互上也具有广阔的应用前景。随着传感器器件的发展,各类能准确采集人体行为活动数据的传感器在手环、手表、手机等可穿戴设备上得到了广泛使用,相比基于视频图像的行为识别方法,基于传感器的行为识别具有成本低、灵活、可移植性好的特点,因此,基于可穿戴传感器的人体活动识别研究成为行为识别中的研究热点。本次汇报首先介绍了人体活动识别研究中原始数据采集、特征提取、特征选择以及分类方法,对识别流程中每一部分常用的技术以及研究现状进行了综述总结,再结合一个基于三轴加速度计采集人体姿态信息进行人体姿态识别的案例进行具体应用说明。最后分析人体活动识别研究当前存在的主要问题并展望了今后可能的研究方向。
报告题目四:水下拖曳系统水动力性能分析
报告人:韦香宁
报告简介:介绍水下拖曳系统:水下拖曳系统是一种广泛应用于海洋监测的水下环境动态监测系统,它在海洋、湖泊和内河水下环境监测以及水下工程结构检查、海洋资源调查中有着特殊的用途。系统通常由拖船、拖曳电缆、拖曳体以及轨迹与姿态控制机构组成,拖曳体内可根据不同的需要搭载温度、盐度、压力等各种海洋元素探测传感器或声纳、光学摄像头等声、光物理探测传感器。拖曳体的深度和姿态控制可以通过改变拖曳船速度、收放缆绳、改变拖曳体迫沉水翼攻角和控制螺旋桨转速等方式来实现。
水下拖曳系统的动力学建模:主要研究水下拖曳系统在控制机构的作用下产生的轨迹和姿态变化,所以必须把水下拖曳体主体和缆绳以及控制机构耦合为一个系统。由于我们要考虑水下拖曳体的六自由度运动和控制机构的作用,所以不能把拖曳体当做一个质点来处理,必须单列出来考虑。在建立整个拖曳系统的水动力数学模型时,我们必须要考虑每一个构件对系统的水动力的影响以及他们相互之间的影响,即要分别建立表达缆绳、拖曳体主体、控制机构的运动状态的数学方程,并且通过边界条件把三者耦合在一起形成整个系统的水动力数学模型。几何模型的构件和数值计算:介绍求解拖曳体的水动力的过程和方法,方法就是利用CFD软件Fluent中的滑移网格技术和动网格技术,求解流场的N-S方程得到拖曳体受到的水动力。
场次二、
时间:2023年4月24日(星期一)9:00-12:00
地点:计算机与电子信息学院601教室
报告题目一:结合自注意力与Transformer的三维点云序列生成
报告人:马伟钊
报告简介:以往的人物动作生成方法大都是以骨架作为人物姿态的表示,用一系列的骨架表示人物的一个动作,这些方法不能直接处理通过光学动作捕捉所得到的人物表面三维点云序列。本报告介绍一个点云动作序列生成网络PCMG(point cloud motion generation) 方法,既可以处理骨架表示的动作序列生成,也可以处理人物表面点云表示的动作生成。本方法还可以对点数较多的点云序列进行处理,也能生成点云细节保持良好,并且动作语义信息明确的点云。
报告题目二:基于神经网络的姿态迁移方法现状
报告人:杨诗耕
报告简介:受计算机视觉中的图像风格迁移启发,基于神经网络的方法能够在没有提供源模型与参考模型对应关系的条件下进行姿态迁移。这类姿态迁移模型主要是基于编码器-解码器结构的端到端网络,编码器先编码源模型的形状信息与参考模型的姿态信息到隐空间,再利用解码器生成目标模型。然而由于网络特征提取部分与数据集的局限性,端到端网络容易出现过拟合现象,并且生成的模型在细节保持上不尽人意。因此如何在保持深度学习方法无需人为提供先验对应关系优势的同时,提高方法生成模型的细节精度与方法的泛化性,对于深度学习姿态迁移方法的发展和应用是一个重要的课题。
报告题目三:基于结构信息的视觉SLAM
报告人:胡锦飞
报告简介:传统的视觉SLAM算法往往使用点线特征作为算法的主要特征。但点线特征等视觉特征存在一定的局限性,特别是在低纹理场景中。部分学者另辟蹊径,发现在人造场景中往往存在丰富的结构信息。他们将场景中存在三个两两相互垂直的平面结构称之为曼哈顿世界,并依托这种特殊的结构设计出了一种独特的位姿估计方式,与传统方法相比,基于曼哈顿世界的位姿估计方法更为准确,所产生的飘逸误差更小。这种区别与传统点线特征的结构信息在视觉SLAM算法中有重大的研究意义。
报告题目四:基于深度学习的点云特征提取
报告人:韩亚振
报告简介:基于深度学习的点云特征提取是点云处理中一个重要的研究方向,其目的是从原始的点云数据中提取有意义的特征表示,以便于后续的点云处理任务,例如分类、分割、配准等。相比于传统的手工设计特征方法,基于深度学习的点云特征提取方法具有更好的泛化能力和表达能力。目前,基于深度学习的点云特征提取方法已经在各种点云处理任务中取得了非常优秀的表现,例如点云分类、分割、重建等。未来,随着深度学习的不断发展和点云数据的广泛应用,点云特征提取方法也会越来越被重视和深入研究。
报告题目五:基于混沌遗传算法的云调度算法研究
报告人:邓德康
报告简介:得益于丰富的资源和虚拟化技术,云计算成为一种很有前途的解决方案,可以通过现收现付的方式为用户处理大规模科学工作流应用程序。然而,考虑到云平台资源配置和部署的复杂性,现有针对传统分布式计算系统设计的工作流调度策略存在局限性和不足。因此,对于利润驱动的基础设施即服务云提供商来说,最小化调度工作流的最大完成时间和支付成本是一个迫切需要关注的问题。针对上述问题,提出了基于混沌遗传算法解决单优化问题和多目标优化问题。
场次三、
时间:2023年4月24日(星期一)14:30-15:30
地点:计算机与电子信息学院601教室
报告题目一:基于VAE和PointNet的点云生成
报告人:马伟钊
报告简介:随着深度传感器和雷达扫描仪的大力发展,点云生成和点云序列生成在计算机动画、自动驾驶、机器人视觉等领域受到越来越多的关注。本报告介绍一种基于VAE和PointNet的点云生成网络方法。该方法使用PointNet提取点云的全局特征,将特征向量约束在标准高斯分布中,再使用基于注意力机制的点云解码器将点云解码成重建点云。
报告题目二:基于骨骼蒙皮变形的姿态迁移方法
报告人:杨诗耕
报告简介:三维形状编辑在电影、游戏、计算机辅助设计等领域有着广泛的应用,而姿态迁移在降低专业人员的重复劳动和提高现有数据的利用率方面有着重要意义。相较传统算法,基于深度学习的姿态迁移有着无需人工干预的优势,现有的为姿态迁移设计的神经网络泛化性并不理想,一些网格上的细节不能被很好的保留,我们提出基于骨架的三维网格姿态迁移算法,结合神经网络与蒙皮变形算法,实现了无需人工交互的全自动姿态迁移,与现有的基于深度学习的姿态迁移方法相比,我们的方法具有更好的保细节能力与良好的泛化性。
报告题目三:低纹理场景下的视觉SLAM
报告人:胡锦飞
报告简介:视觉同步定位与建图的目标是在一个未知的环境中,通过相机输入的图像信息来实时构建一个环境结构模型,同时对机器人自身进行定位。经过多年的发展,视觉SLAM技术在无人驾驶,三维重建,增强现实,机器人等多个领域中都得到了广泛的应用。尽管现有的视觉SLAM算法在面对大多数情况都能取得一个较好的效果,但其在面对低纹理场景时仍有较大的挑战。
低纹理场景往往出现在人造环境之中,如室内环境或室外停车场。我们在ORB-SLAM的基础上构建了一个融合点线面特征的单目视觉SLAM系统,能够灵活的使用场景中的点线特征和结构规律,允许在其在缺乏点特征的时候,能够根据面特征来生成足够数量的点特征来满足算法的需求,改善视觉SLAM算法在低纹理场景中的性能。
报告题目四:基于动态图和偏移注意力的点云上采样
报告人:韩亚振
报告简介:由三维扫描设备直接得到的点云经常是稀疏、不均匀、有噪声的,因此点云上采样在点云重建、渲染等领域扮演了越来越关键的角色。本文提出了一种新的基于动态图和偏移注意力的点云上采样网络DGOA(Dynamic Graph and Offset-Attention),DGOA主要包含LFE(Local Feature Extraction, 局部特征提取)、GFE(Global Feature Extraction, 全局特征提取)和CR(Coordinate Reconstruction, 坐标重建)三个模块。LFE采用多层结构提取邻域信息,每层基于特征相似性构建动态图,可以在特征空间自适应的将点云分组,增大感受野,获得长距离的语义信息,更好的建模点云的局部几何形状。GFE采用基于拉普拉斯算子的偏移注意力使每个点都能获得点云的全局信息,使生成点云的细节与原始点云一致,减少噪声的影响。CR借鉴Folding-Net操作,避免生成点的聚集。此外,整个网络与输入点云中点的顺序无关,具有置换不变性。在多个数据集的定量与定性实验结果表明本文方法优于其它方法,并且具有良好的泛化性和稳定性。
报告题目五:基于多模态融合的目标跟踪算法研究
报告人:邓德康
报告简介:目标跟踪是计算机视觉研究中的前沿和热点问题, 在安全监控、无人驾驶等领域中有着重要的应用价值。然而, 目前基于可见光数据的视觉跟踪方法, 在光照变化、恶劣天气下因数据质量受限难以实现鲁棒跟踪。因此,一些研究者提出了多模态视觉跟踪任务,通过引入其他模态数据,包括红外模态、深度模态、事件模态以及文本模态,在一定程度上弥补了可见光模态在恶劣天气、遮挡、快速运动和外观歧义等条件下的不足。多模态视觉跟踪旨在挖掘可见光和其他模态数据的互补优势,在视频中实现鲁棒的目标定位,对全天时全天候感知有着重要的价
值和意义,受到越来越多的研究和关注。基于上述的背景,使用多模态深度融合的方式,提高目标识别和跟踪的准确度。