3D门控递归融合网络:GRFNet
解决问题:语义场景补全任务中的数据融合问题
解决方案:提出了名为GRFNet的3D门控递归融合网络,该网络可以自适应地选择并通过使用门和存储模块来融合深度图像和RGB的相关信息。
实验结果:在两个基准数据集上进行的实验证明了GRFNet在语义场景补全任务中进行数据融合优于现有的方法。
双注意力GAN用于大姿态人脸正面化
解决问题:人脸正面化的问题
解决方案:提出了一种新的双注意力生成对抗网络(DA-GAN),通过在GAN训练过程中同时捕捉上下文相关性和局部一致性来实现真实感人脸正面化。
实验结果:实验表明,DA-GAN能够有效地提高极端姿势场景下的的人脸识别性能。
Universal-RCNN基于可转移图R-CNN的通用目标检测器
解决问题:通用对象检测的问题
解决方案:结合图迁移学习,可在多个数据集之间传播相关语义信息,以达到语义一致性。Universal-RCNN首先通过整合所有类的所有高级语义表示来生成全局语义池。
实验结果:大量实验表明,Universal-RCNN明显优于现有的多分支模型,并在多对象检测基准上达到最新水平。
无监督域自适应用于图像深度估计
解决问题利用无监督算法,将在大量合成数据上预训练的深度模型迁移到没有标签监督的目标域上来。
创新点:
利用传统深度估计算法为目标域图像标记含有噪声伪标签,并生成逐像素置信图。
提出一种新颖置信度引导损失函数,用以衡量哪些像素需要纳入深度模型预测出的深度值与传统方法计算出的深度值误差中。
控制超参数设置成为一个可学习变量,以进一步提升泛化能力。
嵌套命名实体识别神经分层模型
作者团队招募: AI 研习社推出「论文」版块,与你一起探索前沿研究成果。加入我们,你将获得署名文章、稿酬、大会福利等好处。