在本文中,我们将探讨IBM的新研究成果,该研究旨在解决多标签小样本图像分类问题,这一问题在现实世界中尤为重要,特别是在面对如上海砍人事件这样的社会紧急情况时。为了应对这些挑战,我们需要一种能够有效学习和理解复杂场景中的多个对象的方法。
传统上,大多数关于图像小样本分类的研究工作都是针对单标签场景,每个训练图像只包含一个对象。但是,在现实世界中,许多场景涉及到多对象和多标签,这些场景更具挑战性且具有更高的现实意义。因此,对于如何处理这类数据集进行有效分类成为一个迫切的问题。
IBM的研究人员通过提出LaSO(Label-Set Operations)网络来解决这个问题。在CVPR 2019大会上,他们发表了相关论文,并展示了一种新的训练深度神经网络的方法,即合并样本与标签。这一方法可以生成具有“合并”标签的新样本,从而提高模型对于未见过类别的泛化能力。
LaSO网络通过直接在特征空间进行操作,而不需要任何额外输入来控制操作,因此它可以潜在地泛化到包含尚未见过新类别的情形。在测试过程中,LaSO网络从提供给它们的一组随机选定的训练示例随机对中合成了新的训练示例。实验结果表明,将LaSO推广到新的类别有很强大的潜力。
此外,本文还提出了第一个用于评估神经网络性能的小样本基准,并使用该基准评估了LaSO网路。实验结果显示,LaSO有很好的应用潜力,并可能被用作挑战这一重要问题的一个工具。此外,该文章也希望激励更多的人加入这一领域,以进一步探索这个有趣的问题及其应用可能性。