在当前的图像分类研究中,多数工作集中于单标签小样本场景,即每个训练图片只包含一个对象。但是现实生活中更常见的是多标签、小样本的图像分类,其中训练数据较少且图像含有多个标签。IBM 的研究团队致力于解决这一挑战,并在2019年的CVPR大会上发表了相关论文。本文提出了一种名为LaSO(Label-Set Operations networks)的新方法,该方法将合并、交叉和减法等操作应用于图像中的标签,从而生成新的训练样本。
LaSO网络通过直接在深度神经网络学习的特征空间进行操作,不需要额外输入来控制其操作。因此,它们可以潜在地泛化到包含未知类别的新图像上。在实验中,我们将LaSO网络应用到一个新的多标签小样本分类基准上,结果显示它具有很强的扩展性和应用潜力。
此外,本文还提出了第一个用于评估LaSO网络性能的小样本基准。该基准使用神经网络对LaSO标签集操作进行评估,结果证明了LaSO在这个领域具有巨大的潜力。我们希望这项工作能激励更多的人加入这项有趣且具有挑战性的研究领域。
总结来说,IBM 在CVPR 2019大会上的研究成果为面向企业和工业界更加广泛任务集提供了解决方案,这对于从少量数据中学习至关重要。此外,该成果也推动了面向现实世界复杂场景,如社会中的平板电脑最新资讯应用,为AI技术开辟了一条新的道路。