当前位置：首页 > 机器人 > 哈工大丁效自然考研最新资讯中的神经符号认知推理方法

哈工大丁效自然考研最新资讯中的神经符号认知推理方法

机器人
2025-01-10 07:57
0

在过去十年的人工智能浪潮中，深度学习技术以其强大的计算能力和广泛的应用实践，已经基本实现了视觉、听觉等感知智能的突破。然而，这些进展并未能解决思考、推理等认知智能的问题。

4月9日，在AI TIME青年科学家——AI 2000学者专场论坛上，哈尔滨工业大学计算机学院副研究员丁效发表了题为《基于神经符号的认知推理方法》的报告。在这次讲座中，丁效教授分享了最新的神经网络在执行符号推理任务中的进展，以及将符号知识注入神经网络以及如何将神经网络与符号系统相结合的思路。

首先，我们来看一下自然语言处理（NLP）领域的情况。在这个领域里，预训练模型规模每年都在快速增长，每年约10倍。随着模型规模的扩大，其通用智能水平也得到了显著提升。这一发展不仅促进了模型性能的大幅提升，还为后续研究提供了一定的基础。

尽管如此，我们仍然面临着问题，比如GPT-3这样的预训练语言模型对于复杂的问题如“烤箱和铅笔哪个更重？”或“脚有几只眼睛？”给出的回答往往是错误或者缺乏逻辑性。这表明这些模型缺少对知识进行推理的能力，以及对推理结果可解释性的关注。

那么，我们该如何解决这一问题？丁效教授提出了一个新的计算范式，即融合基于感知深度学习和基于认知符号计算。传统基于符号表示，如分词，将文本中的每个词转换成1万维向量，而分布式表示方法则通过神经网络学习出每个词向量，这种低维稠密实数值向量能够捕捉文本语义信息。

利用符号系统和上下文表示有什么区别呢？首先，对于单词理解来说，上下文语义理解是必不可少的。例如，“小明离开星巴克”与“乔布斯离开苹果公司”，虽然都是离开，但前者可能指消费完毕而后者可能指辞职，因此两者的语义截然不同。

在传统NLP任务中，从语料库中提取特征，然后使用统计关系建模语义结构属于一种手工提取特征并输入到统计模型进行分类或预测的一种方式。而基于神经网络分布式语义表示则省略了特征提取步骤，有几个特点：单词用稠密低维向量表示，上下文语义由单词组合得到；需要大量数据训练；能够得到任务特异性质单词代表。此外，它们拥有远超以前性能但也有缺点，如需大量数据、可解释性差及依赖于表面特征等问题。