今日智慧图书馆布局借鉴经验共享乡村知识库定位精灵网络等

目录句子和文档的分布式表示

基于元学习的场景自适应视频帧插值

美国对COVID-19的反应的县级数据集

跨域文档对象检测:基准套件和方法

GPS-NET:用于场景图形生成的图形属性传感网络

今日智慧图书馆布局;借鉴经验共享;乡村知识库;定位精灵网络等

目录句子和文档的分布式表示论文名称:Distributed Representations of Sentences and Documents

作者:Quoc Le /Tomas Mikolov

发表时间:2014/4/16

论文链接:https://paper.yanxishe.com/review/16072?from=leiphonecolumn_paperreview0415

推荐原因:

核心问题:这篇文章主要做了一个问题,就是如何表示一个文档或者句子的向量,过去我们常常学习到词向量,而这个工作进一步的提升,变为了如何表示整个句子的词向量。

创新点:本文应用了word2vec中词向量的训练方法,具体来说在每词输入的时候,都将文章的id进行输入,通过反向传播算法,此时文章id对应的embedding就是最终的文档编码。

研究意义:文档编码应用很多,如果能够得到一个非常好的编码,那么可以省略掉单个词汇面的编码。

猜你喜欢