对比学习句子嵌入存在两种训练方式,一种是端到端的方式,如SimCSE[3],另一种是动量对比的方式,如ESimcse[4],在自然语言领域的动量对比学习对数据量非常敏感,训练时鲁棒性较差。对此我们提出了GATs-CSE,一种无监督对比学习句子嵌入框架。该框架采用孪生网络的方式进行训练,分别由动态网络和静态网络两部分构成,为了保证句子嵌入的信息完整性,采用图注意力网络对语义信息抽取器提取出的所有信息进行信息交互,在通过权重残差连接的方式补充句子嵌入中残缺信息,剔除句子嵌入中的噪声信息。该框架避免了动量更新时语义信息抽取器参数更新的混乱性,解决了NLP领域中采用队列的方式进行对比学习时,对比样本对队列长度的敏感性。在文本语义相似任务上,斯皮尔曼相关系数平均超过SimCSE[3]2.33个百分点,高于ESimCSE[4]0.31个百分点。同时我们进行了大量的消融实验以证该框架在对比学习中的有效性。
营业时间:9;00-11:30 13:30-17:00
地址:总部:香港湾仔骆克道315-321号幸运广场23楼C室;分部:香港九龍新蒲崗太子道東704號新時代工貿商業中心31樓5-11室A03單位
邮箱:gjkzxtg@126.com
客服QQ:3577400288