美文网首页
论文粗读“Learning from the Dictionar

论文粗读“Learning from the Dictionar

作者: 掉了西红柿皮_Kee | 来源:发表于2023-07-26 09:55 被阅读0次

Li Y, Ma S, Zhou Q, et al. Learning from the Dictionary: Heterogeneous Knowledge Guided Fine-tuning for Chinese Spell Checking[C]//Findings of the Association for Computational Linguistics: EMNLP 2022. 2022: 238-249.

模型浅析

本文从知识库的角度出发构建了三种不同类型(音近,形近,以及定义)的对比类型,从loss的角度而言,还是使用了现有的InfoNCE的思想。因此,较为重要的思想是如何构造对应样本的正负例对。对于给定知识库而言,如何从知识库中选取到需要的正负例样本是关键。

根据外部知识库,找到的样本target对应的混淆列表,使用pypinyin的逻辑判断,分别找出混淆列表中的音近和形近;针对不同的正负例构造依据,选取正例样本,随机构成负例。

主打一个看不懂。。还是需要断点看每行代码的输出。。

相关文章

网友评论

      本文标题:论文粗读“Learning from the Dictionar

      本文链接:https://www.haomeiwen.com/subject/hkqhpdtx.html