美文网首页
论文粗读“Learning from the Dictionar

论文粗读“Learning from the Dictionar

作者: 掉了西红柿皮_Kee | 来源:发表于2023-07-26 09:55 被阅读0次

    Li Y, Ma S, Zhou Q, et al. Learning from the Dictionary: Heterogeneous Knowledge Guided Fine-tuning for Chinese Spell Checking[C]//Findings of the Association for Computational Linguistics: EMNLP 2022. 2022: 238-249.

    模型浅析

    本文从知识库的角度出发构建了三种不同类型(音近,形近,以及定义)的对比类型,从loss的角度而言,还是使用了现有的InfoNCE的思想。因此,较为重要的思想是如何构造对应样本的正负例对。对于给定知识库而言,如何从知识库中选取到需要的正负例样本是关键。

    根据外部知识库,找到的样本target对应的混淆列表,使用pypinyin的逻辑判断,分别找出混淆列表中的音近和形近;针对不同的正负例构造依据,选取正例样本,随机构成负例。

    主打一个看不懂。。还是需要断点看每行代码的输出。。

    相关文章

      网友评论

          本文标题:论文粗读“Learning from the Dictionar

          本文链接:https://www.haomeiwen.com/subject/hkqhpdtx.html