美文网首页
远程监督关系抽取DIAG-NRE

远程监督关系抽取DIAG-NRE

作者: 布口袋_天晴了 | 来源:发表于2019-08-05 13:23 被阅读0次

    远程监督的核心作用:为关系抽取任务or信息抽取任务,快速地、自动化地生成大量的训练数据集。
    远程监督的核心弱点:存在很多噪声数据集,容易出现标注错误的情况。

    针对以上问题,近年来的解决方法是通过与弱监督方法相结合,通过不同的弱监督信号来生成更高质量的训练标签,如基于模式的标注。
    尽管弱监督融合既能生成更高质量的标注又有较好的可解释性,但该类方法也存在一定的局限性:通常假定由(领域专家)来提供具有关系指向性的模式规则,比如符合xxx:PER .* xxx:CITY的句子倾向于“出生地”关系。

    这种人工撰写规则的方式需要大量的工作,当需要关系抽取的应用领域发生改变后,又得人工定义新的抽取规则,这样的方法就显得比较耗力耗时。

    如何自动化的生成高质量的训练数据呢?
    2018年的DIAG-NRE是新提出的一套神经模式整段框架来桥接远程监督与弱监督融合。分别包含:模式抽取模式精炼

    代码
    论文

    1.环境搭建

    conda env create --file=environment.yml  #创建模型所需的基础环境
    source activate diag-nre  #激活虚拟环境
    source ./shell/set_env.sh   #设置环境运行所需参数,创建文件夹
    

    2.数据下载

    base_data.zip or base_data.zip

    unzip base_data.zip
    cd base_data
    python prepare_data.py $WOKR_DIR
    

    3.可运行的程序

    python batch_train_rel.py
    python batch_train_agent.py
    python batch_train_diag.py
    python batch_retrain_rel.py
    python batch_eval_total.py
    
    本来想一一运行,看看源代码的,结果服务器内存不够!!

    相关文章

      网友评论

          本文标题:远程监督关系抽取DIAG-NRE

          本文链接:https://www.haomeiwen.com/subject/bohpdctx.html