美文网首页
基于区别性的法律属性来预测少样本的法律案件

基于区别性的法律属性来预测少样本的法律案件

作者: 烛之文 | 来源:发表于2020-07-07 22:02 被阅读0次

1 前言

这次分享一篇关于法律案件预测的paper,发表在2018年COLING会议上。论文标题为:Few-Shot Charge Prediction with Discriminative Legal Attributes,论文下载链接。因为关于法律案件的预测问题已有很多相关的paper, 为此,作者基于该任务提出了两点创新:一是增加Discriminative Legal Attributes识别任务,来辅助提高Charge Prediction任务;二是解决一些标签少样本(Few-Shot)的问题。

2 任务背景

  • 在法律案件预测任务中,常常面临有些案件样本数量很少,有些案件彼此特别接近,例如:(theft, robbery) and (misappropriation of funds, embezzlement)。
  • 基于上述问题,作者提出多任务学习框架,增加区别性法律属性预测任务(Discriminative Legal Attributes ),进而学习更有效的特征,提升法律案件预测(Charge Prediction)。


    基于属性的法律案件预测思路

3 Model

作者提出的十类属性

作者提出10个属性特征,在标注的时候,采用(YES,NO)的二分类;同一个案件认为属性是相同的,所以这项任务的标准量不是很大。

如此,会涉及两个任务:Attribute Predictor,Charge Predictor。下图为论文的模型图,分三个部分:

  • Text Encoder
  • Attribute Predictor
  • Charge Predictor


    模型的架构图

3.1 Text Encoder

Encoder

Text encoder 使用bi_lstm两层,然后得到文本的表征:


3.2 Attribute Predictor


将属性预测任务作为分类任务,类别数量为10

3.2 Charge Predictor

image.png

4 Experiment

在实验部分,作者将法律案件数据按太小分成三类进行实验测试。



对比方法用了cnn,lstm,TFIDF+SVM;cnn和lstm还考虑了词200维度,具体结果如下:


Experiment Result
从结果来看,论文提出的方法的确有明显提升,尤其在F1值上,说明该方法提升了少样本的识别效果。

5 结论

论文的借鉴之处:人工构造一个新任务且标注成本不是很高,然后进行多任务学习,子任务的作用就是辅助学习更有效的特征,进而提高主任务的预测效果,方法简单且有效。
但同时也会存在问题可以思考:

  • 虽然标注成本不是很高,但提出的十个Discriminative Legal Attributes 并非容易的事情,需要很强的领域知识;
  • 论文并没有对比预训练模型BERT,或者在预训练模型的微调上也能达到这样的效果;
  • 其实法律案件有些是属于多标签的,这个文章也没考虑;

相关文章

网友评论

      本文标题:基于区别性的法律属性来预测少样本的法律案件

      本文链接:https://www.haomeiwen.com/subject/pwvzqktx.html