我又回来了,Pytorch的学习也是为了熟悉AllenNLP结构,所以,在完成基础tutorial之后又折回来继续学AllenNLP。四月份的目标是复现那篇论文中的结构并使用Finetuning完成Transformer。
今天开始AllenNLP入门的第二部分How-to。总共包括七个小节。
- 创建自己的json配置文件
- How to train a model with lazy data
- How to train and use a Transformer-based ELMo
- How to Debug Your AllenNLP Code
- How to visualize model internals (BETA)
- Using pre-trained ELMo representations
- Using span representations
1. 创建自己的json配置文件
AllenNLP由类似Json的配置文件驱动。我们得到的一个常见反馈是“很难知道配置文件中需要进行哪些操作。”因此,构建一些工具(仍然有点实验性)来帮助用户了解这部分。
1.1 AllenNLP配置向导
AllenNLP通过浏览器创建了一个配置想到,可以使用这行命令调用
$ allennlp configure
在浏览器中访问http://localhost:8123就可以出现下面的界面
image.png可以在命令行版本中看到相同的字段和注释。 (注释隐藏为工具提示,将鼠标悬停在问号按钮上以查看它们)。
必填字段的名称为黑色,而可选字段的名称为灰色。未完成的必填字段以红色叹号突出显示。
如果单击dataset_reader的“CONFIGURE”按钮,将出现一个下拉列表:
如果再次选择SquadReader,将显示数据集读取器部件的配置程序:
image.png
注意在后面的那个X按钮,作用是用来删除dataset reader配置。
当用户填写配置选项后,在页面底部有实时json配置更新。用户可以使用此向导填写整个配置,将生成的JSON复制到文件中,然后启动实验。
这个配置文件等于是傻瓜式的生成模版,可以看到要生成的json的几个主要模块,更有利于初学者了解AllenNLP。
网友评论