共有包含12种语言在内的730万张图片与相应的元数据
其中人工标注数量:11734
其大小分布为
![](https://img.haomeiwen.com/i3016508/03b9e8cb7ef68d3a.png)
数据标注方法:
三个人分别根据给出图片与对应描述打分,分数有六种,-2,-1,代表消极情感倾向,0代表不包含情感倾向,1,2代表积极情感倾向,没有打分代表图文传达出相矛盾的情感
三人打分一致的数据共有2329个图文对
其中
![](https://img.haomeiwen.com/i3016508/6c49dcbd0692c5b2.png)
标签 对应数目
0:1225
1:1005
-1:62
2:30
-2:7
null :0
至少两人达成一致的共有9793个图文对
其中
![](https://img.haomeiwen.com/i3016508/c5e8b9e0684a5a76.png)
标签 对应数目
0:4524
1:4475
-1:403
2:360
-2:30
null:1
网络结构renet34
![](https://img.haomeiwen.com/i3016508/0362144f23e2fd28.png)
初步使用数据
我们将数据集进行处理,将标签从6个减少为3个,即将-2,-1看为-1,将1,2看为1,并去掉图文表达冲突的数据,然后将最少两人达成一致的数据提取出来作为初步数据集,其分布如下
![](https://img.haomeiwen.com/i3016508/b7c69a0bcc6eb5d8.png)
其中消极数据502个,中立数据4423,积极数据5744,数据量由11734减少为10669。
我们可以发现人们更倾向在社交网络上表达积极的情感。
文本数据
每个文本平均包含41.97个单词。
长度超过100的有1034个,没有描述的有169个,为了降低学习的难度我们将其从训练集中去掉,其余的长度分布如下
![](https://img.haomeiwen.com/i3016508/8f775b271f10dd20.png)
认为不准确的图文对:
![](https://img.haomeiwen.com/i3016508/9441199383131c8d.png)
![](https://img.haomeiwen.com/i3016508/0157edd8e9233575.png)
![](https://img.haomeiwen.com/i3016508/0338c6b537ae61f2.png)
![](https://img.haomeiwen.com/i3016508/28855a769b8f5464.png)
![](https://img.haomeiwen.com/i3016508/fbe9ed4b408c9743.png)
![](https://img.haomeiwen.com/i3016508/06a0ed89a5ef1d1f.png)
![](https://img.haomeiwen.com/i3016508/e7e1f756e91e79d8.png)
![](https://img.haomeiwen.com/i3016508/6f5b15d55772b553.png)
网友评论