关键函数:readtable,summary,histogram,prctile,boxplot
1.统计词汇频率
有必要解释下,C=categorial(T.TYPE),其中.TYPE意思是读取“TYPE”标签下的内容:
表1然后把这些数据以table的形式返回给C。
整个程序主要的作用是,统计表1中的词频。目前给的表中是一个个词汇,而我们首先得知道有哪些词,并得到一个这些词的集合(词之间不重复),这就用到:c=categories(C)。然后就可以得到不重复的词的目录了。
之后,我们得知道每个词出现的次数,这里matlab给了一个很方便的函数,countcats。
cf=countcats(C),就可以把每个词出现的次数返回到cf里了,而且每个数字与categories所返回的标签一一对应。(真是想要啥就有啥)
2.作图
有了词汇目录,有了各个词对应的数字(频率)之后,就需要把这些数据可视化了。就以条形图为例,使用bar(cf); 就可以把cf中的数据展示在图中了,但此时,横坐标却是1,2,3.我们需要的横坐标则是Anomic,Brocas,Conduction。这是就要用到set函数了。只需在bar(cf)下方写上set(gca,'XTickLabel',c)即可,gca表示当前图,XTickLabel表示横坐标,c就是那三个单词组成的标签。
网友评论