前文《
分享 | KNIME:图形化数据科学与机器学习计算平台的王者
》对KNIME做了一个介绍,本次小音就带领大家创建并运行你的第一个KNIME工作流。
1、新建自己的第一个KNIME工程
点击菜单栏的“File”->“New”新建工程,按照如下指示可以很快地创建一个新的工程,如下图所示:
输入一个工程名称,如下图所示:
KNIME本身也提供很多案例工程,可以在“KNIME Explorer”窗口看到很多案例工程,运行这些工程,查看结果。你也可以从KNIME官网上下载案例工程,熟悉每个节点的使用,如下图所示:
2、打开并下载案例工作流
我们以下图的工作流为例。
双击“KNIME Explorer”窗口中的“EXAMPLES”从官网导入所有案例工作流,搜索并选择“Visual_Analysis_of_Sales_Data”工作流,双击打开。因为是打开远程的工作流,所以需要等一会儿。
成功打开后,界面上显示如下警告。因为打开的是远程工作流,对它的修改都无法保存,因此我们需要将它下载到本地。
点击菜单“File”-> “Save as…” 保存工作流至本地:
从图中看,先由“File Reader”读入数据,然后“Column Filter”和“Row Filter”对数据进行预处理。经过预处理后的数据是“Color Manager”和“Stacked Area Chart”两个节点的输入。
“Stacked Area Chart”直接将输入以图的方式展示出来,而“Color Manage”通过染色将它们按条件先进行区分,然后再由“Pie/Dount Chart”以饼图展示结果。
3、数据读入
当前工作流还没有被执行,所以所有节点的状态显示为黄色或者红色。选中“File Reader”节点,右击绿色的“Execute”按钮(快捷键Shift + F7),节点状态颜色变为绿色。右击带有放大镜的“Table Reader”按钮(快捷键Shift + F6),可查看读入的数据:
4、数据预处理
选中“Row Filter”节点,点击执行按钮,我们发现之前没有执行的节点也会自动执行,最后显示如下:
查看数据经过预处理后的结果:
5、数据可视化
选中“Color Manager”节点,双击打开设置界面,发现该节点以“country”列为条件,用不同颜色对数据进行分类标记,如下图所示。
执行该节点,点击“Table Reader”按钮,查看执行结果。
然后点击“Execute”按钮,工作流将按顺序执行全部节点。最后两个节点是可视化节点,选中他们后点击“Table Reader”按钮,就可以查看工作流运行的结果了。
本次创建并运行你的第一个KNIME工作流就到这里结束了,大家可以通过这个案例多熟悉下KNIME的基本操作。
下次实训课,小音将会以一个更加复杂的实例,讲解如何利用KNIME来处理一个实际的数据任务。
内容来源:嘉数会
网友评论