美文网首页
SKIL/工作流程/笔记本

SKIL/工作流程/笔记本

作者: hello风一样的男子 | 来源:发表于2019-04-14 21:58 被阅读0次

笔记本

笔记本对编写代码、使用深度学习库和进行实验很有用。有几个关键特性与skil直接相关,允许你保存模型、评估结果等。笔记本是工作间的专有产品,与实验概念有直接关系。
Apache Zeppelin是笔记本的后端,主要由spark解释器(Spark Interpreter)提供支持。

阅读以下内容了解有关Zeppelin和Spark的更多信息:

创建笔记本

创建并打开“工作间”和“实验”后,将自动生成一个笔记本并将其附加到该实验上。没有实验,笔记本就不能独立存在。要了解更多关于实验的信息,请参见进行实验。

可以在“实验视图”屏幕的“笔记本”选项卡中访问和编辑笔记本。此选项卡是Zeppelin集成笔记本的框架。

image image.gif ​

基本概念

笔记本是动态解释的,并不像编译的代码那样工作。每个笔记本都由代码单元组成,每个新单元默认使用Spark解释器。

在单元格中编写了一个小程序后,键入shift+enter来评估该单元格并运行代码。代码将提交给解释器,输出将直接显示在下面。当解释器运行时,单元格上方将出现一个进度条。

如果出现错误,单元格的状态将从正在RUNNING更改为ERROR,错误将直接显示在代码下方。

如果要动态加载依赖项,可以在笔记本顶部放置%dep解释器块。有关更多信息,请参见ApacheZeppelin网站上的“动态依赖加载”。

SKILContext

在笔记本中提供专门的类,允许你在程序中直接使用skil。SkilContext类允许你直接将模型添加到存储中,查看当前实验ID,并为实验执行其他功能。
为了使用skil上下文,必须正确实例化类:

%pyspark

import skil

skilContext = skil.SkilContext(sc)
client = skilContext.client
image.gif

查看skil上下文中所有可用功能的。下面是对实验有用的函数的常见列表:

| 函数 | 描述 |
| experimentId | 获取此笔记本的实验ID。 |
| saveModel | 将权重保存到Skil的存储机制。 |
| addModelToExperiment | 将模型添加到此笔记本的实验存储机制中。 |
| addEvaluationToModel | 将评估数据保存到模型中。对从维持测试集保存结果有用。 |
| batchInference | 使用modelId在execResource上启动本地Spark批量推理作业,使用KeyedDatasetProvider类提供数据并将结果存储在outputPath中。 |
| renderBufferedImage | 将BufferedImage递交到<img>标记。 |

可用的编程语言

如果要更改默认情况下使用的语言或解释器,请在键入代码之前在单元格顶部使用以下绑定之一:

| 绑定 | 解释器 | 语言 |
| %spark | Spark解释器 | Scala |
| %pyspark | Spark解释器 | Python |
| %sql | Spark解释器 | SQL |

默认情况下使用%spark绑定。你可以在笔记本设置中更改此设置,方法是单击右上角的齿轮图标并将首选的解释程序移到列表顶部。完成后请记住单击“保存”。

image image.gif ​

调度笔记本

如果你的工作流程需要定期更新,例如在线学习,则可以在笔记本中启用计划。这可能涉及到在预定的笔记本中使用DataVec从Oracle数据库中获取数据并将其以numpy格式保存到磁盘。

创建笔记本并对其进行测试以确认所有单元格正确运行后,可以使用工具栏中的“计时器”图标启用计划:

image image.gif ​

Cron 表达式用于定义执行间隔。例如:

| 表达式 | 描述 |
| 0 0/5 * * * ? | 每五分钟 |
| 0 0 0/6 * * ? | 每6小时 |
| 0 0 0 * * ? | 每天 |

在大多数情况下,以管理员用户身份运行笔记本就足够了。如果你的笔记本运行间隔超过6小时,我们建议你在每次执行时重新启动解释器。重新启动解释器时,请记住正确地重新加载任何动态依赖项。

相关文章

  • SKIL/工作流程/笔记本

    笔记本 笔记本对编写代码、使用深度学习库和进行实验很有用。有几个关键特性与skil直接相关,允许你保存模型、评估结...

  • SKIL/工作流程/与SKIL客户端一起工作

    与SKIL客户端一起工作 SKIL可以通过外部环境通过SKIL Clients使用。外部环境可以是笔记本,也可以是...

  • SKIL/工作流程/嵌入式SKIL

    嵌入式SKIL 除了提供几乎所有用于创建高效机器学习管道的工具之外,SKIL还可以非常方便地作为嵌入式应用程序。这...

  • SKIL/工作流程/概述

    概述 SKIL减少了实验数据科学建模、关键测试和产品决策以及可扩展部署工程之间的冲突。它弥合了Python生态系统...

  • SKIL/工作流程/资源

    资源 当今世界,我们收集越来越多的增长和复杂的数据集,这些数据集往往需要使用复杂的模型。更重要的是,大型和非结构化...

  • SKIL/工作流程/工作间

    工作间 工作间是一个功能集合,可以实现不同的任务,例如进行实验、训练模型和测试不同的数据集转换。工作间与部署不同,...

  • SKIL/工作流程/数据转换

    数据转换 在实践中,数据很少以方便神经网络使用的格式存在。它是字符串、类别、数字、不同格式的图像的混合体,而且大部...

  • SKIL/工作流程/定义模型

    定义模型 SKIL有一个强大的模型存储、服务和导入系统来支持主要的深度学习库。SKIL可以用于端到端的训练、配置和...

  • SKIL/工作流程/导入模型

    导入模型 TensorFlow, Caffe, Keras, 与 Deeplearning4j 都可以导入到SKI...

  • SKIL/工作流程/TensorFlow模型

    TensorFlow模型 SKIL1.0.3使用TensorFlow C++ API (版本1.4)的自定义JVM...

网友评论

      本文标题:SKIL/工作流程/笔记本

      本文链接:https://www.haomeiwen.com/subject/kjdewqtx.html