美文网首页
SKIL/开始/发行说明

SKIL/开始/发行说明

作者: hello风一样的男子 | 来源:发表于2019-04-23 16:40 被阅读0次

    发行说明

    SKIL 1.2.1

    特点和改进

    • “关于”页现在显示许可证到期日期。
    • 更新页面以便在许可证过期时更新许可证。
    • 内部API更改以获得更稳定的用户界面体验。
    • 添加了“支持zip按钮”,用于共享系统信息、日志和流程信息,以获得更好的客户支持。
    • 修复了pyspark和spark不匹配的库。
    • 安spark无需安装7zip。
    • 添加expirationDate以获取许可证端点 GET /license
    • 许可证页的Loading指示器。
    • 模型服务器v2(管道)的前端更改。
    • 修复了Ubuntu Docker对/var/skil的镜像权限。

    已知问题

    • 用于保存数据的Docker镜像在操作系统上占用大量存储空间。这将很快在以后的版本中得到修复。
    • SKIL Launcher(bundle)不适用于Linux。

    SKIL 1.2.0

    特点和改进

    • 新的集中日志获取系统。
    • 模型服务器版本控制和回滚。
    • 用于监控正在运行的训练和批量推理作业的新作业系统和用户界面。
    • 部署中的模型服务器度量仪表板。
    • 通过Beam解释器增加了基于Java的笔记本的支持。
    • 下一代基于管道的模型服务器。
      • PMML实现增加了对Scikit-learn、XGBoost和许多R、Spark和SAS模型的支持。
      • 完全可定制的输入前置处理器和输出后置处理器。
      • 高效的内存映射向量查找。
      • 更高的TensorFlow模型的吞吐量。
      • 支持二进制numpy数组和支持输入输出的apache arrow。
      • 支持目标检测端点中的自定义类标签。
      • 能够通过反馈在模型服务器内重新训练模型。
    • 增加了对Windows、Mac和Debian/Ubuntu的支持。
      • 包括一个简单的基于GUI的启动程序。
    • 企业版现在可以支持Active Directory/LDAP进行身份验证。
    • 创建了简化的python API。
    • 社区版许可证现在支持10个模型服务器而不是2个,工作间现在不受限制。

    已知问题

    • install-python.bat脚本中的Deactivate调用有时会导致以下错误:

    • <root_SKIL_folder>\miniconda\Scripts\deactivate' is not recognized as an internal or external command,
      operable program or batch file.
      
      
      image.gif

      可以安全地忽略这个错误并继续使用SKIL。这将在以后的版本中修复。

    • 在Zeppelin上运行%pyspark脚本时,有时会看到pyspark没有响应错误。将这些问题连同 <root_SKIL_folder>/logs文件夹下的skil日志文件一起报告给我们。我们正在积极地为以后的版本解决这个问题。

    SKIL 1.1.2

    特点和改进

    • 为大型TensorFlow模型添加性能改进。

    SKIL 1.1.1

    特点和改进

    • skil-server-miniconda现在安装了非GPU版本的python库,这样它们就可以与CPU一起使用了。要在安装了CUDA的服务器上的那些库中启用GPU,请安装与安装的CUDA版本相应的-GPU版本。
    • 更新默认笔记本以展示训练DL4J和Keras模型。
    • 复制的模型服务器URL现在与客户端API兼容。

    已知问题

    • Docker 容器有时会下载zeppelin解释器,即使它们已经包含在内。在访问工作间之前,请等待下载完成。查看消息“About to join jetty web server”,了解Zeppelin何时准备就绪。

    SKIL 1.1.0

    特点和改进

    • 大量的错误和性能修复。
    • 更新为DL4J 1.0.0-beta,运行在CUDA 9.1上的TensorFlow 1.7用于模型服务器,TensorFlow 1.8用于Zeppelin笔记本。
    • 用于管理大量部署和实验的各种UI改进。
    • 用于SKIL集群的集中配置和管理UI。
    • 添加了模型服务器API。
      • 支持目标检测模型,如yolo和ssd。
      • 支持具有多个输入和输出的模型。
      • 对需要输入掩码的循环网络的扩展支持。
    • 支持使用压缩图像作为神经网络的输入,服务器端自动调整大小和归一化。
    • 从SKIL中打开笔记本将自动登录到Zeppelin。
    • 在外部或云Spark集群上使用DL4J进行Spark训练和推理。
    • 嵌入式ZooKeeper现在是持久的,可以在集群模式下使用。
    • TensorFlow模型服务器现在在GPU上运行(如果可用)。

    已知问题

    • 捆绑式miniconda安装错误地需要CUDA。如果遇到此问题,请升级到1.1.1版。
    • TensorFlow模型服务器不支持Workers>1。
    • 当给定损坏的模型时,模型服务器不会总是进入失败状态。
    • 升级后的TensorFlow版本导致ONNX库加载失败。将在稍后的ONNX版本中修复。
    • 日志包含有关许可和端口冲突的良性错误。这将在下面的小版本中解决。

    SKIL 1.0.3

    特点和改进

    • 负载均衡器不会在多节点部署中更新模型服务器URL。
    • MNIST数据集在benchmark.deeplarn.online上不再可用(数据集将嵌入到RPM中)。
    • 模型服务器负载均衡器性能改进。

    SKIL 1.0.2

    特点和改进

    • 现在支持用于推理的多节点SKIL安装。
    • 完全离线可安装的RPM。
    • 添加了进程的显示名称。
    • 能够自定义默认zeppelin服务器的配置。
    • 可配置的日志。
    • 许多小的用户界面和可用性改进。

    已知问题

    • 停止部署可能会导致工作区中出现临时错误。只需再次尝试该操作就可以消除错误。
    • 目前无法从实验中删除带有附加评估结果的模型。
    • SKIL中嵌入的ZooKeeper将数据存储在内存中,重新启动SKIL服务器将在工作间和部署中导致错误。建议使用外部Zookeeper。

    相关文章

      网友评论

          本文标题:SKIL/开始/发行说明

          本文链接:https://www.haomeiwen.com/subject/amfbgqtx.html