美文网首页
机器学习Bob|简介

机器学习Bob|简介

作者: 黑白格_0ca6 | 来源:发表于2020-10-18 10:04 被阅读0次

    简介

    只能在Linux与Mac环境运行,Bob涵盖图像识别、视频识别、音频识别等多种机器学习场景,本文主要考虑声纹识别的应用。

    数据格式:多维数组

    • 底层C++使用Blitz++库,因此在Bob中的多维数组用bob.blitz.array表示,其由numpy.ndarray包装
    • 输入的数字信号(图像、视频、音频)统一由numpy.ndarray表示,其中,语音信号由2维向量表示,第1维是信道号,第2维是由时间索引的数字信号
    • 支持多种WAV格式,不建议直接使用scipy.io.wavfile,其数据格式为int型,Bob可以输出浮点数

    文件IO

    • 使用HDF5格式(事实上,Sidekit工具包也是如此,将多个数据表单根据路径索引放在一个h5文件中)
    • 支持Matlab文件格式,查阅: Matlab(R) I/O Support for Bob

    机器学习算法

    数据集接口

    • 已有数据库接口:Packages
      (待完善)

    性能评估

    (待完善)

    完整案例

    相关文章

      网友评论

          本文标题:机器学习Bob|简介

          本文链接:https://www.haomeiwen.com/subject/wowqmktx.html