在过去的几年里,机器学习开辟了广泛行业的新视野,出现了先进的用例:面部识别—Facebook的面部识别,Netflix的电影推荐,PrimaAI的图像样式转换,Siri的语音识别,Google Allo的自然语言处理等等。
除了这些用例外,还有大量在GitHub上托管的开源机器学习项目。 以下是最受欢迎的项目列表。 我希望你能学到新东西并始终保持灵感。
TensorFlow
TensorFlow是一个用于研究和生产的开源机器学习库。 TensorFlow为初学者和专家提供API,以便为桌面,移动,Web和云开发。TensorFlow最初由Google Brain团队开发,供Google内部使用,于2015年11月9日在Apache 2.0开源许可下发布。
最新版本的TensorFlow支持Keras,这是一种高级神经网络API,用Python编写,能够在TensorFlow,CNTK或Theano之上运行。 还有Javascript和Swift的接口。
scikit-learn
Scikit-learn最初由David Cournapeau在夏季Google of Code活动中撰写。 它的名称或多或少引用了SciPy Toolkit。
Scikit-learn具有基于NumPy,SciPy和Matplotlib的简单而有效的数据挖掘和数据分析工具。 由于其简单和便捷的功能,它与TensorFlow一起使用是一种流行的选择。
MXNet
除了TensorFlow,Keras和Scikit-learn之外,还有来自Apache的MXNet深度学习框架。 它专为提高效率和灵活性而设计 - 它允许您混合符号和命令式编程,以最大限度地提高效率和生产力。 对于在MXNet中实现的许多模型,您可以访问模型库。
PyTorch
如果不提及PyTorch,这个列表将是不完整的,PyTorch是机器学习爱好者中另一个受欢迎的选择。 PyTorch基于Torch,由Facebook作为其机器学习框架发布。
PyTorch是一个Python包,提供两个高级功能:具有强大GPU加速的Tensor计算(如NumPy)和基于磁带的自动编程系统构建的深度神经网络。
magenta
Magenta是一个探索机器学习在创造艺术和音乐过程中的作用的研究项目。 这主要涉及开发新的深度学习和强化学习算法,用于生成歌曲,图像,绘图和其他材料。 但它也是构建智能工具和界面的探索,它允许艺术家和音乐家使用这些模型扩展(而不是取代!)他们的流程。
主要的回购用于Python,但对于Javascript版本,还有magenta.js。 Magenta是一个完美的项目,展示了我们大多数人从未想过的高级机器学习。 要被Magenta惊叹,请查看一些带有声音和绘图生成器的演示。
style2paints
该项目旨在为线条艺术着色。 AI可以根据给定的颜色样式在草图上绘制,创建自己的颜色样式以在草图上绘制,或者转移另一个插图的样式。
有一些新的功能,如图像锚和图像过渡,值得一看。
PyTorch中的图像到图像转换
该项目有两个组件 - CycleGAN和pix2pix,它们包含用于未配对和成对图像到图像转换的PyTorch实现。 起初,它看起来像另一种相当普通的风格转移解决方案,但它可以做一些不同的事情,比如将马转换为斑马或从现场照片转换为莫奈。 并且流程足够快,可以在实时视频上使用。
深语音转换
我们有一些用于图像和视频的样式转换工具,但是语音呢? 深语音对话是此功能的完美示例。
如果你可以模仿一个着名的名人的声音或像一个着名的歌手唱歌怎么办? 该项目的目标是将某人的声音转换为特定的目标声音。 所谓的,它的语音风格转移。 我们致力于这个项目,旨在将某人的声音转变为着名的英国女演员凯特温斯莱特的声音。 我们实现了一个深度神经网络来实现这一目标,并且Kate Winslet读取的超过2小时的有声书籍句子被用作数据集。
如果您还不相信,可以通过Kate Winslet的声音前往SoundCloud进行一些演示。
PyTorch中的StarGAN
StarGAN是本文的PyTorch实现:用于多域图像到图像转换的统一生成对抗网络。
它不仅仅是通过应用不同的发型,皮肤类型,年龄,性别和不同的情绪来转换源图像。 非常棒。
人脸检测
这可能听起来不太有趣,因为现在我们可以在iOS和Android上使用Core ML或ML Kit轻松完成这项工作。 但更深入的展望表明这是多么棒的。 它不仅可以检测面部,还可以检测情绪和性别。
使用具有Keras CNN模型和OpenCV的fer2013 / IMDB数据集进行实时人脸检测和情感/性别分类。
说到人脸检测,谷歌曾经在2017年发布了一款AI硬件纸盒套件,也是旗下AI开源项目(AIY Projects)的作品。Vision Kit 是一套简单的计算机视觉系统,它可以检测几千种常见物体,但也可以对人类的脸部表情进行检测,并显示出情绪,比如微笑、皱眉、愤怒、开心等等。
深度通用概率规划 (Deep universal probabilistic programming)
Uber AI Labs构建了这个深度概率编程库,以帮助简化其运输服务的预测和优化收益。 任何处理概率建模的人都会对这个库感兴趣。
机会范围从匹配车手到驾驶员,建议最佳路线,找到明智的游泳池组合,甚至创造下一代智能车辆。 为了解决这些挑战,我们将最先进的人工智能(AI)技术与数据科学家,工程师和其他用户的丰富专业知识相结合。 我们正在探索一种工具优先的方法,使我们和其他人能够制作下一代AI解决方案。
网友评论