摘要: 本文比较了2017年发布的8800多个开源的机器学习项目,通过考量受欢迎程度、参与度和新近度来等指标来评估这些参选项目,并选出前30名。
在2017年,我们比较了将近8800个开源的机器学习项目,并从中选出了前30名(0.3%的几率)。
这是一个极具竞争力的排行,我精心挑选了2017年1月至12月发布的最好的开源机器学习库、数据集和应用程序。Mybridge AI通过考量受欢迎程度、参与度和新近度来等指标来评估这些参选项目的质量。为了给你一个关于质量的参考,GitHub星的平均数量是3558颗。
开源项目对数据科学家来说非常有用。您可以通过阅读源代码进行学习,然后在已经存在的项目上构建自己的东西。现在让我们轻松地学习过去一年你可能错过的机器学习项目吧。
推荐相关学习书籍名单 :
A)神经网络
![](https://img.haomeiwen.com/i2509688/78350d2bec5ce762.png)
深度学习A-Z:动手的人工神经网络(Deep Learning A-Z: Hands-On Artificial Neural Networks)
[68,745条推荐,4.5/5星]
B)TensorFlow
![](https://img.haomeiwen.com/i2509688/f4ca55a81a07b15f.png)
用Python进行深度学习的TensorFlow完整指南(Complete Guide to TensorFlow for Deep Learning with Python)
[17,834条推荐,4.6/5星]
开源项目排行榜
第 1 名
FastText:快速文本表示/分类库。
[在Github上有11786颗星] 由Facebook Research提供
![](https://img.haomeiwen.com/i2509688/1af37e4c07a6fee6.png)
[Muse: 基于快速文本的多语言无监督或监督词嵌入。在Github上有695颗星]
第 2 名
Deep-photo-styletransfer:论文《深度照片风格转移》(Deep Photo Style Transfer)的代码和数据。
[在Github上有9747颗星星] 由康奈尔大学 Fujun Luan 博士提供
![](https://img.haomeiwen.com/i2509688/d6344e1c3050ebed.png)
第 3 名
face recognition:最简单的 Python 命令行面部识别 API。
[在Github上有8672个星] 由Adam Geitgey提供
![](https://img.haomeiwen.com/i2509688/5f9613a4e539f8cd.png)
第 4 名
Magenta:机器智能音乐与艺术生成器。
[在Github上有 8113颗星]
![](https://img.haomeiwen.com/i2509688/08926ce559b39a25.png)
第 5 名
Sonnet:基于TensorFlow的神经网络库。
[在Github上有5731颗星]。 由Deepmind公司的Malcolm Reynolds提供
![](https://img.haomeiwen.com/i2509688/7f796f7cabcfa0bb.png)
第 6 名
deeplearn.js:一种用于web的硬件加速机器智能库。
[在Github上有5462颗星]。 由Google Brain的Nikhil Thorat提供
![](https://img.haomeiwen.com/i2509688/77a161d138fdf757.png)
第 7 名
Fast Style Transfer:TensorFlow的快速风格转换。
[在Github上有4843颗星] 由MIT的Logan Engstrom提供
![](https://img.haomeiwen.com/i2509688/2ebcadae16abc812.png)
第 8 名
Pysc2:星际争霸II学习环境。
[在Github上有3683颗星星] 由DeepMind的Timo Ewalds提供
![](https://img.haomeiwen.com/i2509688/7b23eb25a85e85fb.png)
第 9 名
AirSim:基于Unreal Engine的开源模拟器,用于微软AI&Research自主车辆。
[在Github上有3861颗星]。 由Microsoft的Shital Shah提供
![](https://img.haomeiwen.com/i2509688/81a098d70a7eebd3.png)
第 10 名
Facets: 机器学习数据集可视化工具。
![](https://img.haomeiwen.com/i2509688/5e551ff4a6d4dfae.png)
第 11 名
Style2Paints:人工智能图像彩色化。
[在Github上有3310颗星]
![](https://img.haomeiwen.com/i2509688/b60eab12d0366a4a.png)
第 12 名
Tensor2Tensor:用于广义序列-序列模型的工具库
[在Github上有3087颗星] 由Google Brain的Ryan Sepassi提供
![](https://img.haomeiwen.com/i2509688/47645dca72cd4797.png)
第 13 名
CycleGAN and pix2pix in PyTorch:基于 PyTorch 的图像-图像转换工具(例如horse2zebra,edges2cats等)。
[在Github上有2847颗星] 由伯克利的Jun-Yan Zhu博士提供
![](https://img.haomeiwen.com/i2509688/edfd91ff2376098b.png)
第 14 名
Faiss:用于密集向量高效相似性搜索和聚类的库。
[在Github上有2629颗星]。 由Facebook Research提供
![](https://img.haomeiwen.com/i2509688/9d6002c9b74ad0ae.png)
第 15 名
Fashion-mnist:一种类似于MNIST的时尚产品数据集。
[在Github上有2780颗星星] 由Zalando Tech的研究科学家Han Xiao提供
![](https://img.haomeiwen.com/i2509688/3abddec6503ec78b.png)
第 16 名
ParlAI:用于在各种公开可用的对话数据集上训练和评估人工智能模型的框架。
[在Github上有2578颗星]。 有Facebook研究院的Alexander Miller提供
![](https://img.haomeiwen.com/i2509688/083e9c70ca8ed304.png)
第 17 名
Fairseq:Facebook人工智能研究序列-序列的工具包。
[在Github上有2571颗星]
![](https://img.haomeiwen.com/i2509688/05281df6ef24183e.png)
第 18 名
Pyro:使用Python和PyTorch进行深度通用概率编程。
[在Github上有的2387颗星] 由Uber Engineering提供
![](https://img.haomeiwen.com/i2509688/b0fa99893c75f1a2.png)
第 19 名
iGAN:由GAN支持的交互式图像生成器。
[在Github上有2369颗星]
![](https://img.haomeiwen.com/i2509688/5099a3e494fe0dac.png)
第 20 名
Deep-image-prior:使用神经网络进行图像恢复,但无需学习神经网络。
[在Github上有2188颗星] 由Skoltech博士Dmitry Ulyanov提供
![](https://img.haomeiwen.com/i2509688/ea0242ec305fad8b.png)
第 21 名
Face_classification:使用fer2013/imdb数据集与keras CNN模型和openCV进行实时人脸检测和情感/性别分类。
[在Github上有1967星]
![](https://img.haomeiwen.com/i2509688/3b4e30e41c5f1157.png)
第 22 名
Speech-to-Text-WaveNet:使用DeepMind的WaveNet和tensorflow构成端到端的句级英语语音识别。
[在Github上有1961星] 由Kakao Brain的Namju Kim提供
![](https://img.haomeiwen.com/i2509688/4a606669d103677e.png)
第 23 名
StarGAN:用于多领域图像-图像转换的统一生成对抗网络。
[在Github上有1954颗星] 由韩国大学的Yunjey Choi提供
![](https://img.haomeiwen.com/i2509688/df8f64b44e855fe7.png)
第 24 名
Ml-agents:Unity机器学习代理。
[在Github上有的1658颗星] Deep Learning at Unity3D 的Unity Juliani提供
![](https://img.haomeiwen.com/i2509688/4131d1cb71849770.png)
第 25 名
DeepVideoAnalytics:分布式可视化搜索和可视化数据分析平台。
[在Github上有1494颗星] 由康奈尔大学的Akshay Bhat博士提供
![](https://img.haomeiwen.com/i2509688/6b4cb01924ec196b.png)
第 26 名
OpenNMT:Torch上的开源神经机器翻译。
[在Github上有1490颗星]
![](https://img.haomeiwen.com/i2509688/5f0b8a03253d5fd6.png)
第 27 名
Pix2pixHD:使用条件GANs合成和处理2048×1024分辨率的图像。
[在Github上有1283颗星] 由Nvidia的AI Research 科学家 Ming-Yu Liu提供
![](https://img.haomeiwen.com/i2509688/05a33162a4723334.png)
第 28 名
Horovod:TensorFlow的分布式训练框架。
[在Github上有1188颗星] 由Uber Engineering提供
![](https://img.haomeiwen.com/i2509688/af016ef918b42660.png)
第 29 名
AI-Blocks: 一个强大而直观的所见即所得的界面,能够允许任何人创建机器学习模型。
[在Github上有899颗星]
![](https://img.haomeiwen.com/i2509688/7051f378bad92cf0.png)
第 30 名
Voice Conversion with Non-Parallel Data:基于Tensorflow的深度神经网络语音转换(或语音风格转换)。
[在Github上有845颗星] 由AI Kakao Brain的AI 研究院的Dabi Ahn提供
![](https://img.haomeiwen.com/i2509688/120774bcec0c237e.png)
本文由阿里云云栖社区组织翻译。
文章原标题《30 Amazing Machine Learning Projects for the Past Year (v.2018)》
作者:Mybridge
译者:奥特曼,审校:袁虎。
网友评论