美文网首页ai学习人工智能机器学习和人工智能入门
【超级重磅】626篇!机器学习&深度学习资料汇总(五)

【超级重磅】626篇!机器学习&深度学习资料汇总(五)

作者: Major术业 | 来源:发表于2017-05-24 10:48 被阅读133次

    【贡献者】ty4z2008、pkuphy、peimin、jappre、CSerxy

    【整理者】ty4z2008

    【源链接】https://github.com/ty4z2008/Qix/blob/master/dl.md

    【备注】源链接为总链接,共包括626个子链接

    【编辑】Major术业,在原文基础上,为每篇标记上序号,方便大家区分和查阅



    401《How to Choose a Neural Network》

    介绍:deeplearning4j官网提供的实际应用场景NN选择参考表,列举了一些典型问题建议使用的神经网络

    402《Deep Learning (Python, C/C++, Java, Scala, Go)》

    介绍:一个深度学习项目,提供了Python, C/C++, Java, Scala, Go多个版本的代码

    403《Deep Learning Tutorials》

    介绍:深度学习教程,github

    404《自然语言处理的发展趋势——访卡内基梅隆大学爱德华·霍威教授》

    介绍:自然语言处理的发展趋势——访卡内基梅隆大学爱德华·霍威教授.

    405《FaceNet: A Unified Embedding for Face Recognition and Clustering》

    介绍:Google对Facebook DeepFace的有力回击—— FaceNet,在LFW(Labeled Faces in the Wild)上达到99.63%准确率(新纪录),FaceNet embeddings可用于人脸识别、鉴别和聚类.

    406《MLlib中的Random Forests和Boosting》

    介绍:本文来自Databricks公司网站的一篇博客文章,由Joseph Bradley和Manish Amde撰写,文章主要介绍了Random Forests和Gradient-Boosted Trees(GBTs)算法和他们在MLlib中的分布式实现,以及展示一些简单的例子并建议该从何处上手.中文版.

    407《Sum-Product Networks(SPN) 》

    介绍:华盛顿大学Pedro Domingos团队的DNN,提供论文和实现代码.

    408《Neural Network Dependency Parser》

    介绍:基于神经网络的自然语言依存关系解析器(已集成至Stanford CoreNLP),特点是超快、准确,目前可处理中英文语料,基于《A Fast and Accurate Dependency Parser Using Neural Networks》 思路实现.

    409《神经网络语言模型》

    介绍:本文根据神经网络的发展历程,详细讲解神经网络语言模型在各个阶段的形式,其中的模型包含NNLM[Bengio,2003]、Hierarchical NNLM[Bengio, 2005], Log-Bilinear[Hinton, 2007],SENNA等重要变形,总结的特别好.

    410《Classifying Spam Emails using Text and Readability Features》

    介绍:经典问题的新研究:利用文本和可读性特征分类垃圾邮件。

    411《BCI Challenge @ NER 2015》

    介绍:Kaggle脑控计算机交互(BCI)竞赛优胜方案源码及文档,包括完整的数据处理流程,是学习Python数据处理和Kaggle经典参赛框架的绝佳实例

    412《IPOL Journal · Image Processing On Line》

    介绍:IPOL(在线图像处理)是图像处理和图像分析的研究期刊,每篇文章都包含一个算法及相应的代码、Demo和实验文档。文本和源码是经过了同行评审的。IPOL是开放的科学和可重复的研究期刊。我一直想做点类似的工作,拉近产品和技术之间的距离.

    413《Machine learning classification over encrypted data》

    介绍:出自MIT,研究加密数据高效分类问题.

    414《purine2》

    介绍:新加坡LV实验室的神经网络并行框架Purine: A bi-graph based deep learning framework,支持构建各种并行的架构,在多机多卡,同步更新参数的情况下基本达到线性加速。12块Titan 20小时可以完成Googlenet的训练。

    415《Machine Learning Resources》

    介绍:这是一个机器学习资源库,虽然比较少.但蚊子再小也是肉.有突出部分.此外还有一个由zheng Rui整理的机器学习资源.

    416《Hands-on with machine learning》

    介绍:Chase Davis在NICAR15上的主题报告材料,用Scikit-Learn做监督学习的入门例子.

    417《The Natural Language Processing Dictionary》

    介绍:这是一本自然语言处理的词典,从1998年开始到目前积累了成千上万的专业词语解释,如果你是一位刚入门的朋友.可以借这本词典让自己成长更快.

    418《PageRank Approach to Ranking National Football Teams》

    介绍:通过分析1930年至今的比赛数据,用PageRank计算世界杯参赛球队排行榜.

    419《R Tutorial》

    介绍:R语言教程,此外还推荐一个R语言教程An Introduction to R.

    420《Fast unfolding of communities in large networks》

    介绍:经典老文,复杂网络社区发现的高效算法,Gephi中的[Community detection](The Louvain method for community detection in large networks)即基于此.

    421《NUML》

    介绍: 一个面向 .net 的开源机器学习库,github地址

    422《synaptic.Js》

    介绍: 支持node.js的JS神经网络库,可在客户端浏览器中运行,支持LSTM等 github地址

    423《Machine learning for package users with R (1): Decision Tree》

    介绍: 决策树

    424《Deep Learning, The Curse of Dimensionality, and Autoencoders》

    介绍: 讨论深度学习自动编码器如何有效应对维数灾难,国内翻译

    425《Advanced Optimization and Randomized Methods》

    介绍: CMU的优化与随机方法课程,由A. Smola和S. Sra主讲,优化理论是机器学习的基石,值得深入学习 国内云(视频)

    426《CS231n: Convolutional Neural Networks for Visual Recognition》

    介绍: "面向视觉识别的CNN"课程设计报告集锦.近百篇,内容涉及图像识别应用的各个方面

    427《Topic modeling with LDA: MLlib meets GraphX》

    介绍:用Spark的MLlib+GraphX做大规模LDA主题抽取.

    428《Deep Learning for Multi-label Classification》

    介绍: 基于深度学习的多标签分类,用基于RBM的DBN解决多标签分类(特征)问题

    429《Google DeepMind publications》

    介绍: DeepMind论文集锦

    430《kaldi》

    介绍: 一个开源语音识别工具包,它目前托管在sourceforge上面

    431《Data Journalism Handbook》

    介绍: 免费电子书《数据新闻手册》, 国内有热心的朋友翻译了中文版,大家也可以在线阅读

    432《Data Mining Problems in Retail》

    介绍: 零售领域的数据挖掘文章.

    433《Understanding Convolution in Deep Learning》

    介绍: 深度学习卷积概念详解,深入浅出.

    434《pandas: powerful Python data analysis toolkit》

    介绍: 非常强大的Python的数据分析工具包.

    435《Text Analytics 2015》

    介绍: 2015文本分析(商业)应用综述.

    436《Deep Learning libraries and ?rst experiments with Theano》

    介绍: 深度学习框架、库调研及Theano的初步测试体会报告.

    437《DEEP learning》

    介绍: MIT的Yoshua Bengio, Ian Goodfellow, Aaron Courville著等人讲深度学习的新书,还未定稿,线上提供Draft chapters收集反馈,超赞!强烈推荐.

    438《simplebayes》

    介绍: Python下开源可持久化朴素贝叶斯分类库.

    439《Paracel》

    介绍:Paracel is a distributed computational framework designed for machine learning problems, graph algorithms and scientific computing in C++.

    440《HanLP:Han Language processing》

    介绍: 开源汉语言处理包.

    441《Simple Neural Network implementation in Ruby》

    介绍: 使用Ruby实现简单的神经网络例子.

    442《Hacker's guide to Neural Networks》

    介绍:神经网络黑客入门.

    443《The Open-Source Data Science Masters》

    介绍:好多数据科学家名人推荐,还有资料.

    444《Text Understanding from Scratch》

    介绍:实现项目已经开源在github上面Crepe

    445《 Improving Distributional Similarity with Lessons Learned from Word Embeddings》

    介绍:作者发现,经过调参,传统的方法也能和word2vec取得差不多的效果。另外,无论作者怎么试,GloVe都比不过word2vec.

    446《CS224d: Deep Learning for Natural Language Processing》

    介绍:Stanford深度学习与自然语言处理课程,Richard Socher主讲.

    447《Math Essentials in Machine Learning》

    介绍:机器学习中的重要数学概念.

    448《Improved Semantic Representations From Tree-Structured Long Short-Term Memory Networks》

    介绍:用于改进语义表示的树型LSTM递归神经网络,句子级相关性判断和情感分类效果很好.实现代码.

    449《Statistical Machine Learning》

    介绍:卡耐基梅隆Ryan Tibshirani和Larry Wasserman开设的机器学习课程,先修课程为机器学习(10-715)和中级统计学(36-705),聚焦统计理论和方法在机器学习领域应用.

    450《AM207: Monte Carlo Methods, Stochastic Optimization》

    介绍:《哈佛大学蒙特卡洛方法与随机优化课程》是哈佛应用数学研究生课程,由V Kaynig-Fittkau、P Protopapas主讲,Python程序示例,对贝叶斯推理感兴趣的朋友一定要看看,提供授课视频及课上IPN讲义.

    451《生物医学的SPARK大数据应用》

    介绍:生物医学的SPARK大数据应用.并且伯克利开源了他们的big data genomics系统ADAM,其他的内容可以关注一下官方主页.

    452《ACL Anthology》

    介绍:对自然语言处理技术或者机器翻译技术感兴趣的亲们,请在提出自己牛逼到无以伦比的idea(自动归纳翻译规律、自动理解语境、自动识别语义等等)之前,请通过谷歌学术简单搜一下,如果谷歌不可用,这个网址有这个领域几大顶会的论文列表,切不可断章取义,胡乱假设.

    453《Twitter Sentiment Detection via Ensemble Classification Using Averaged Confidence Scores》

    介绍:论文+代码:基于集成方法的Twitter情感分类,实现代码.

    454《NIPS 2014 CIML workshop》

    介绍:NIPS CiML 2014的PPT,NIPS是神经信息处理系统进展大会的英文简称.

    455《CS231n: Convolutional Neural Networks for Visual Recognition》

    介绍:斯坦福的深度学习课程的Projects 每个人都要写一个论文级别的报告 里面有一些很有意思的应用 大家可以看看 .

    456《A Speed Comparison Between Flexible Linear Regression Alternatives in R》

    介绍:R语言线性回归多方案速度比较具体方案包括lm()、nls()、glm()、bayesglm()、nls()、mle2()、optim()和Stan’s optimizing()等.

    457《Back-to-Basics Weekend Reading - Machine Learning》

    介绍:文中提到的三篇论文(机器学习那些事、无监督聚类综述、监督分类综述)都很经典,Domnigos的机器学习课也很精彩

    458《A Probabilistic Theory of Deep Learning》

    介绍:莱斯大学(Rice University)的深度学习的概率理论.

    459《Nonsensical beer reviews via Markov chains》

    介绍:基于马尔可夫链自动生成啤酒评论的开源Twitter机器人,github地址.

    460《Deep Learning for Natural Language Processing (without Magic)》

    介绍:视频+讲义:深度学习用于自然语言处理教程(NAACL13).

    461《Introduction to Data Analysis using Machine Learning》

    介绍:用机器学习做数据分析,David Taylor最近在McGill University研讨会上的报告,还提供了一系列讲机器学习方法的ipn,很有价值 GitHub.国内

    462《Beyond Short Snippets: Deep Networks for Video Classification》

    介绍:基于CNN+LSTM的视频分类,google演示.

    463《How does Quora use machine learning in 2015?》

    介绍:Quora怎么用机器学习.

    464《Amazon Machine Learning – Make Data-Driven Decisions at Scale》

    介绍:亚马逊在机器学习上面的一些应用,代码示例.

    465《Parallel Machine Learning with scikit-learn and IPython》

    介绍:并行机器学习指南(基于scikit-learn和IPython).notebook

    466《Intro to machine learning with scikit-learn》

    介绍:DataSchool的机器学习基本概念教学.

    467《DeepCLn》

    介绍:一个基于OpenGL实现的卷积神经网络,支持Linux及Windows系.

    468《An Inside Look at the Components of a Recommendation Engine》

    介绍:基于Mahout和Elasticsearch的推荐系统.

    469《Forecasting in Economics, Business, Finance and Beyond》

    介绍:Francis X. Diebold的《(经济|商业|金融等领域)预测方法.

    470《Time Series Econometrics - A Concise Course》

    介绍:Francis X. Diebold的《时序计量经济学》.

    471《A comparison of open source tools for sentiment analysis》

    介绍:基于Yelp数据集的开源情感分析工具比较,评测覆盖Naive Bayes、SentiWordNet、CoreNLP等 .

    472《Pattern Recognition And Machine Learning》

    介绍:国内Pattern Recognition And Machine Learning读书会资源汇总,各章pdf讲稿,博客.

    473《Probabilistic Data Structures for Web Analytics and Data Mining 》

    介绍:用于Web分析和数据挖掘的概率数据结构.

    474《Machine learning in navigation devices: detect maneuvers using accelerometer and gyroscope》

    介绍:机器学习在导航上面的应用.

    475《Neural Networks Demystified 》

    介绍:Neural Networks Demystified系列视频,Stephen Welch制作,纯手绘风格,浅显易懂,国内云.

    476《swirl + DataCamp 》

    介绍:{swirl}数据训练营:R&数据科学在线交互教程.

    477《Learning to Read with Recurrent Neural Networks 》

    介绍:关于深度学习和RNN的讨论 Sequence to Sequence Learning with Neural Networks.

    478《深度强化学习(Deep Reinforcement Learning)的资源》

    介绍:Deep Reinforcement Learning.

    479《Machine Learning with Scikit-Learn》

    介绍:(PyCon2015)Scikit-Learn机器学习教程,Parallel Machine Learning with scikit-learn and IPython.

    480《PDNN》

    介绍:PDNN: A Python Toolkit for Deep Learning.

    481《Introduction to Machine Learning》

    介绍:15年春季学期CMU的机器学习课程,由Alex Smola主讲,提供讲义及授课视频,很不错.国内镜像.

    482《Big Data Processing》

    介绍:大数据处理课.内容覆盖流处理、MapReduce、图算法等.

    483《Spark MLlib: Making Practical Machine Learning Easy and Scalable》

    介绍:用Spark MLlib实现易用可扩展的机器学习,国内镜像.

    484《Picture: A Probabilistic Programming Language for Scene Perception》

    介绍:以往上千行代码概率编程(语言)实现只需50行.

    485《Beautiful plotting in R: A ggplot2 cheatsheet》

    介绍:ggplot2速查小册子,另外一个,此外还推荐《A new data processing workflow for R: dplyr, magrittr, tidyr, ggplot2》.

    486《Using Structured Events to Predict Stock Price Movement: An Empirical Investigation》

    介绍:用结构化模型来预测实时股票行情.

    487《International Joint Conference on Artificial Intelligence Accepted paper》

    介绍:国际人工智能联合会议录取论文列表,大部分论文可使用Google找到.

    488《Why GEMM is at the heart of deep learning》

    介绍:一般矩阵乘法(GEMM)对深度学习的重要性.

    489《Distributed (Deep) Machine Learning Common》

    介绍:A Community of awesome Distributed Machine Learning C++ projects.

    490《Reinforcement Learning: An Introduction》

    介绍:免费电子书<强化学习介绍>,第一版(1998),第二版(2015草稿),相关课程资料,Reinforcement Learning.

    491《Free ebook: Microsoft Azure Essentials: Azure Machine Learning》

    介绍:免费书:Azure ML使用精要.

    492《A Deep Learning Tutorial: From Perceptrons to Deep Networks》

    介绍:A Deep Learning Tutorial: From Perceptrons to Deep Networks.

    493《Machine Learning is Fun! - The world’s easiest introduction to Machine Learning》

    介绍:有趣的机器学习:最简明入门指南,中文版.

    494《A Brief Overview of Deep Learning》

    介绍:深度学习简明介绍,中文版.

    495《Wormhole》

    介绍:Portable, scalable and reliable distributed machine learning.

    496《convnet-benchmarks》

    介绍:CNN开源实现横向评测,参评框架包括Caffe 、Torch-7、CuDNN 、cudaconvnet2 、fbfft、Nervana Systems等,NervanaSys表现突出.

    497《This catalogue lists resources developed by faculty and students of the Language Technologies Institute.》

    介绍:卡耐基梅隆大学计算机学院语言技术系的资源大全,包括大量的NLP开源软件工具包,基础数据集,论文集,数据挖掘教程,机器学习资源.

    498《Sentiment Analysis on Twitter》

    介绍:Twitter情感分析工具SentiTweet,视频+讲义.

    499《Machine Learning Repository @ Wash U》

    介绍:华盛顿大学的Machine Learning Paper Repository.

    500《Machine learning cheat sheet》

    介绍:机器学习速查表.

    (未完待续......)

    相关文章

      网友评论

        本文标题:【超级重磅】626篇!机器学习&深度学习资料汇总(五)

        本文链接:https://www.haomeiwen.com/subject/cxinxxtx.html