动机:为了深入了解深度学习,我决定从零开始构建神经网络,并且不使用类似 Tensorflow 的深度学习库。我相信...[作者空间]
大数据文摘作品 编译:蒋宝尚 近日,Reddit终于采取行动,关闭了Deepfakes论坛,并更新了全网规则,称...[作者空间]
分组抽样 希望按照性别年龄分组, 去抽样查看他们的身高体重, 那么mysql可以这么写: 可odps 不支持这样的...[作者空间]
理论 机器学习的样本一般都是特征向量,但是除了特征向量以外经常有非特征化的数据,最常见的就是文本 结构化数据 当某...[作者空间]
最大联通子图 解释在无向图G中,若从顶点A到顶点B有路径相连,则称A和B是连通的;在图G种存在若干子图,其中每个子...[作者空间]
摘要:本文主要是用于学习。从实践中出发,利用TensorFlow解决NLP中的分类问题,主要包括多分类、多...[作者空间]
实时计算 上篇文章大致介绍了离线计算MapReduce和Spark,但是无法满足对实时性要求较高的业务,下面我们来...[作者空间]
结巴分词是对中文语言进行处理的一个Python模块 jieba分词的这个函数返回的高频词效果不太理想,在实际中我没...[作者空间]
步骤 分词、去停用词 词袋模型向量化文本 TF-IDF模型向量化文本 LSI模型向量化文本 计算相似度 理论知识 ...[作者空间]
图计算是大数据领域一个技术分支,可能没有离线分布式计算、流处理、分布式存储那么火热,但是也应用甚广。以我有限的了解...[作者空间]
摘自:http://www.toutiao.com/a6305624170701783298/其中的分析和可视化是...[作者空间]
本文主要是学习支持向量机的算法原理,并且用Python来实现相关算法。内容包括:SVM概述、线性可分支持向量机、线...[作者空间]
找到一个准确的机器学习模型,你的项目并没有完成。本文中你将学习如何使用scikit-learn来存储和导入机器学习...[作者空间]
在中文的文本挖掘中,对海量文本进行准确分词是其中至关重要一步。当前的Python语言下存在多种开源文本分析包,其中...[作者空间]
常用表操作 显示数据库下的表: 显示表列: 修改表名: 删除表: 删除mysql表中所有内容: 修改表列类型 修改...[作者空间]
翻译自:http://blog.yhat.com/posts/python-random-forest.html ...[作者空间]
在机器学习和数据挖掘的应用中,scikit-learn是一个功能强大的python包。在数据量不是过大的情况下,可...[作者空间]
引言 对于一些开始搞机器学习算法有害怕下手的小朋友,该如何快速入门,这让人挺挣扎的。在从事数据科学的人中,最常用的...[作者空间]