美文网首页
新书《全栈数据之门》完整目录

新书《全栈数据之门》完整目录

作者: i败火 | 来源:发表于2017-03-21 17:13 被阅读481次
    封面

    全栈数据之门

    前言 自强不息,厚德载物

    0x1 Linux,自由之光

    0x10 Linux,你是我的眼

    0x11 Linux 基础,从零开始

    • 01 Linux 之门
    • 02 文件操作
    • 03 权限管理
    • 04 软件安装
    • 05 实战经验

    0x12 Sed 与Grep,文本处理

    • 01 文本工具
    • 02 grep 的使用
    • 03 grep 家族
    • 04 sed 的使用
    • 05 综合案例


      知识星球.jpeg

    0x13 数据工程,必备Shell

    • 01 Shell 分析
    • 02 文件探索
    • 03 内容探索
    • 04 交差并补
    • 05 其他常用的命令
    • 06 批量操作
    • 07 结语

    0x14 Shell 快捷键,Emacs 之门

    • 01 提高效率
    • 02 光标移动
    • 03 文本编辑
    • 04 命令搜索
    • 05 Emacs 入门
    • 06 Emacs 思维

    0x15 缘起Linux,一入Mac 误终身

    • 01 开源生万物
    • 02 有钱就换Mac
    • 03 程序员需求
    • 04 非程序员需求
    • 05 一入Mac 误终身

    0x16 大成就者,集群安装

    • 01 离线安装
    • 02 Host 与SSH 配置
    • 03 sudo 与JDK 环境
    • 04 准备Hadoop 包
    • 05 开启HTTP 与配置源
    • 06 安装ambari-server
    • 07 后续服务安装
    • 08 结语

    0x2 Python,道法自然

    0x20 Python,灵犀一指

    0x21 Python 基础,兴趣为王

    • 01 第一语言
    • 02 数据结构
    • 03 文件读写
    • 04 使用模块
    • 05 函数式编程
    • 06 一道面试题
    • 07 兴趣驱动

    0x22 喜新厌旧,2 迁移3

    • 01 新旧交替
    • 02 基础变化
    • 03 编码问题
    • 04 其他变化
    • 05 2to3 脚本
    • 06 PySpark 配置
    • 07 喜新厌旧

    0x23 Anaconda,IPython

    • 01 Anaconda
    • 02 安装与配置
    • 03 pip 与源
    • 04 IPython 与Jupyter
    • 05 结语

    0x24 美不胜收,Python 工具

    • 01 缘起
    • 02 调试与开发
    • 03 排版与格式化
    • 04 辅助工具
    • 05 实用推荐

    0x25 numpy 基础,线性代数

    • 01 numpy 的使用
    • 02 索引与切片
    • 03 变形与统计
    • 04 矩阵运算
    • 05 实用方法
    • 06 结语

    0x26 numpy 实战,PCA 降维

    • 01 PCA 介绍
    • 02 数据均值化
    • 03 协方差矩阵
    • 04 特征值与向量
    • 05 数据映射降维
    • 06 sklearn 实现

    0x3 大数据,其大无外

    0x30 太大数据,极生两仪

    0x31 神象住世,Hadoop

    • 01 Hadoop
    • 02 HDFS
    • 03 角色与管理
    • 04 文件操作
    • 05 结语

    0x32 分治之美,MapReduce

    • 01 map 与reduce 函数
    • 02 分而治之
    • 03 Hello,World
    • 04 Streaming 接口

    0x33 Hive 基础,蜂巢与仓库

    • 01 引言
    • 02 Hive 接口
    • 03 分区建表
    • 04 分区机制
    • 05 数据导入
    • 06 Hive-QL
    • 07 结语

    0x34 Hive 深入,实战经验

    • 01 排序与分布式
    • 02 多表插入与mapjoin
    • 03 加载map-reduce 脚本
    • 04 使用第三方UDF
    • 05 实战经验
    • 06 生成唯一ID

    0x35 HBase 库,实时业务

    • 01 理论基础
    • 02 Shell 操作
    • 03 关联Hive 表
    • 04 数据导入
    • 05 实用经验

    0x36 SQL 与NoSQL,Sqoop 为媒

    • 01 SQL 与NOSQL
    • 02 从MySQL 导入HDFS
    • 03 增量导入
    • 04 映射到Hive
    • 05 导入Hive 表
    • 06 从HDFS 导出到MySQL
    • 07 从Hive 导出到MySQL

    0x4 数据分析,见微知著

    0x40 大数据分析,鲁班为祖师

    0x41 SQL 技能,必备MySQL

    • 01 SQL 工具
    • 02 基础操作
    • 03 查询套路
    • 04 join 查询
    • 05 union 与exists
    • 06 实战经验

    0x42 快刀awk,斩乱数据

    • 01 快刀
    • 02 一二三要点
    • 03 一个示例
    • 04 应用与统计
    • 05 斩乱麻

    0x43 Pandas,数据之框

    • 01 数据为框
    • 02 加载数据
    • 03 行列索引
    • 04 行列操作
    • 05 合并聚合
    • 06 迭代数据
    • 07 结语

    0x44 Zeppelin,一统江湖

    • 01 心潮澎湃
    • 02 基本使用
    • 03 SQL 与可视化
    • 04 安装Zeppelin
    • 05 配置Zeppelin
    • 06 数据安全
    • 07 使用心得

    0x45 数据分组,聚合窗口

    • 01 MySQL 聚合
    • 02 Spark 聚合
    • 03 非聚合字段
    • 04 Hive 实现
    • 05 group_concat
    • 06 Hive 窗口函数
    • 07 DataFrame 窗口
    • 08 结语

    0x46 全栈分析,六层内功

    • 01 引言
    • 02 MySQL 版本
    • 03 awk 版本
    • 04 Python 版本
    • 05 Hive 版本
    • 06 map-reduce 版本
    • 07 Spark 版本
    • 08 结语

    0x5 机器学习,人类失控

    0x50 机器学习,琅琊论断

    • 0x51 酸酸甜甜,Orange
    • 01 可视化学习
    • 02 数据探索
    • 03 模型与评估
    • 04 组件介绍
    • 05 与Python 进行整合
    • 06 结语

    0x52 sklearn,机器学习

    • 01 sklearn 介绍
    • 02 数据预处理
    • 03 建模与预测
    • 04 模型评估
    • 05 模型持久化
    • 06 三个层次

    0x53 特征转换,量纲伸缩

    • 01 特征工程
    • 02 独热编码
    • 03 sklearn 示例
    • 04 标准化与归一化
    • 05 sklearn 与Spark 实现
    • 06 结语

    0x54 描述统计,基础指标

    • 01 描述性统计
    • 02 Pandas 实现
    • 03 方差与协方差
    • 04 Spark-RDD 实现
    • 05 DataFrame 实现
    • 06 Spark-SQL 实现
    • 07 结语

    0x55 模型评估,交叉验证

    • 01 测试与训练
    • 02 评价指标
    • 03 交叉验证
    • 04 验证数据
    • 05 OOB 数据

    0x56 文本特征,词袋模型

    • 01 自然语言
    • 02 中文分词
    • 03 词袋模型
    • 04 词频统计
    • 05 TF-IDF
    • 06 结语

    0x6 算法预测,占天卜地

    0x60 命由己做,福自己求

    0x61 近朱者赤,相亲kNN

    • 01 朴素的思想
    • 02 算法介绍
    • 03 分类与回归
    • 04 k 与半径
    • 05 优化计算
    • 06 实例应用

    0x62 物以类聚,Kmeans

    • 01 算法描述
    • 02 建立模型
    • 03 理解模型
    • 04 距离与相似性
    • 05 降维与可视化
    • 06 无监督学习

    0x63 很傻很天真,朴素贝叶斯

    • 01 朴素思想
    • 02 概率公式
    • 03 三种实现
    • 04 sklearn 示例
    • 05 朴素却不傻

    0x64 菩提之树,决策姻缘

    • 01 缘起
    • 02 Orange 演示
    • 03 scikit-learn 模拟
    • 04 熵与基尼指数
    • 05 决策过程分析
    • 06 Spark 模拟
    • 07 结语

    0x65 随机之美,随机森林

    • 01 树与森林
    • 02 处处随机
    • 03 sklearn 示例
    • 04 MLlib 示例
    • 05 特点与应用

    0x66 自编码器,深度之门

    • 01 深度学习
    • 02 特征学习
    • 03 自动编码器
    • 04 Keras 代码
    • 05 抗噪编码器

    0x7 Spark,唯快不破

    0x70 人生苦短,快用Spark

    0x71 PySpark 之门,强者联盟

    • 01 全栈框架
    • 02 环境搭建
    • 03 分布式部署
    • 04 示例分析
    • 05 两类算子
    • 06 map 与reduce
    • 07 AMPLab 的野心

    0x72 RDD 算子,计算之魂

    • 01 算子之道
    • 02 获取数据
    • 03 过滤与排序
    • 04 聚合数据
    • 05 join 连接
    • 06 union 与zip
    • 07 读写文件
    • 08 结语

    0x73 分布式SQL,蝶恋飞舞

    • 01 SQL 工具
    • 02 命令行CLI
    • 03 读Hive 数据
    • 04 将结果写入Hive
    • 05 读写MySQL 数据
    • 06 读写三种文件

    0x74 DataFrame,三角之恋

    • 01 DataFrame
    • 02 生成数据框
    • 03 合并与join
    • 04 select 操作
    • 05 SQL 操作
    • 06 自定义UDF
    • 07 三角之恋

    0x75 神器之父,Scala 入世

    • 01 Spark 与Scala
    • 02 Scala REPL
    • 03 编译Scala
    • 04 sbt 编译
    • 05 示例分析
    • 06 编译提交

    0x76 机器之心,ML 套路

    • 01 城市套路深
    • 02 算法与特征工程
    • 03 管道工作流
    • 04 OneHotEncoder 示例
    • 05 ML 回归实战
    • 06 特征处理与算法
    • 07 拟合与评估

    0x8 数据科学,全栈智慧

    0x80 才高八斗,共分天下

    0x81 自学数据,神蟒领舞

    • 01 机器学习
    • 02 语言领域
    • 03 Python 数据生态
    • 04 相关资料
    • 05 书籍推荐
    • 06 性感的职业
    知识星球.jpeg

    0x82 数据科学,七大技能

    • 01 七大技能
    • 02 SQL 与NoSQL 技能
    • 03 Linux 工具集
    • 04 Python 或者R 语言生态
    • 05 Hadoop 与Spark 生态
    • 06 概率、统计与线性代数
    • 07 机器学习与深度学习
    • 08 业务及杂项
    • 09 结语

    0x83 大无所大,生态框架

    • 01 计算生态
    • 02 离线计算
    • 03 交互分析
    • 04 实时处理
    • 05 算法挖掘
    • 06 发行版本
    • 07 其他工具

    0x84 集体智慧,失控哲学

    • 01 数据是宝
    • 02 一分为二
    • 03 回归统一
    • 04 聚少成多
    • 05 你中有我
    • 06 从小看大
    • 07 大事化小
    • 08 少即是多

    0x85 一技之长,一生之用

    • 01 一技之长
    • 02 数据分析相关
    • 03 Python 相关
    • 04 Hadoop 相关
    • 05 Spark 相关
    • 06 模型相关
    • 07 算法相关
    • 08 一生之用

    0x86 知识作谱,数据为栈

    • 01 知识作谱
    • 02 理论基础
    • 03 Python
    • 04 分析与可视化
    • 05 大数据
    • 06 ETL 与特征工程
    • 07 机器学习与深度学习
    • 08 工具与库
    • 09 全栈为用

    更多信息,请关注公众号

    全栈数据公众号

    相关文章

      网友评论

          本文标题:新书《全栈数据之门》完整目录

          本文链接:https://www.haomeiwen.com/subject/krpgnttx.html