MySQL+关联（上）

MySQL+关联（上）

作者: LuCh1Monster | 来源:发表于2016-07-14 23:33 被阅读42次

飞谷云 MySQL 第3讲

MySQL+表连接

课程概要：

回顾第二讲
表关联
文件关联
把数据导入Spark-SQL (DataFrame)

一、回顾第二讲

1、数据库基本内容

表
- 列
  - 主键
  - 索引
- 行

2、数据导入（出）

mysql
- sql 命令
- 工具（mysqldump，mysqlimport）
- 客户端

python
- pd.read_csv(path/file)

二、表关联

表关联类型
- 内连接（内连接）：
  - 仅显示满足条件的行
  - 下面两种写法：
  - From T1, T2 where T1.ID=T2.ID
  - From T1 inner join T2 ON T1.ID=T2.ID

左链接（左连接）：
- 显示左表T1中的所有行，并把右表T2中符合条件加到左表T1中
- From T1 left outer join T2 ON T1.ID=T2.ID

右链接（左连接）：
- 显示左表T1中的所有行，并把左表T1中符合条件加到右表T2中
- From T1 right outer join T2 ON T1.ID=T2.ID

全连接
-显示左表T1、右表T2两边中的所有行，即把左联结果表+右联结果表组合在一起，然后过滤掉重复的
From T1 full outer join T2 ON T1.ID=T2.ID

三、文件关联

文件关联类型：
- 与表关联一样
  - 通过主键或一些字段
- 如何实现
  - 通过一列或多列

四、把数据导入Spark-SQL

Spark-SQL 简介：
- Hadoop+MapReduce -> hive -> Shark -> Spark-SQL

RDD 与 DataFrame
- DataFrame 是以 RDD 为基础的分布式数据集
- DataFrame 类似于传统数据库的表
- DataFrame 带有 Schema元数据（类似表结构信息）
- 操作 RDD、DataFrame: Transformation 和 action

生成 DataFrame
- 初始化环境，实例化 SparkContext(sc)得SQLContext（对象）
- 创建 DataFrame(源于 RDD或其他数据源)
- 调用 DataFrame操作

相关文章

网友评论

本文标题：MySQL+关联（上）

本文链接：https://www.haomeiwen.com/subject/wftyjttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|MySQL+关联（上）|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！