摘要:Spark SQL,Tidb 依赖准备 需要MySQL连接器驱动mysql-connector-java,u...[作者空间]
摘要:Java,Impala,Parquet 导数流程 通过Java直接在HDFS上落CSV数据文件,通过Imap...[作者空间]
摘要:Elasticsearch,Java 本文为《Elasticsearch搜索引擎构建入门与实战》第七章内容的...[作者空间]
摘要:Elasticsearch,Java script的作用 script是Elasticsearch的拓展功能...[作者空间]
摘要:Elasticsearch,Java 除了HTTP这种跨语言的访问方式之外,es支持Java,Python等...[作者空间]
摘要:Elasticsearch《Elasticsearch搜索引擎构建入门与实战》第三章读书笔记 索引操作 索引...[作者空间]
摘要:Elasticsearch 《Elasticsearch搜索引擎构建入门与实战》第一章读书笔记 Elasti...[作者空间]
摘要:Spark,ElasticSearch 依赖准备 注意Scala的版本(2.11),es的版本(6.7,2)...[作者空间]
摘要:Spark SQL 先上结论 空指针的情况:在UDF中正确指定了对应类型的前提下,DataFrame中的列如...[作者空间]
摘要:Spark SQL,Scala 由于Scala限制Tuple最大元素为22个导致的血案 问题复现 实际的业务...[作者空间]
摘要:Spark SQL 问题复现 需要对Spark SQL的DataFrame的一列做groupBy聚合其他所有...[作者空间]
摘要:Spark,Linux,Shell 学习一下spark2-shell的启动shell脚本,分析一下spark...[作者空间]
摘要:Hive,Shell Hive表复制语句 Hive复制表包括两种 复制表结构:只复制表结构到一个新表,新表没...[作者空间]
摘要:Neo4j,Python Neo4j下载安装 在Ubuntu系统下联网直接使用curl下载压缩包 移动目录并...[作者空间]
摘要:Sqoop,MySQL,Hive,Impala 在Spark跑批到Hive的任务后面加入Sqoop任务,将数...[作者空间]
摘要:MySQL,JSON类型,多值索引, 用户画像 MySQL是结构化数据存储,JSON是非结构化格式,在MyS...[作者空间]
摘要:MySQL,Ubuntu 为了体验一下高版本MySQL对于JSON多值索引的支持功能,特地在Ubuntu下下...[作者空间]
摘要:MySQL 表结构设计是MySQL架构设计最为基础的工作,优化表结构设计是开发规范,避免后期因为表结构设计不...[作者空间]
摘要:Spark,局部敏感哈希,矢量检索,推荐系统 使用背景 最近有个需求做百万级别实体的相关推荐,离线场景算完入...[作者空间]
摘要:列式存储,Parquet Parquet概述 Apache Parquet是面向分析型业务的列式存储格式,由...[作者空间]