从传统数仓到湖仓一体,历经三十多年发展,技术的浪潮快速迭代,以云原生数仓为中心的现代数据栈时代已然到来。背后的核心的原因在于,企业正在加速走向数字化、智能化,对数据的应用也提出了全新要求,特别是对数据的实时分析、实时部署需求更加的强烈,而云数据仓库为用户实现云原生、智能运维、弹性资源等业务需求也带来了很好的支撑,成为今天企业数字化基础设施中的关键“底座”。本期内容主要邀请来自火山引擎的专家,分享云数仓领域关键技术、发展方向以及最佳实践,为广大数据领域从业者带来思考。活动时间:6月20日14:00-15:30活动内容:演讲议题一:揭秘新一代云数仓技术架构与最佳实践演讲人:Aurora火山引擎By
DataWorks开发规范1数仓基本概念1.4.1ods数据源层表命名规范1.4.2dim维表层表命名规范1.4.3dwd数据明细层表命名规范1.4.3dws数据明细层表命名规范1.4.4ads数据应用层表命名规范1.1数据仓库架构1.2数据仓库具体业务域划分1.3数据仓库数据流动方向1.4数据仓库中表命名规范2DataWorks开发规范2.2.1工作空间的创立2.2.2数据源的创立2.2.3数据开发页面简介2.2.4临时查询页面简介2.2.5公共表页面简介2.2.6函数列表页面简介2.1概述2.2DataWorks开发的准备工作3DataWorks开发规范3.2.1建立maxcompute
0说明本文以CDH搭建数据仓库,基于三台阿里云服务器从零开始搭建CDH集群,节点配置信息如下:节点内存安装服务角色chen10216Gcloudera-scm-serverchen1038Gcloudera-scm-agentchen1048Gcloudera-scm-agent上传需要用到的安装包:①CDH安装包,百度云分享如下:链接:https://pan.baidu.com/s/1N9QBYxpgGOKtEeaw7Y3bpQ提取码:o73t②JDK(JDK8+),百度云连接链接:https://pan.baidu.com/s/1BGw-y2sDLeqtA8ZSlf1JZw提取码:08c8
0说明本文以CDH搭建数据仓库,基于三台阿里云服务器从零开始搭建CDH集群,节点配置信息如下:节点内存安装服务角色chen10216Gcloudera-scm-serverchen1038Gcloudera-scm-agentchen1048Gcloudera-scm-agent上传需要用到的安装包:①CDH安装包,百度云分享如下:链接:https://pan.baidu.com/s/1N9QBYxpgGOKtEeaw7Y3bpQ提取码:o73t②JDK(JDK8+),百度云连接链接:https://pan.baidu.com/s/1BGw-y2sDLeqtA8ZSlf1JZw提取码:08c8
系列文章目录【SQL开发实战技巧】系列(一):关于SQL不得不说的那些事【SQL开发实战技巧】系列(二):简单单表查询【SQL开发实战技巧】系列(三):SQL排序的那些事【SQL开发实战技巧】系列(四):从执行计划讨论UNIONALL与空字符串&UNION与OR的使用注意事项【SQL开发实战技巧】系列(五):从执行计划看IN、EXISTS和INNERJOIN效率,我们要分场景不要死记网上结论【SQL开发实战技巧】系列(六):从执行计划看NOTIN、NOTEXISTS和LEFTJOIN效率,记住内外关联条件不要乱放【SQL开发实战技巧】系列(七):从有重复数据前提下如何比较出两个表中的差异数据及
系列文章目录【SQL开发实战技巧】系列(一):关于SQL不得不说的那些事【SQL开发实战技巧】系列(二):简单单表查询【SQL开发实战技巧】系列(三):SQL排序的那些事【SQL开发实战技巧】系列(四):从执行计划讨论UNIONALL与空字符串&UNION与OR的使用注意事项【SQL开发实战技巧】系列(五):从执行计划看IN、EXISTS和INNERJOIN效率,我们要分场景不要死记网上结论【SQL开发实战技巧】系列(六):从执行计划看NOTIN、NOTEXISTS和LEFTJOIN效率,记住内外关联条件不要乱放【SQL开发实战技巧】系列(七):从有重复数据前提下如何比较出两个表中的差异数据及
系列文章目录【SQL开发实战技巧】系列(一):关于SQL不得不说的那些事【SQL开发实战技巧】系列(二):简单单表查询【SQL开发实战技巧】系列(三):SQL排序的那些事【SQL开发实战技巧】系列(四):从执行计划讨论UNIONALL与空字符串&UNION与OR的使用注意事项【SQL开发实战技巧】系列(五):从执行计划看IN、EXISTS和INNERJOIN效率,我们要分场景不要死记网上结论【SQL开发实战技巧】系列(六):从执行计划看NOTIN、NOTEXISTS和LEFTJOIN效率,记住内外关联条件不要乱放【SQL开发实战技巧】系列(七):从有重复数据前提下如何比较出两个表中的差异数据及
系列文章目录【SQL开发实战技巧】系列(一):关于SQL不得不说的那些事【SQL开发实战技巧】系列(二):简单单表查询【SQL开发实战技巧】系列(三):SQL排序的那些事【SQL开发实战技巧】系列(四):从执行计划讨论UNIONALL与空字符串&UNION与OR的使用注意事项【SQL开发实战技巧】系列(五):从执行计划看IN、EXISTS和INNERJOIN效率,我们要分场景不要死记网上结论【SQL开发实战技巧】系列(六):从执行计划看NOTIN、NOTEXISTS和LEFTJOIN效率,记住内外关联条件不要乱放【SQL开发实战技巧】系列(七):从有重复数据前提下如何比较出两个表中的差异数据及
文章目录数仓维度层DWS层构建01:项目回顾02:项目目标03:维度建模回顾:建模流程04:维度建模回顾:维度设计05:维度建模回顾:维度模型数仓维度层DWS层构建01:项目回顾ODS层与DWD层的功能与区别是什么?ODS:原始数据层存储格式:AVRO数据内容:基本与原始数据是一致的DWD:明细数据层存储格式:Orc数据内容:基于与ODS层是一致的ODS层的需求是什么?自动化建库建表建表createtableone_make_ods.表名tableproperties(schema文件)表名表的注释表对应的HDFS地址Schema文件的地址DWD层的需求是什么?自动化建库建表建表createt
系列文章目录【SQL开发实战技巧】系列(一):关于SQL不得不说的那些事【SQL开发实战技巧】系列(二):简单单表查询【SQL开发实战技巧】系列(三):SQL排序的那些事【SQL开发实战技巧】系列(四):从执行计划讨论UNIONALL与空字符串&UNION与OR的使用注意事项【SQL开发实战技巧】系列(五):从执行计划看IN、EXISTS和INNERJOIN效率,我们要分场景不要死记网上结论【SQL开发实战技巧】系列(六):从执行计划看NOTIN、NOTEXISTS和LEFTJOIN效率,记住内外关联条件不要乱放【SQL开发实战技巧】系列(七):从有重复数据前提下如何比较出两个表中的差异数据及