jjzjj

大数据测试-hive、doris、clickhouse、mysql、elasticsearch、kudu、postgresql、sqlserver

大数据工作要接触很多的数据库和查询引擎数据库:1、hive:用于跑批,大批量,稳定,缺点:无update。用于数仓2、dorisdb:已更名starrocks。即时查询可达千亿级别文档:什么是StarRocks@StarRocks_intro@StarRocksDocs3、clickhouse:亿级别局限性:主表,单表支持能力强,join能力弱4、mysql:开源免费,十万级别查询5、elasticsearch:不支持join,有些函数不支持优点是检索快6、kudu:能支持update、千万级别。数据量大(百亿级别)性能问题明显7、postgresql:关系型数据库,支持很多分布式集群软件8、

大数据Doris(三十七):Spark Load导入HDFS数据

文章目录SparkLoad导入HDFS数据一、准备HDFS数据二、创建Doris表三、创建SparkLoad导入任务

Apache Doris

ApacheDoris教程1.Doris简介1.1Doris概述ApacheDoris由百度大数据部研发(之前叫百度Palo,2018年贡献到Apache社区后,更名为Doris),在百度内部,有超过200个产品线在使用,部署机器超过1000台,单一业务最大可达到上百TB。ApacheDoris是一个现代化的MPP(MassivelyParallelProcessing,即大规模并行处理)分析型(OLAP)数据库产品。仅需亚秒级响应时间即可获得查询结果,有效地支持实时数据分析。ApacheDoris的分布式架构非常简洁,易于运维,并且可以支持10PB以上的超大数据集。ApacheDoris可以

Doris(一)-简介、架构、编译、安装和数据表的基本使用

目录1、Doris简介2、Doris网址3、Doris架构3、编译和安装3.1、软硬件需求3.2、编译3.2.1、安装Docker环境3.2.2、使用Docker开发镜像编译3.3、集群部署3.3.1、创建目录并拷贝编译后的文件3.3.2、部署FE节点3.3.3、配置BE节点3.3.4、在FE中添加所有BE节点3.3.5、启动BE3.3.6、部署FS_Broker(可选)3.4、扩容和缩容3.4.1FE扩容和缩容3.4.2BE扩容和缩容3.4.3Broker扩容缩容4、数据表的基本使用4.1、创建用户和数据库4.2、Doris中数据表的基本概念4.2.1、Row&Column4.2.2、Par

Doris(一)-简介、架构、编译、安装和数据表的基本使用

目录1、Doris简介2、Doris网址3、Doris架构3、编译和安装3.1、软硬件需求3.2、编译3.2.1、安装Docker环境3.2.2、使用Docker开发镜像编译3.3、集群部署3.3.1、创建目录并拷贝编译后的文件3.3.2、部署FE节点3.3.3、配置BE节点3.3.4、在FE中添加所有BE节点3.3.5、启动BE3.3.6、部署FS_Broker(可选)3.4、扩容和缩容3.4.1FE扩容和缩容3.4.2BE扩容和缩容3.4.3Broker扩容缩容4、数据表的基本使用4.1、创建用户和数据库4.2、Doris中数据表的基本概念4.2.1、Row&Column4.2.2、Par

大数据Doris(二十七):Broker Load导入HDFS数据到Doris表

文章目录BrokerLoad导入HDFS数据到Doris表一、创建Doris表二、准备HDFS数据三、准备BrokerLoad语句

大数据Doris(二十六):Broker Load基本原理和语法介绍

文章目录BrokerLoad基本原理和语法介绍一、基本原理二、BrokerLoad语法BrokerLoad基本原理和语法介绍ApacheDoris架构中除了有BE和FE进程之外,还可以部署Broker可选进程,主要用于支持Doris读写远端存储上的文件和目录。例如:ApacheHDFS、阿里云OSS、亚马逊S3等。BrokerLoad这种数据导入

Doris最全使用手册

目录一:doris基础介绍1.1doris介绍1.1.1定义1.1.2具体的业务场景包括1.1.3Doris关键特性二:Doris与其它数据库比较三:底层索引与读写流程3.1Doris整体架构3.2Doris存储设计目标四:数据划分(分区、分桶)4.1分区&分桶&表4.2分区分桶使用4.3partition和bucket的数量和数据量的建议4.4复合分区与单分区五:数据模型特性与选择六:上卷6.1基本概念6.2rollup使用说明七:索引7.1前缀索引7.2bloomfilter索引7.3bitmap索引一:doris基础介绍1.1doris介绍1.1.1定义doris是一个基于mmp(mas

Doris最全使用手册

目录一:doris基础介绍1.1doris介绍1.1.1定义1.1.2具体的业务场景包括1.1.3Doris关键特性二:Doris与其它数据库比较三:底层索引与读写流程3.1Doris整体架构3.2Doris存储设计目标四:数据划分(分区、分桶)4.1分区&分桶&表4.2分区分桶使用4.3partition和bucket的数量和数据量的建议4.4复合分区与单分区五:数据模型特性与选择六:上卷6.1基本概念6.2rollup使用说明七:索引7.1前缀索引7.2bloomfilter索引7.3bitmap索引一:doris基础介绍1.1doris介绍1.1.1定义doris是一个基于mmp(mas

Doris的单机部署与安装

1.认识DorisDoris最初是由百度大数据研发部研发,之前在百度使用时叫做Palo,在贡献给Apache社区后更名为Doris。Doris是一个现代化的MPP(大规模并行处理)架构的分析型数据库。拥有亚秒级的查询响应,能够有效的支持实时数据分析。且易于运维,能够支撑10PB以上的超大的数据集。(MPP架构的数据库是将任务并行的分散到多个的节点上,进行协同计算,在每个节点将各自的计算任务处理完成之后,再将计算的结果进行汇总,输出最终的结果)Doris整体架构如下所示,Doris架构非常简单,只有两类进程Frontend(FE),主要负责用户请求的接入、查询解析规划、元数据的管理、节点管理相关