jjzjj

从 Elasticsearch 到 Apache Doris,10 倍性价比的新一代日志存储分析平台

作者介绍:肖康,SelectDB技术副总裁导语日志数据的处理与分析是最典型的大数据分析场景之一,过去业内以Elasticsearch和GrafanaLoki为代表的两类架构难以同时兼顾高吞吐实时写入、低成本海量存储、实时文本检索的需求。ApacheDoris借鉴了信息检索的核心技术,在存储引擎上实现了面向AP场景优化的高性能倒排索引,对于字符串类型的全文检索和普通数值、日期等类型的等值、范围检索具有更高效的支持,相较于Elasticsearch实现性价比10余倍的提升,以此为日志存储与分析场景提供了更优的选择。日志数据分析的需求与特点日志数据在企业大数据中非常普遍,其体量往往在企业大数据体系中

十分钟掌握Doris,超越Hive、Elasticsearch和PostgreSQL

以前,数据仓库通常由ApacheHive、MySQL、Elasticsearch和PostgreSQL组成。它们支持数据仓库的数据计算和数据存储层:数据计算:ApacheHive作为计算引擎。数据存储:MySQL为DataBank、Tableau和我们面向客户的应用程序提供数据。Elasticsearch和PostgreSQL用于我们的DMP用户分割系统:前者存储用户分析数据,后者存储用户组数据包。不过,这样会导致数据管道又长又复杂,需要高维护成本,并且有损于开发效率。此外,它们无法进行特定查询。因此,作为数据仓库的升级,可以用ApacheDoris替换了其中大部分组件,这是一种基于MPP架构

Doris(七) -- 修改表、动态和临时分区、join的优化

修改表修改表名--1.将名为table1的表修改为table2ALTERTABLEtable1RENAMEtable2;--示例ALTERTABLEaggregate_testRENAMEaggregate_test1;--2.将表example_table中名为rollup1的rollupindex修改为rollup2ALTERTABLEbase_table_nameRENAMEROLLUPold_rollup_namenew_rollup_name;ALTERTABLEex_userRENAMEROLLUProllup_u_costnew_rollup_u_cost;descex_user

Flink进阶篇-CDC 原理、实践和优化&采集到Doris中

简介基于doris官方用doris构建实时仓库的思路,从flinkcdc到doris实时数仓的实践。原文 ApacheFlinkXApacheDoris构建极速易用的实时数仓架构(qq.com) 前提-FlinkCDC原理、实践和优化CDC是什么CDC是变更数据捕获(ChangeDataCapture)技术的缩写,它可以将源数据库(Source)的增量变动记录,同步到一个或多个数据目的(Sink)。在同步过程中,还可以对数据进行一定的处理,例如分组(GROUPBY)、多表的关联(JOIN)等。例如对于电商平台,用户的订单会实时写入到某个源数据库;A部门需要将每分钟的实时数据简单聚合处理后保存到

Apache Doris (一) :Doris 介绍及使用场景

目录1.ApacheDoris介绍2. ApacheDoris使用场景 2.1 报表分析2.2即席查询(Ad-hocQuery)​​​​​​​2.3 统一数仓构建​​​​​​​​​​​​​​2.4 数据湖联邦查询​​​​​​​​​​​​​​进入正文之前,欢迎订阅专题、对博文点赞、评论、收藏,关注IT贫道,获取高质量博客内容!1.ApacheDoris介绍ApacheDoris是一个基于MPP架构的高性能、实时的分析型数据库,以极速易用的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。基于此,ApacheDoris能

doris配置hive的catalog

创建hive的catalogCREATECATALOGhivePROPERTIES('type'='hms','hive.metastore.uris'='thrift://192.168.201.11:9083','hadoop.username'='hive','dfs.nameservices'='your-nameservice',

doris on k8s

背景Doris官网上有Kubernetes部署的文档,无奈根据官网的文档,构建完镜像无法成功启动。故参考官网做了一些改动,成功启动FE、BE节点。此探索为临时部署方案,还需再完善、优化。版本说明与限制组件版本Doris1.2.4.1Docker20.10.23Kubernetes1.22.12使用限制:只支持一个FE节点,BE节点可以弹性扩缩容,支持挂载卷,防止数据丢失。FE、BE服务挂掉后重新启动,需要短暂等待,节点状态正常后方可访问。部署流程部署非常简单,创建拷贝yaml文件内容,即可启动。若需修改版本,参考下文自定义镜像。以下为示例,详情可以查看GitHubdoris-k8s启动FE服务

【零基础】Doris集群安装部署(1.2.3 release)

此文阅读需要有Linux和服务器硬件基础!某些内容写的不是特别细,如果常见的linux基础命令tar、uzip、mv、mkdir、系统包的安装等等,以文字带过了,这样可以减少文章篇幅。官方的安装部署方式一定要好好看一下,最好是尝试着做一下,再看本教程最好!https://doris.apache.org/zh-CN/docs/dev/install/install-deploy本文章基于Doris1.2.3relase更新:更新日志请看Release1.2.3一.部署方式选择Doris安装部署分为两种方式:下载ApacheDoris源码进行编译:https://github.com/apach

重构实时离线一体化数仓,Apache Doris 在思必驰的应用实践

作者:赵伟,思必驰大数据高级研发,10年大数据开发和设计经验,负责大数据平台基础技术和OLAP分析技术开发。社区贡献:Doris-spark-connector的实时读写和优化。业务背景思必驰是国内专业的对话式人工智能平台公司,拥有全链路的智能语音语言技术,致力于成为全链路智能语音及语言交互的平台型企业,自主研发了新一代人机交互平台DUI和人工智能芯片TH1520,为车联网、IoT及政务、金融等众多行业场景合作伙伴提供自然语言交互解决方案。思必驰于2019年首次引入ApacheDoris,基于ApacheDoris构建了实时与离线一体的数仓架构。相对于过去架构,ApacheDoris凭借其灵活

Apache Doris (四) :Doris分布式部署(一) FE部署及启动

目录1.ApacheDoris下载2.节点划分3. 节点配置​​​​​​​4. FE部署及启动​​​​​进入正文之前,欢迎订阅专题、对博文点赞、评论、收藏,关注IT贫道,获取高质量博客内容!部署ApacheDoris时需要分别部署FE、BE、Broker。然后再建立FE,BE两者关系。ApacheDoris中部署多FE的思路为先在一台节点上配置部署一个FE并启动,相当于是启动Doris服务,然后配置更多的FE节点,添加到Doris服务中给该Doris的FE进行扩容,最终形成多节点FE。FE又分为Leader、Follwer和Observer三种角色,多节点FE中首先启动的FE节点自动为Lead