olap_JJZJJ

叮咚买菜基于 Apache Doris 统一 OLAP 引擎的应用实践

导读：随着叮咚买菜业务的发展，不同的业务场景对数据分析提出了不同的需求，他们希望引入一款实时OLAP数据库，构建一个灵活的多维实时查询和分析的平台，统一数据的接入和查询方案，解决各业务线对数据高效实时查询和精细化运营的需求。经过调研选型，最终引入ApacheDoris作为最终的OLAP分析引擎，Doris作为核心的OLAP引擎支持复杂地分析操作、提供多维的数据视图，在叮咚买菜数十个业务场景中广泛应用。作者｜叮咚买菜资深数据工程师韩青叮咚买菜创立于2017年5月，是一家专注美好食物的创业公司。叮咚买菜专注吃的事业，为满足更多人“想吃什么”而努力，通过美好食材的供应、美好滋味的开发以及美食品牌的孵

【大数据OLAP引擎】图文详解 Apache Doris 架构

深入了解Apache Doris一、ApacheDoris介绍ApacheDoris是一个基于 MPP 架构的高性能、实时的分析型数据库，以极速易用的特点被人们所熟知，仅需亚秒级响应时间即可返回海量数据下的查询结果，不仅可以支持高并发的点查询场景，也能支持高吞吐的复杂分析场景。基于此，ApacheDoris能够较好的满足报表分析、即席查询、统一数仓构建、数据湖联邦查询加速等使用场景，用户可以在此之上构建用户行为分析、AB实验平台、日志检索分析、用户画像分析、订单分析等应用。ApacheDoris最早是诞生于百度广告报表业务的Palo项目，2017年正式对外开源，2018年7月由百度捐赠给A

什么是OLAP？

文章目录1.1、OLAP简介1.2、什么是OLAP？1.3、OLAP可以对多维数据库执行五种类型：1.4、OLAP架构1.4、OLAP（在线分析处理）基本上分为三种类型：1.5、用途和优势1.6、缺点关注我的公众号【宝哥大数据】，更多干货1.1、OLAP简介OLAP是在线分析处理，顾名思义就是OLAP是用于数据分析的；因此，它使我们能够同时分析来自多个数据库系统的信息。换句话说，我们可以说它是一种计算方法，可以让用户轻松提取所需的数据并查询数据，以便从不同的角度进行分析。它基本上是基于庞大的数据，称为数据仓库；它从数据仓库中收集所需的数据并执行业务所需的分析，以在业务中做出一些决策，以提高利润

javascript - 浏览 OLAP 多维数据集

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭6年前。Improvethisquestion有人知道任何优秀的开源立方体浏览器吗？理想情况下，它应该是用纯javascript构建的东西。它真的存在吗？我计划将它与经典的asp一起使用，而不是SQL数据库。

java.lang.IllegalArgumentException : Unable to PTableType enum for value of 'MATERIALIZED VIEW' Exception with Phoenix and Hbase 异常

我对Saiku非常陌生。我正在尝试将saiku与phoenix整合。Phoenix实习生连接HBase。我创建了一个架构，当Saiku尝试加载phoenix架构xml时，我触发了以下错误。我正在焦躁不安地想办法解决这个问题。任何人都可以建议我是否遗漏了什么以及该怎么做。我正在使用以下版本的s/ws:凤凰4.4HBase1.1.2赛库3.8感谢您的支持。请在下面找到异常跟踪:java.lang.IllegalArgumentException:UnabletoPTableTypeenumforvalueof'MATERIALIZEDVIEW'atorg.apache.phoenix.sc

OLAP的统一及技术趋势：StarRocks 架构和实践分享

一、StarRocks 产品介绍EMRServerlessStarRocks产品目前主要以全托管和半托管两种形态存在。虽然我们目前并不主力推广半托管形态，但该形态仍会持续提供，以满足部分用户在云端快速构建、部署和运维的需求。半托管版本采用开源模式，并在运维方面提供一定的支持。相较而言，我们更倾向于引导用户使用全托管形态，因为它除了具备StarRocks所宣传的极速统一等特性外，还提供了全托管服务，在serverless环境下实现了免运维。此外，还针对内核和管控方面做了许多数据运维管理工作，例如可视化分析MySQL的性能数据、导入任务管理、元数据管理以及外表元数据管理等。为了方便用户进行Adho

开源大数据 OLAP 的思考及优秀实践

一、开源OLAP综述近年来开源领域涌现出了众多优秀产品，如StarRocks、Doris、湖数据、湖格式、Spark以及早期的HBase、Presto等。种类繁多的开源工具为用户带来了便利，同时也带来了选择难题。上图中对各种数据库做了简单的分类。例如，StarRocks、Doris和CK等，它们在过去主要是存算一体的AP数据库。而Presto、Trino和Impala等则是经典的基于Hadoop的MPP引擎。此外，Kylin、Hbase和Druid等在预处理方面有较多应用。还有一类是近年来流行的湖格式（湖存储）工具，其中包括Deltalake、Hudi、Iceberg，以及几个月前刚孵化的Ap

滴滴OLAP的技术实践与发展方向

一、背景介绍：滴滴OLAP的发展历程及最终为什么选择StarRocks滴滴的OLAP系统，早期是基于Druid的实时监控系统，2017年基于Kylin的离线查询加速应用逐步起步，到2018年后开始全面发展，Druid、Kylin及Presto并存，用于承接实时监控、实时看版、数据分析等场景。随着业务的使用量和复杂度的提升，原有的引擎在性能、稳定性、易用性、及维护成本等多方面，都无法满足复杂的业务应用要求。在2020年前后，滴滴引入了当时业界广泛使用的ClickHouse引擎，作为开源的OLAP，采用列式存储模式，号称比MySQL快1000倍，最大的特色在于向量化的计算引擎，单机性能很强悍。滴滴

olap/spark-tungsten：codegen

15721这一章没什么好说的，不再贴课程内容了。codegen和simd在工业界一般只会选一种实现。比如phothon之前用codegen，然后改成了向量化引擎。一般gen的都是weldIR/LLVMIR/当前语言，gen成C++的也要检查是不是有本地预编译版本，要不没法用。因为clickhouse没有codegen，这节课就拿我比较熟悉的spark的tungsten来当例子，tungsten会gen成scala，然后拿janino动态编译。tungsten主要有两个特色：一个是codegen，另一个是in-heapmemory的管理。本文顺便把它的内存管理也分析一下。在jvm堆内自由分配内存

OLAP引擎也能实现高性能向量检索，据说QPS高于milvus！

更多技术交流、求职机会，欢迎关注字节跳动数据平台微信公众号，回复【1】进入官方交流群随着LLM技术应用及落地，数据库需要提高向量分析以及AI支持能力，向量数据库及向量检索等能力“异军突起”，迎来业界持续不断关注。简单来说，向量检索技术以及向量数据库能为LLM提供外置的记忆单元，通过提供与问题及历史答案相关联的内容，协助LLM返回更准确的答案。不仅仅是LLM，向量检索也早已在OLAP引擎中应用，用来提升非结构化数据的分析和检索能力。ByteHouse是火山引擎推出的云原生数据仓库，近期推出高性能向量检索能力，本篇将结合ByteHouse团队对向量数据库行业和技术的前沿观察，详细解读OLAP引擎如