在7月28日的袋鼠云2022产品发布会上,基于对现在与未来的畅想,袋鼠云产研负责人思枢正式发布了全新的四大产品体系。
其中的数栈DTinsight,相信大家都很熟悉了,不同于数驹这位新朋友,数栈作为袋鼠云和大家经常见面的“老朋友”,在保持初心的同时,这次也有了一些不一样的变化。
作为袋鼠云打造的一站式大数据开发与治理平台——数栈DTinsight,包括离线数据开发、实时数据开发、数据服务、数据资产四款产品,在数据采集、加工、统一服务的基础上,将全域数据资产汇聚、数据治理融合其中,极大地缩短了数据价值的萃取过程,提高企业提炼数据价值的能力。

接下来我来为大家介绍一下“老朋友”数栈DTinsight,如何面向数据提供一站式数据开发与治理能力,帮助企业实现数据价值呈现。
早期企业在进行数据价值化建设过程中,为了更好的服务上层业务需求,从业务需求出发,驱动后端业务系统及对应数据库建设,这在一定程度上满足了上层业务需求。但随着业务需求的增多,业务复杂性的增加,相关的问题也暴露了出来:如超过TB级以上海量数据的分析能力差,各个业务板块数据进行融合分析难度高,面向多变市场的灵活性业务需求难满足等。
原有的基于业务需求快速迭代开发而形成的烟囱式业务系统,无法满足当下数字化场景需求,迫切需要一个能够处理多源异构数据源、PB级数据存储、强大分析引擎、标准数据规范,且灵活便捷的全新“系统”,而数栈DTinsight也由此而生。

数栈DTinsight,对标一站式数据开发与治理,在面向多源异构数据源时,通过数据汇聚能力实现全域数据打通,而后通过数栈多年经验形成的数据治理方法论,在数据开发过程中,形成数据资产,完成数据治理工作,并通过数据服务能力,将高质量的数据高效共享,为报表分析、决策分析等提供数据支撑,赋能各行各业。
在整个过程中数栈聚焦数据问题,打通数据链路,将全域数据资产汇聚,统一数据治理融合其中,缩短数据价值的萃取过程,增强企业提炼数据价值的能力,为企业提供一站式解决方案。
请大家看数栈的产品架构图:

在数栈整个产品的设计过程中,主要分为四大模块,分别是用于批任务的离线开发平台、用于实时任务的实时开发平台、用于数据治理的数据资产平台、用于数据服务的数据共享服务平台。
整个数栈通过集成自研的数据集成框架ChunJun对接30+异构数据源,包括传统的关系型数据库、NoSQL数据库HBase、文档数据库MongoDB、国产数据库达梦等,将数据统一存储在数驹或其他大数据平台,包括开源Hadoop体系以及商业版CDH、TDH、FI等,也可以存储在数仓引擎中包括GP、TiDB等,而后在这之上开展基于DataOps理念的数据价值化流程。
同时数栈各个板块基于解耦化的设计,能够基于客户需求灵活搭配,如离线+API完成传统数仓体系搭建,离线+资产+API构建数据治理体系,实时+API构建实时数仓等。
在这里也重点讲下数栈在DataOps理念下的实践。DataOps是一种协作式数据管理的实践,致力于改善组织中数据管理者与使用者之间数据流的沟通,集成和自动化。

数据开发同学在完成一个ETL任务的过程中,一般需要经过数据源的准备—数据同步—数据检查—数据处理—数据校验—数据分析这6个步骤。在这过程中:
● 持续开发
数栈提供了SQL IDE、Gitlab等开发工具,来支持敏捷的数据开发任务;
● 连续测试
数栈提供丰富的sql测试集和性能测试,达到保障数据准确性的作用;
● 持续部署
数栈提供一键式测试任务到生产任务的发布和大规模工作流的自动化编排;
● 数据治理
数栈提供元数据的自动化生命周期管理和全链路的数据血缘解析。
说了这么多,接下来重点聊聊数栈的产品特性,主要包含以下几点:
● DataOps
基于DataOps设计理念,数栈实现了数据全生命周期的质量监管和数据开发流程规范,为数据治理保驾护航;
● 数据还原
数栈不仅仅能够实现数据实时同步,也能实现源端数据结构到目的端的实时还原,真正做到数据复现,完整统一;
● 金融级安全
数据的全域打通在加快了数据价值化呈现进程的同时,也放大了数据安全隐患问题。数栈基于系统安全、数据安全、服务安全和行为审计四大维度,实现数据安全管控,操作有迹可循,避免数据泄露,保证数据安全高效地共享服务;
● 全域数据治理
通过打通数据壁垒,建立基于统一数据标准和数据模型,监控数据质量,形成高质量的数据资产,为上层业务提供便捷的数据服务,并能生成质量报告,不断优化数据,持续赋能数字化场景;
● 兼容开放
数栈秉承开放兼容的设计理念,兼容多种底层计算引擎包括开源Hadoop体系、商业Hadoop版本和多种数仓引擎,在国产信创道路上兼容多种国产操作系统、国产数据库、国产服务器以及国产芯片。同时本着基于开源回馈开源的思想,数栈也将核心组件进行了开源,包括数据集成框架ChunJun、百万级调度引擎Taier。

说完产品特性,接下来通过介绍三个数栈的实际应用场景,以点及面地帮助大家更好得理解数栈。
我们都知道随着移动APP的兴起,我们的金融交易不再局限于银行柜台,通过手机就可以实现各种各样的金融活动,这加大了金融交易的安全隐患,社会上因金融诈骗而被骗取钱财的新闻屡见不鲜。如何保证在海量金融交易过程中,进行金融交易行为的风险评估,保证消费者的权益是时下金融客户急需解决的问题。传统的数据分析模式,因数据标准不统一、数据质量差,导致数据分析逻辑复杂,耗时周期长,无法做到及时反馈结果,等发现时已为时已晚。
袋鼠云帮助金融客户借助数栈一站式数据开发与治理的能力,汇聚金融各种交易数据,构建金融的实时数仓,实现数据分析的毫秒级响应,让消费者在享受金融交易便捷性的同时,无感分析交易风险,避免金融诈骗等高危操作,同时对交易行为进行实时推送、异常行为实时预警,助力安全金融的构建。

我们知道在夏季,一些河流较多的城市容易发生洪涝,一旦降雨增多,还会附带泥石流等灾害因素,对应的各级政府在雨季对于洪涝抢险救灾一向是时刻关注。但传统的监控无法做到精准的灾害预警和灾后的应急响应,造成大量的国家资产损耗,甚至是人员伤亡。
袋鼠云数栈基于河流以及环境监测数据等,制定事前、事中、事后三步走策略,通过事前实时监测,包括降雨、水位等,实时将数据反馈到监控大屏中;然后在事中进行实时预测,包括降雨预测、灾害预警等,将未来可能发生的事情实时展示到大屏中,为灾害做好预防准备,及时通知人群疏散,最大程度避免人员伤亡;最后实现事后响应,对当前灾情进行统计分析,为抢险救灾提供数据决策支撑,合理调配人员安排,最大程度避免国家财产损失。

对于一个港口而言,货物吞吐量是衡量港口能力的一个因素,如何最大化提高港口货物吞吐是所有港口一直在思考的问题。传统的港口调度因各个区域的职责所属,无法感知全港口的货物走向,只能基于自身区域进行人员的调配和车辆的调配,实现区域内的“局部最优”,某种程度上提高了港口的货物吞吐量,无法实现“全局最优”。
袋鼠云数栈从全港口角度出发,打通全港口数据信息,感知全港口货物走向,了解各区域货物吞吐速率,针对“拥挤”区域,进行资源倾斜和人员调配,同时感知“未来货物”量,及时做好资源准备,最大程度上提高全港口的人员与车辆调度能力,实现港口货物吞吐量的最大化,让“信息化”港口升级为“智慧化”港口。

从2016年推出数栈算起,一晃眼,数栈已经走过了第六个年头,未来数栈将继续秉持初心,在不断打磨自身的同时,追求更深层次的突破。
未来规划
· 资源分配:从传统的定值设定,到结合任务负载,进行精细化参数调节,实现更加高效的资源利用。
· 数据共享:建立按需共享模式,实现企业内的跨业态、跨部门的经验分享,沉淀企业内的数据知识库,满足更高的数据共享需求。
· 数据监控:实现自动化干预数据,根据每日的任务运行情况等多维度信息建立系统自诊断能力,及早预测、发现、干预数据问题,变被动为主动。
· 数据校验:实现智能化规则创建,自动扫描SQL和表信息,获取不合规因素,自动建立合理的数据校验规则,降低手动配置工作量。

袋鼠云开源框架钉钉技术交流qun(30537511),欢迎对大数据开源项目有兴趣的同学加入交流最新技术信息,开源项目库地址:https://github.com/DTStack
无论您是想搭建桌面端、WEB端或者移动端APP应用,HOOPSPlatform组件都可以为您提供弹性的3D集成架构,同时,由工业领域3D技术专家组成的HOOPS技术团队也能为您提供技术支持服务。如果您的客户期望有一种在多个平台(桌面/WEB/APP,而且某些客户端是“瘦”客户端)快速、方便地将数据接入到3D应用系统的解决方案,并且当访问数据时,在各个平台上的性能和用户体验保持一致,HOOPSPlatform将帮助您完成。利用HOOPSPlatform,您可以开发在任何环境下的3D基础应用架构。HOOPSPlatform可以帮您打造3D创新型产品,HOOPSSDK包含的技术有:快速且准确的CAD
所有技术终将演变为基础设施。2022年6月11日,科创人·数智未来私董会第4期活动在线举办,本次活动由科创人、北航投资、方云智能联合举行;微软(中国)首席技术官韦青担任本期活动主讲嘉宾,携手14位企业高级决策者围绕数智未来课题进行深度探讨。科创人·数智未来私董会第3期活动回顾|《狗尾巴的故事-数智时代的第一性原理》与会嘉宾依次是:微软(中国)CTO韦青、领鹊科技创始人&CEO张志祥、食方科技创始人&CEO黄龚、中科云创创始人&CEO周北川、北航投资总经理王剑飞、中煤信息技术首席专家黄韶杰、天云数据创始人&CEO雷涛、中国农业银行科技与产品管理局信息安全与风险管理处处长何启翱、索迩科技创始人&C
我已经在OSX10.10.3上安装了:自制软件,命令行工具,然后使用rbenv安装ruby:ruby2.2.2p95(2015-04-13revision50295)[x86_64-darwin14]Rails4.2.2当我创建一个新的应用程序(使用默认的sqlite数据库)并尝试运行它时,它说:=>BootingWEBrick=>Rails4.2.2applicationstartingindevelopmentonhttp://localhost:3000=>Run`railsserver-h`formorestartupoptions=>Ctrl-Ctoshutdownser
我之前在OSX10.8.2MountainLion上安装了Rails,但我最近刚刚重新格式化了我的硬盘,并且正在重新设置计算机。我已经下载了RailsInstaller,因为我相信这就是我之前在10.8上安装Rails的方式,但是就在安装开始时,在输入我的全名和git电子邮件之后,我收到了一个错误。它声明出现错误。将/opt/rix组更改为rvm时出错。应用程序将立即退出。然后退出。它没有给我解决错误消息问题的方法,我想知道是否有其他人遇到过这种情况并且知道解决方法。非常感谢您的建议。 最佳答案 我收到了同样的错误信息。重新启动计算
我一直在尝试使用RoR。我参加了RubyInstallfest,但遇到了我认为是openssl.bundle的问题。我正在使用RVM,并且正在运行Rails5.0.1和Ruby2.4.0我尝试使用rvmimplode进行完全删除/重新启动,并重新安装了RailsAppsGuide之后的所有内容但我仍然看到相同的错误。我正在运行最新版本的macOSSierra。这是我在my_app中运行$Rake-T时得到的输出。richsmith@Richs-MacBook-Pro:~/workspace/myapp$rake-T/Users/richsmith/.rvm/rubies/ruby-2.
我正在学习Rails教程。我遇到RVM的版本问题,并且收到很多错误。我想从Ruby、Rails、Gemfiles等的干净版本开始。谁能给我一些关于如何卸载我的Ruby-on-Rails环境的简要说明? 最佳答案 试试这个:rvmgetheadrvmresetrvmremove...#taketheoutputofrvmlistanddorvmremoveforeachiteminthelistrvmcleanuprvmrepairrvmnotes#makesurethatyou'vegotallthedependenciesment
好的,我刚刚使用VirtualBox在Windows7上创建了一个全新的Ubuntu11.04安装(不确定这是否重要,但仅供引用)列出我得到的ruby:aaron@aaron-VirtualBox:~$rvmlistrvmrubies=>ruby-1.9.2-p290[x86_64]然后尝试安装railsgem我得到了这个:aaron@aaron-VirtualBox:~$geminstallrailsERROR:Loadingcommand:install(LoadError)nosuchfiletoload--zlibERROR:Whileexecutinggem...(NameE
我刚刚使用Homebrew和RVM安装了一个干净的Mavericks安装。brewdoctor和rvmrequirements都返回“allgood”,但是,当我在我的项目目录中运行bundleinstall时,我的大多数gem安装都很好,但少数安装失败并出现相同的以下错误:Bundler::GemspecError:Couldnotreadgemat/Users/NK/.rvm/gems/ruby-2.0.0-p353/cache/eventmachine-1.0.3.gem.Itmaybecorrupted.Anerroroccurredwhileinstallingeventma
Serverless时代已经到来!企业的技术架构,总是伴随着不断增长的数据与日趋复杂的业务持续演进。如何通过构建更易用的技术架构来聚焦在业务本身,而不必在底层基础设施的管理上投入过多的精力,是数据驱动型企业需要思考的重要议题。 ServerlessData作为云原生数据服务的下一代技术架构与“新常态”,正在推动云计算的进一步发展,并且已经成为云原生数据库、大数据分析乃至人工智能等云计算服务的重要发展趋势。Serverless所带来的不仅仅是IT技术领域的创新性飞跃,同时也是数字经济趋势下,企业实现快速发展的重要机遇。十七年持续创新全方位拥抱Serverless从2006年亚马逊云科技的第一个
踏浪而行,逐浪而上,MEME全新版本2.0乘势而来,荣耀上线,2022年7月27日,全网最难爆仓平台MEME携全新2.0版正式上线!MEME2.0版本探索更多功能,全面升级重新定义合约,体验感更好,交易更流畅,相比于原来的1.0,MEME2.0版本上线后,全面支持独立钱包与邮箱登陆,全网最难爆仓平台!从追赶者到领航者数字资产和区块链的成长过程,如同观察一个生态系统,一个新兴事物从无到有的蓬勃发展,这带给我们的冲击是前所未有的。尽管生态系统已经拥有相当悠久的历史,但数字化技术的出现改变了一切。不同于传统的生态圈,数字生态系统实现了1+1>2的协同效应。MEME全网首家Web3交互交易平台,去中心