目录一、前言二、两个小目标三、kettle核心概念介绍3.1转换3.1.1步骤(Step)3.1.2跳(Hop)3.1.3元素据3.1.4数据类型3.1.5并发执行3.2作业四、实践操作4.1案例1将csv文件转换成excel文件4.1.1在kettle中新建一个转换4.1.2选择输入控件并设置4.1.3选择输出控件并设置4.1.4按住shift通过跳将输入输出两步骤连接起来4.1.5点击启动按钮执行转换4.1.6查看日志,并检查是否成功4.2案列2将excel文件导入MySQL数据库4.2.1和上面步骤一样我们需要新建一个转换4.2.2新建数据库连接4.2.3拖入Excel输入控件并设置4.
一、Kettle环境搭建一、Windows主要用于可视化创建数据迁移用到的ktr转换脚本、kjb作业脚本,以及脚本需要配置的DB2信息、读写性能优化信息等,也可直接在客户端完成不同数据库之间的数据迁移。测试库表及数据(1)创建测试库表分别在Windows(模拟旧库环境)及Linux(模拟新库环境),创建一个测试库test以及两张测试库表test.demo_info、test.demo_info2,这里为了方便测试,我两张表除了表名不一样,其他字段都一样,测试表的主键为ID,使用了auto_increment设置主键从1开始自增长,MySQL中int类型占用4个byte字节,即最大数值是(2^3
总流程讲解流程讲解:基础流程是1.首先根据调用的接口所需要的参数或其他配置信息进行信息生成(有些简单的接口无需这一步来生成信息,可以直接在接口调用组件中进行调用)。2.将配置信息传入,进行接口调用。(简单的接口可以直接在这步开始)。3.将调用接口返回的json数据解析转换成字段类型。4.将解析好的数据插入到数据库中。调用接口基础流程的四个流程的组件:将入参等所需信息生成的组件,可以用表输入或者生成记录等组件来完成。访问接口的组件,kettle中有三种访问组件,HTTPPOST、HTTPCLIENT、RESTCLIEENT,这三个的区别是HTTPPOST是调用post接口、HTTPCLIENT是
一、前言最近由于工作需要,需要用到kettle工具进行数据迁移转换。特意找资料学习了一下,kettle基本操作算是学会了。所学的也结合实际工作进行了验证。为了防止以后用到忘记了,便写了几篇文章记录一下。二、ETL简介ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程)。在企业种我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种etl工具的使用,对开发人员来说必不可少,这里我要学习的ETL工具是Kettle!。三、Kettle简介3.1kettle是什么?Kettle是一款国外的开源ETL工具,纯java编写,可以在Windows、Linux、Un
前言Kettle是小有名气的开源ETL工具,现已改名为PDI(PentahoDataIntegration),其Web版本为:WebSpoon,本文记录了从官方Git仓库中拉取代码并成功运行的过程。一、在本地拉取并编译项目参考来源:Kettle的Git官方页面的webspoon-9.0分支的README文件编译依赖项目根据_Buildandlocallypublishdependentlibraries_部分可知,需要预先在本地编译部分依赖项目。pentaho-xul-swt$gitclone-bwebspoon-9.0https://github.com/HiromuHota/pentaho
前言Kettle是小有名气的开源ETL工具,现已改名为PDI(PentahoDataIntegration),其Web版本为:WebSpoon,本文记录了从官方Git仓库中拉取代码并成功运行的过程。一、在本地拉取并编译项目参考来源:Kettle的Git官方页面的webspoon-9.0分支的README文件编译依赖项目根据_Buildandlocallypublishdependentlibraries_部分可知,需要预先在本地编译部分依赖项目。pentaho-xul-swt$gitclone-bwebspoon-9.0https://github.com/HiromuHota/pentaho
安装部署其实kettle很好安装的,在linux和windows上解压,就可以用了,但是在Mac上,我说的是arm架构的芯片的mac上,也就是目前的m1和m2上是不行的I'msorry,thisMacplatform[arm64]isnotyetsupported!Pleasetrystartingusing'DataIntegration32-bit'or'DataIntegration64-bit'asappropriate.关于这一点其实很多软件的解决方式都一样找到对应arm版本的软件基于Rosetta进行转译在此过渡期间,部分Apple的Mac继续使用基于Intel(x86-64)的架
最近要弄一个java调用kettle的代码,查找网上的例子有很多的jar包下不下来,弄下来了各种报错,花了一点时间趟平了坑。临近新年,最后祝各位新年快乐!成功示例确认版本依赖的jar包以pom的形式引入,有诸多版本,如果与kettle的版本不匹配则会调用失败。因为在java代码里会初始化插件来执行任务,查看插件版本9.0.0.0-423.引入依赖仓库镜像地址:pentaho-publicPentahoPublichttps://repo.orl.eng.hitachivantara.com/artifactory/pnt-mvn/truedailytrueinterval:15pentaho-
文章目录前言一、Kettle创建作业二、.bat文件参数配置三、创建Windows自带定时计划任务前言记录下用Windows计划任务调度Kettle作业,用简单的作业测试:一、KETTLE创建作业 用插入数据的转换并发送邮件的方式测试 二、.bat文件参数配置E:cdE:\Kettle\data-integrationkitchen/fileE:\Kettle\data-integration\test_email.kjb/LevelBasic/logfileE:\kettle_task_timing_logs\joblog.logpan.bat-- 此命令调用调试成功的转换(transfor
数据仓库传统数据库数据仓库特征用于操作处理,面向OLTP用于信息处理,面向OLAP用户DBA、开发经理、主管、数据分析人员功能日常操作长期信息需求、决策支持DB设计基于ER模型,面向应用星形、雪花模型,面向主题ETLETL,是Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取、转换、加载至目的端的过程。负责将不同物理机、异构的数据,如文本文件、数据库文件等,经过ETL的抽取、转换、加载到数据仓库中。数仓架构概念名词解释个人理解ODS操作性数据仓库,应用场景:1、在业务系统和数据仓库之间形成一个隔离,ODS直接存放从业务系统抽取过来的数据,这些数据从结构和数据上与