0

0

kettle使用教程(超详细)

雪夜

雪夜

发布时间:2025-09-03 09:15:01

|

514人浏览过

|

来源于php中文网

原创

大家好,又见面了,我是你们的朋友全栈君。

今天详细详细说一下kettle 的安装,安装的版本:

一、环境部署

1、安装JDK,按默认值安装即可2、设置环境变量,如图下图代码语言:javascript代码运行次数:0运行复制

具体步骤: 1.右击我的电脑-属性-高级系统设置-环境变量-系统变量-新建 2.变量名:JAVA_HOME 3.变量值: JDK安装目录
kettle使用教程(超详细)

3、 Kettle程序打开(无需安装),如下图:

kettle使用教程(超详细)

二、资源库

1、连接开发方案,选择资源库方式,如图

kettle使用教程(超详细)
kettle使用教程(超详细)
2、录入资源库信息, 如下图:代码语言:javascript代码运行次数:0运行复制

数据库:主机名称:数据库名称: 端口号: 账号:密码:
kettle使用教程(超详细)

3、选择并登录资源库,如下图:

账号:

密码:

kettle使用教程(超详细)

三、资源管理

1、文件夹建立

kettle使用教程(超详细)
kettle使用教程(超详细)
2、配置数据库连接(数据源/数据仓库)
kettle使用教程(超详细)

四、方案开发

1、新建转换,更改转换名称,选择转换归属

kettle使用教程(超详细)
2、建立表输入代码语言:javascript代码运行次数:0运行复制

步骤:1在组件组-输入中找到组件-表输入2.选择数据库连接(数据源)3.填写SQL语句,可预览结果
kettle使用教程(超详细)

3、建立表输出代码语言:javascript代码运行次数:0运行复制

步骤:1、在组件组-输出中找到组件-表输出2.建立表输入和表输出的连接3.选择数据库连接(数据仓库)4.录入目标表名,指定数据库字段5.获取字段6.执行SQL(建表)
kettle使用教程(超详细)
kettle使用教程(超详细)

4、建立清理SQL代码语言:javascript代码运行次数:0运行复制

*步骤:1在组件组-脚本中找到组件-执行SQL脚本2.选择数据库连接(数据仓库)#此处选择必须谨慎,避免清理了数据源的数据3.填写SQL语句4.建立与表输入的关系
kettle使用教程(超详细)

5、测试转换是否能正常工作

kettle使用教程(超详细)
6、新建作业,更改作业名称,选择作业归属
kettle使用教程(超详细)
7、添加组件代码语言:javascript代码运行次数:0运行复制

*步骤:1在组件组-通用中找到组件-START(作业开始,用于作业调度设置)2.在组件组-通用中找到组件-转换(如有多个可以多次添加)3.通过引用指定转换文件4.在组件组-通用中找到组件-成功(作业结束)5.按执行顺序建立组件间的关系
kettle使用教程(超详细)

8、作业定时调度及测试,

kettle使用教程(超详细)

这样就算你可以入门了,我相信在不断的探索中你会有更多的心得的。在此也要提醒一点,KETTLE的性能可能会有不稳定的情况出现,所以注意保存你已经做过的东西。

更新:

很早之前写的文章,发现大家许多人想要下载安装包,我就给大家把链接顺便也找到了

Kettle下载地址:

Pentaho from Hitachi Vantara – Browse /Data Integration at SourceForge.net

以为这就完了,no,再附加个人网盘地址:

kettle使用教程(超详细)

kettle下载链接:

链接:https://pan.baidu.com/s/1tmFK1sdU7DDTT3YzoJVnwQ 提取码:76yw

DaGaoPeng(大高朋网团购程序)
DaGaoPeng(大高朋网团购程序)

大高朋团购系统是一套Groupon模式的开源团购程序,开发的一套网团购程序,系统采用ASP+ACCESS开发的团购程序,安装超简,功能超全面,在保留大高朋团购系统版权的前提下,允许所有用户免费使用。大高朋团购系统内置多种主流在线支付接口,所有网银用户均可无障碍支付;短信发送团购券和实物团购快递发货等。 二、为什么选择大高朋团购程序系统? 1.功能强大、细节完善 除了拥有主流团购网站功能,更特别支

下载

点击下方链接,输入上方提取码即可 链接:https://pan.baidu.com/s/1tmFK1sdU7DDTT3YzoJVnwQ

升级版本:

最近由于需要连接clickhouse数据库,kettle目前的版本没有clickhouse驱动,所以没法连接,需要自定义插件,又重新安装了kettle的9.2版本尝试一下,应该是比较新的了所以就把资源也更新一下,希望对你有帮助的小伙伴可以点赞支持。

由于kettle的连接中暂时没有clickhouse插件,需要自己搞定,先看下官网提示:

https://help.hitachivantara.com/Documentation/Pentaho/8.1/Developer_Center/PDI/Extend/020

查找相关资料在githubs上找到源码,连接如下:

https://github.com/aaa8210/kettle2clickhouse

上面是自己查找的一些资料,下面分享安装包及插件:

kettle的9.2版本:

kettle使用教程(超详细)

百度云链接如下(包含kettle安装包、连接mysql驱动和clickhouse插件):

https://pan.baidu.com/s/1CH5wYQjAxnuvOz-C0koO2w

提取码:4sy0

链接:https://pan.baidu.com/s/1CH5wYQjAxnuvOz-C0koO2w 提取码:4sy0 注:连接clickhouse版本kettle版本需要对应.

1、下载分享资源

2、解压 kettle 安装包后将驱动包里的 clickhouse-plugins文件夹复制到 kettle 的 data-integration\plugins文件夹里

kettle使用教程(超详细)

看一下clickhouse-plugins 里就是自定义的插件jar包

kettle使用教程(超详细)

3、复制驱动中的其余jar包

kettle使用教程(超详细)

粘贴到 kettle 的 data-integration\libswt\win64 目录下(根据自己的系统而定,我的是win64)

kettle使用教程(超详细)

4、启动kettle,选择新建连接就可以选择Clickhouse了

kettle使用教程(超详细)

目前感觉使用还不错,虽然kettle自带调度任务,但是前提是保持kettle打开,并且作业和转换在运行状态,这个不太适用与远程服务器安装windows客户端,或者一些学习的同学可以在本地windows设置调度任务也可以,在linux上安装部署kettle并调度是一个比较合适的方法。

参考如下步骤:

代码语言:javascript代码运行次数:0运行复制

运用crontab执行kettle程序1.建立目录存放kettle文件# mkdir /data/kettle/kettle_job // 存放作业文件# mkdir /data/kettle/kettle_transition // 存放转换# mkdir /data/kettle/kettle_sh // 存放执行脚本# mkdir /data/kettle/kettle_log // 存放执行kettle产生的日志文件将从windows上配置好的.ktr和.kjb程序分别放在transition目录和job目录下(或linux下编写后直接保存到该目录下),注意:job中的转换对应的目录需要做相应修改2:编写执行脚本# cd /data/kettle/kettle_sh# vi ceshi.sh文本内容如下:#!/bin/bash#执行job程序cd /data/kettle/data-integrationexport JAVA_HOME=/usr/local/jdk1.8.0_201/export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jarexport PATH=$PATH:$JAVA_HOME/bin./kitchen.sh -file=/data/kettle/kettle_job/testjob.kjb >>/data/kettle/kettle_log/ceshi_$(date +%Y%m%d).log注:(因为crond是个守护进程,它不归属于任何用户,虽然之前以root用户配置了java环境变量,但是crond一样找不到java命令,所以,当crond执行kettle任务时,需要动态设置java环境变量,否则会出现手动执行.sh没问题,放crontb里面执行后无效果)保存ceshi.sh,执行赋予执行权限的命令# chmod +x ceshi.sh测试ceshi.sh是否可以正常执行# sh -x ceshi.sh3:设定crontab 定时执行任务# crontab -e*/1 * * * * /data/kettle/kettle_sh/ceshi.sh //每分钟执行一次ceshi.sh# systemctl restart crond# systemctl enable crond注意:在linux中,如果是通过图形界面执行程序的话,点击那个绿色的三角即可。如果是命令行启动,后台执行进行进程不能中断。因此,在linux中不推荐使用kettle里面的自动执行,使用操作系统的定时执行要稳定的多。Windows下使用定时任务计划,linux下使用crontab。/usr/share/java /data/java/jdk1.8.0_141/bin/java

这个版本使用还不错,这样做完调度在之后就可以了。

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/142100.html原文链接:https://javaforall.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

1110

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

340

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

380

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

2069

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

379

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

1622

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

585

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

439

2024.04.29

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

23

2026.03.06

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
CSS3 教程
CSS3 教程

共18课时 | 6.8万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号