Kettle本手册主要针对入门教程(详细介绍控件使用方法)Kettle详细说明了工具的功能以及如何操作该系统,适合所有使用该系统的人员。
服务查询
数据库查询
数据库连接
流查询
调用存储过程
转换
增加
增加检查和
分析查询
冻结步骤
闭包生成器
数据检测
延迟行
标记流中最后一行
流中元数据结构
设置为空值
行止规化
分离行
值映射
分组
删除重复记录
增加常量
增加序列
字段选择
拆分字段
排序记录
空操作
行扁平化
行转列
计算器
过滤记录
5.7连接
合并记录
记录关联(笛卡尔输出)
脚木
执行却本
数据仓库
维度更新查询
联合更新查询
块射
映射(子转换)
映射输入规范
输出规范
作业
获得变量
设置变量
从结果中获取记录
复制并记录结果
内联
实验
不推荐的
聚合记录
核心任务对象
通用
中断任务
显示新闻对话框
任务
文本输出
邮件
文件管理
将文件名添加到结果中
比较文件夹
拷贝文件
复制或移动结果文件名称
新建文什夹
新建文件
删除文件
文件名从结果中删除
删除文件
删除文什夹
文件比较
文件鲜压缩
等待文件
文件打包
条件
检查文件火是否为空
检查文件是否存在
检查数据库表中的列是否存在
存在检查文件
检查表是否存在
等待
脚木
批量加载
批量从
将数据加载到文件中
从文件中向
数据库中批量加载
从文件中向
批量加载数据库
文件传输
资源库
实验
概述
Kettle中文名称叫水壶,项目主程序员MATT希望把各种数据放进锅里,然后
指定格式流出。 Kettle主要包括四个部分,分别是Cef, Spoon, Kitchen,Pan。 Kettle
提供·图形用户界面Spon,用来设计数据转换过程。在Spon在中间,用户可以使用左侧
组件树,在右血面板上设计转换过程,并在 Log View检查面板中的操作结果。本文介绍
图形用户界面Spon使用中各组件
资源库管理
o pentaho
apen source business intellgence"
Pentaho Data Integration
欢迎使用Kete
资源厍Ket1a2y1x
登录: admin
启动时显示这个对语框
u)取逍也没有资海。
登录时可选择无资源库进入,此时定义的转换和工作只能存储在本地
磁盘上,以文件和文件的形式。如果使用资源库登录,所有定义的转换和工作都将进行
存储在资源库中。事实上,资源库是一个数据库,例如
存储在数据库中
简单来说,定义元素的相关元数据就是元数据库。如果创建了资源库,资源
文件中存储的相关信息 repositories.xml它位于你的缺失中home目录的隐藏目
录“. kettle如果是的话 windows这条路径是系统
c:\ Documents andSettings\username>\ kettle
新建资源库
)新建到资源库的数据库连接[编辑][除外
点击新按钮弹出以下对话框
资源库信息
白回区
选择数据库连接
新建[编辑删除
名称
描述
确定⑩)创建或更新[删除[取消[取消〔)
数据库连接意味着我们可以在木地数据库中建立一个或多个数据库连接
数据库比如
数据库模仿资源库,然后连接到表示资源库名称的资源库
如果我们一开始没有资源库,点击
选择数据社连接
回编辑
新按钮,新数据库连接资源库,前提是(
例)数据库已存在
如何在数据库中建立连接:
()我们先以在
下创建的
以数据库为例,我们选择
方式连接到
。首先配置
数据库的
源
用户Dsx系统S文件Dx|亚动程序|跟连招
系统数据源〕
名称
厄动程序
ttesT
()点击新按钮进行以下设置。点击编辑按钮编辑此连接。删除此连接
Connection tame
cor政 et tlelyl
Crne□tior
S
ettins
ODBC IS Source tame
KettleZyk
nter systems Cach
KingbaseES
ser ame
Luci dDB
ns A
Password
Max DB (SAP DB
MonetDB
MS叽
Oracle RDB
latabaseMeta. report. ConnectionDk
Pao OlaF Server
Iatabaselet
t.Pat!1521
Remedy Action Request System
Databaseleta. rep ort. Iatab aseNamelkettlelyk
Native〔mE
L确定一
)创建资源库
选择新创建的数据库连接,填写资源库名称,点击创建更新按钮创建新资本表演库
弹出
ODiC RHIEG
Please ae care, using ODBC is not officially supported for
Lect
lease CUlsider using a N live (DIC] cullet Lill
Do you still want to continue
匚是本
意思是资源库利用
连接支持不是很好,最好用本地连接”,因为资派库对
方式支持不是很好,最好用木地连接。继续弹出:
确定
您确定要在此指定数据库中创建该资源库
匚是匚否凹
这意味着在这个数据库连接下创建资源库
在数据库中创建资源库
选择是,弹出:
Dry run?
Do you want to do a dry
to eval
a的d三LbeE0 re execut1or
是①[否的)
你想在执行前做一次演练来评估产生的句子吗?。意思是创建资源库的过程执行
你想看看这个创建过程的具体句子吗(因为创建资源是在社会
数据
库中创建表,它问我们要不要看这些句子)
选择否,直接创建资源库,完成后弹出:
确定
Kett1e创建dthe在制定的数据库中连接资源库
匚确定
当我们选择是时,我们弹出句子对话框,显示创建所有表并插入相关数据
语句
d Sinple SQL editor
QL statements separated br semi color
Reposi tory creation/upgrade DDL
thing was c工 ated nor od工f立ed1 n the ta卫9et卫e口口st〔
Hit the ok button to execute the generated SQl or Cl
P1 ease note that1t1spss工上1et口 change/ edit the cen
CREATE TABLE F REPOSITORY LOG
工 D REPOSITORY工0GB工G工 I PRII五RYE置
REP TERSIO矗RCH矗R(255
L0 G DATE D盈 TETIIE
LOG USER W矗RCHR(255
OPERATION DESC TERT
CREATE T矗B工E卫 WERSLON
工DERs工0下B工G工T卫R工 HART KET
过 AJOR VERSIO工rT
M工 R TERO工o工T
UPGRADE DATE DATETIEE
IS UPGRADE C丑AR(1
L
EXecute[ lear cache关闭〔
点击关闭则退出创建资源厍的过程,点击
则清空数据厍缓存,点击
执行这些语句创建资源库
Results of the SQL statements
回区
The SQl statements had the following results
SQl executed: INSERT INTO R PROFILE PERMISSION(ID PROFILE A
SQL executed:工sET工 TO R PROF工工 E PERMISSIO( ID PROF工
SQL executed: INSERT INTO R PROFILE PERMISSION(ID PROFILE
173 SQL statements executed
我们回过头来看这些语句,我们发现它不仅创建了表,还向表中插入了相关的数据,我
们看到有几行语句是,
CREATE TABLE R PROF工LE
工 D PROFLLE BIG工 NT PRIMARY KEY
NAME VARCHAR(255)
DESCRIPTION VARCHAR (255)
INSERT INTO R PROFILE (ID PROFILE, NAME DESCRIPTION) VALUES
(I,'Administrator ,'Administrator profile, manage users
INSERT INTO R PROFILE (ID PROFTLE, NAME DESCRIPTION) VALUES (2 'User''Normal
user all tools)i