linux环境下kettle部署(JDK安装配置,kettle安装配置,资源库配置,定时执行job)
一.部署准备
1.1 java安装(略)
1.2 JDK配置
1. 命令行键入“cd /etc”进入etc目录
2. 命令行键入“vi profile”打开profile文件
3. 敲击键盘ctrl+F到文件末尾
4. 在末尾处,即第一个~的地方,敲击键盘将以下内容输入到文件
export JAVA_HOME=/usr/java/jre1.6.0_45
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
5. 键盘敲击exc,命令行键入“:wq”,保存文件;
JDK配置成功:
1. 命令:java -version.出现版本信息
2. 命令:echo ${JAVA_HOME}出现配置路径
二.kettle部署
1.在linux下某个目录下创建一个文件夹,将你从官网上下载的kettle(我的是pdi-ce-5.0.1.A-stable.zip)解压后放在该文件夹
下。
2.在解压的路径下找到kitchen.sh所在的路径,进入该目录,通过chmod +x *.sh赋予.sh文件执行权限。
下面是详细说明:
键入./kitchen.sh,看输入信息
BASH:/ kitchen.sh的:权限被拒绝
从上面可以看出kitchen.sh缺少执行权限,我们再次进入看看文件盒文件夹的权限
从上面可以看出,此目录下面的.sh文件都没有执行权限(X),接下来我们给这个文件夹下面的所有.sh文件赋执行的权限
由上面的我们可以看出,赋权成功!
再次./kitchen.sh,回车 看输出信息--
可以看到上面出现 -rep,-user,-pass 这些kettle中的帮助信息,说明kettle部署成功!
3.输入命令./kitchen.sh。如果出现帮助信息说明部署成功。
4.配置资源库
用数据库作用kettle资源库会在数据库中建立很多表,所以就选择用文件资源库的方式。如果单纯的使用文件方式而非文件资源库的方式,在job引用转换的时候要选择文件本地路径,从windows移植到linux中路径就出现问题,虽然可以手动修改一下,但是每次都修改就烦人了。
使用文件资源库就简单多了。
当然,使用资源库就需要上传.kettle文件夹到linux,Windows中的.kettle文件夹在Administrator中。如果在linux中使用过kettle的话,在用户目录下会自动建好.kettle文件夹,如果没有使用过,可能还没有这个文件夹,那就手动创建。不过创建了也并不可见。位置在/home/user/.kettle。我的是在kettle用户根目录下。.kettle文件夹是隐藏的通过“ls -a”命令查看隐藏文件夹。
我的资源库内容:repositories.xml
- <?xml version="1.0" encoding="UTF-8"?>
- <repositories>
- <repository> <id>KettleFileRepository</id>
- <name>fileRepository</name>
- <description>filereposity</description>
- <base_directory>C:\Data\kettleRepository</base_directory>
- <read_only>N</read_only>
- <hides_hidden_files>N</hides_hidden_files>
- </repository> </repositories>
<base_directory>部分是在windows下的资源库路径,上传到linux中需要改为linux下的资源库路径。然后可以将windows下设计好的转换和job都放到这个文件夹下。
最后是调用job脚本:/opt/kettle/data-integration/kitchen.sh -rep=fileRepository -job=testjob
指定资源库ID和job名称。
我的是获取svn上的路径。所以需要在linux下安装svn。待续。。。
郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。