kettle的安装以及注意(迭代中....)
创始人
2024-05-06 06:03:34

1、下载

kettle的官网下载地址:Pentaho from Hitachi Vantara - Browse Files at SourceForge.net

如果需要下载其他版本:

直接点击对应的版本Name(8.0以下的实在Data Integration文件夹里面)进去,再选择client-tools点击进去,最后选择pdi-ce-xxx.zip进行下载。

​ 

按win和linux安装都是直接解压即可,再配置jdk环境,同步数据时,需要在lib加入对应的数据库驱动包。

2、注意点

${Internal.Entry.Current.Directory},该参数要求ktr文件和job文件必须放到同一目录下 

es可能是驼峰命名字段,数据库可能是下划线命名,可以在idea通过camelBar插件进行辅助转换(快捷键:Alt+Shift+U 或者通过Edit-->camelBar)

2)hive相关问题,如果是同步到hive,默认情况下表输出是很慢的,需要修改big-data-plugin插件源码。

如果使用kettle版本过高,hive版本过低,可能会导致连接不上hive,这里也可以通过修改源码来解决。第二种方法是可以直接下载个低版本的kettle,修改plugin.properties配置文件(active.hadoop.configuration=),指定对应的CDH的版本(假设使用使用cdh)

data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations可以看到对应的大数据一些组件版本。

3、脚本(后面整理再加上)

设计的Linux操作系统之批量杀死进程Linux操作系统之批量杀死进程_PrinciplesMan的博客-CSDN博客_linux kill多个进程

4、问题点

1)Caused by: com.mysql.jdbc.exceptions.jdbc4.MySQLIntegrityConstraintViolationException: Column 'id' cannot be null
如果目标表有主键,过来的数据为空,也会报主键不能为空的问题。如果是通过REST client就可能是查询

2)Caused by: java.sql.SQLException: Incorrect string value: '\xF0\x9F\x9A\x80WZ...' for column

通常情况,Mysql数据编码格式为“utf-8”,对于汉字来说足够;Mysql中utf8占3个字节,但是,3个字节对于表情符号是不够的,需4个字节;此时使用utf8,会出现‘\xF0\x9F\x8D\x83\xF0\x9F’的问题。

utf8mb4编码是utf8编码的超集,兼容utf8,并且能存储4字节的表情字符。

参考连接:Pentaho from Hitachi Vantara - Browse Files at SourceForge.net

 

相关内容

热门资讯

阿西吧是什么意思 阿西吧相当于... 即使你没有受到过任何外语培训,你也懂四国语言。汉语:你好英语:Shit韩语:阿西吧(아,씨발! )日...
脚上的穴位图 脚面经络图对应的... 人体穴位作用图解大全更清晰直观的标注了各个人体穴位的作用,包括头部穴位图、胸部穴位图、背部穴位图、胳...
demo什么意思 demo版本... 618快到了,各位的小金库大概也在准备开闸放水了吧。没有小金库的,也该向老婆撒娇卖萌服个软了,一切只...
北京的名胜古迹 北京最著名的景... 北京从元代开始,逐渐走上帝国首都的道路,先是成为大辽朝五大首都之一的南京城,随着金灭辽,金代从海陵王...
苗族的传统节日 贵州苗族节日有... 【岜沙苗族芦笙节】岜沙,苗语叫“分送”,距从江县城7.5公里,是世界上最崇拜树木并以树为神的枪手部落...