Talend 配置连接


1 配置Join模型

1)双击tMap_1组件,在jointMapJob中打开tMap组件向导。

注意:单击tMap设置按钮将显示用于配置输入或输出流参数列表。输入流允许您将连接模式从默认的左外连接更改为内连接

2)更改连接属性:单击默认设置LeftOuterJoin,然后单击出现在LeftOuterJoin旁边的[…]。在选项窗口中,单击内部连接,然后单击确定

注意:当您更改默认设置时,tMap设置图标上会出现一个带有数字1的红点。这表明您更改了默认tMap设置的一个参数。

3)关闭tMap向导并运行作业

JobDesigner中,观察到来自左侧输入的总共1682行数据被tMap组件处理。但是,输出文件中仅出现142行。这是因为内连接只产生了142行的匹配,导致其他行被拒绝。

您可以通过查看moviesComplete输出文件来查看被拒绝的数据。在内连接输出文件中,您可以观察到所有的电影都会有导演的名字。

2 输出被内连接拒绝的数据行

1)打开tMap_1组件向导,新建第二个输出流组件并重命名为joinRejects

2)把movieID、title、releaseYear、urldirectorID字段添加到输出组件:请从movies组件中选择对应的五个字段并将它们放置在输出组件中。

3)找到joinRejects输出文件,单击tMapsettings

4)更改Catch内连接拒绝属性:单击默认的false设置,然后单击false旁边的[…]。在选项窗口中,单击true,然后单击确定。

注意:将Catch查找内连接拒绝属性更改为true之后,即可在新的输出数据流中看到被内连接拒绝的所有数据行。

5)将tFileOutputDelimited组件添加到作业设计器,并将tMap_1组件的joinRejects输出链接到tFileOutputDelimited_2

6)配置输出组件:在组件的视图中指定输出文件的路径和名称。此外,在输出文件中选择包含标题行并运行作业。

在运行之后的作业设计器中,您可以看到142行出现在joinOutput输出中,1540行被拒绝的行收集在joinRejects输出中。

您还可以查看joinRejects输出文件中被连接拒绝的所有电影。这些是电影文件中没有导演ID的电影,以及导演文件中没有导演ID的电影。


评论区(0)

评论