目次

Search

  1. はじめに
  2. トランスフォーメーション
  3. ソーストランスフォーメーション
  4. ターゲットトランスフォーメーション
  5. アクセスポリシートランスフォーメーション
  6. アグリゲータトランスフォーメーション
  7. B2B Data Transformation
  8. クレンジングトランスフォーメーション
  9. データマスキングトランスフォーメーション
  10. データサービストランスフォーメーション
  11. 重複排除トランスフォーメーション
  12. 式トランスフォーメーション
  13. フィルタトランスフォーメーション
  14. 階層ビルダートランスフォーメーション
  15. 階層パーサートランスフォーメーション
  16. 階層プロセッサトランスフォーメーション
  17. 入力トランスフォーメーション
  18. Javaトランスフォーメーション
  19. JavaトランスフォーメーションAPIリファレンス
  20. ジョイナトランスフォーメーション
  21. ラベラトランスフォーメーション
  22. ルックアップトランスフォーメーション
  23. 機械学習トランスフォーメーション
  24. マップレットトランスフォーメーション
  25. ノーマライザトランスフォーメーション
  26. 出力トランスフォーメーション
  27. 解析トランスフォーメーション
  28. Pythonトランスフォーメーション
  29. ランクトランスフォーメーション
  30. ルータトランスフォーメーション
  31. ルール仕様トランスフォーメーション
  32. シーケンストランスフォーメーション
  33. ソータートランスフォーメーション
  34. SQLトランスフォーメーション
  35. 構造パーサートランスフォーメーション
  36. トランザクション制御トランスフォーメーション
  37. 共有体トランスフォーメーション
  38. Velocityトランスフォーメーション
  39. ベリファイヤトランスフォーメーション
  40. Webサービストランスフォーメーション

トランスフォーメーション

トランスフォーメーション

ジョイナトランスフォーメーションの例

ジョイナトランスフォーメーションの例

あなたはオンライン小売業者のマーケティングマネージャであり、注文データをさまざまなAmazon S3ソースからの製品データおよび顧客データとマージして、顧客が何を購入しているかを理解したいと考えています。ジョイナトランスフォーメーションを使用して、ソースからのデータを結合します。
Amazon S3バケットには、
orders
order_items
customer_data
という3つのソースデータテーブルがあります。次の図に、これらのソースからのデータを結合するマッピングを示します。
Mapping Designerは、3つのソーストランスフォーメーション、2つのジョイナートランスフォーメーション、および1つのターゲットトランスフォーメーションを含むマッピングを示しています。
マッピングには次の要素が含まれます。
orders
のソーストランスフォーメーション
orders
データテーブルには、各オンライン注文の注文番号、日付、価格、顧客IDのフィールドが含まれています。
次の表に
orders
の一部を示します。
Order_id
order_date
customer_id
order_price
1005
2023-01-20
789
78.25
1006
2023-01-24
268
150.09
1007
2023-02-07
268
30.20
order_items
のソーストランスフォーメーション
order_items
データテーブルには、数量や価格など、各注文の商品に関する詳細が含まれます。
次の表に
order_items
の一部を示します。
Order_id
item_id
qty
price
1005
5063
2
34.99
1006
2389
3
19.99
1006
5063
1
34.99
1007
9871
2
10.99
ソーストランスフォーメーションでは、
order_items
orders
と結合するときにフィールド名の競合を避けるために、フィールド
order_id
の名前を
items_order_id
に変更します。
customer_data
のソーストランスフォーメーション
customer_data
テーブルには、名前、生年月日、電話番号など、顧客が提供する情報のフィールドが含まれています。
次の表に
customer_data
の一部を示します。
c_id
c_name
c_dob
789
Kelcy Almeida
1969-07-20
268
Chidi Donalds
1972-12-07
orders
order_items
のジョイナトランスフォーメーション
最初のジョイナトランスフォーメーションは、
orders
order_items
の間の通常の結合を実行します。
orders
ソーストランスフォーメーションはマスターグループであり、
order_items
ソーストランスフォーメーションは詳細グループであるため、注文された各品目に注文情報が追加されます。
ジョイナトランスフォーメーションは、次の結合条件を使用して、注文IDでデータを照合します:
order_id = items_order_id
customer_data
のジョイナトランスフォーメーション
2番目のジョイナトランスフォーメーションは、
customer_data
と最初のジョイナトランスフォーメーションからの出力の間の詳細な外部結合を実行します。このトランスフォーメーションでは、
customer_data
ソーストランスフォーメーションがより小さなデータセットであるため、マスターグループとして使用されます。
2番目のジョイナトランスフォーメーションは、次の結合条件を使用して、顧客IDでデータを照合します:
customer_id = c_id
ターゲットトランスフォーメーション
ターゲットトランスフォーメーションは、データをAmazon S3の新しいファイルに書き込みます。受信フィールドを設定して、結合の結果として生じる重複フィールドを除外できます。
次の表に、出力データの一部を示します。
Order_id
order_date
order_price
item_id
qty
price
c_id
c_name
c_dob
1005
2023-01-20
78.25
5063
2
34.99
789
Kelcy Almeida
1969-07-20
1006
2023-01-24
150.09
2389
3
19.99
268
Chidi Donalds
1972-12-07
1006
2023-01-24
150.09
5063
1
34.99
268
Chidi Donalds
1972-12-07
1007
2023-02-07
30.20
9871
2
10.99
268
Chidi Donalds
1972-12-07