目次

Search

  1. はじめに
  2. トランスフォーメーション
  3. ソーストランスフォーメーション
  4. ターゲットトランスフォーメーション
  5. アクセスポリシートランスフォーメーション
  6. アグリゲータトランスフォーメーション
  7. B2B Data Transformation
  8. クレンジングトランスフォーメーション
  9. データマスキングトランスフォーメーション
  10. データサービストランスフォーメーション
  11. 重複排除トランスフォーメーション
  12. 式トランスフォーメーション
  13. フィルタトランスフォーメーション
  14. 階層ビルダートランスフォーメーション
  15. 階層パーサートランスフォーメーション
  16. 階層プロセッサトランスフォーメーション
  17. 入力トランスフォーメーション
  18. Javaトランスフォーメーション
  19. JavaトランスフォーメーションAPIリファレンス
  20. ジョイナトランスフォーメーション
  21. ラベラトランスフォーメーション
  22. ルックアップトランスフォーメーション
  23. 機械学習トランスフォーメーション
  24. マップレットトランスフォーメーション
  25. ノーマライザトランスフォーメーション
  26. 出力トランスフォーメーション
  27. 解析トランスフォーメーション
  28. Pythonトランスフォーメーション
  29. ランクトランスフォーメーション
  30. ルータトランスフォーメーション
  31. ルール仕様トランスフォーメーション
  32. シーケンストランスフォーメーション
  33. ソータートランスフォーメーション
  34. SQLトランスフォーメーション
  35. 構造パーサートランスフォーメーション
  36. トランザクション制御トランスフォーメーション
  37. 共有体トランスフォーメーション
  38. Velocityトランスフォーメーション
  39. ベリファイヤトランスフォーメーション
  40. Webサービストランスフォーメーション

トランスフォーメーション

トランスフォーメーション

構造パーサートランスフォーメーション

構造パーサートランスフォーメーション

構造パーサートランスフォーメーションは、
インテリジェント構造モデル
に基づいて、入力データをユーザー定義の構造化形式に変換します。構造パーサートランスフォーメーションを使用して、ログファイル、クリックストリーム、XMLファイルまたはJSONファイル、Wordテーブル、およびその他の非構造化形式または半構造化形式などのデータを分析できます。
構造パーサートランスフォーメーションは次のタイプのソースに接続できます。
  • ローカル入力ファイルを処理するためのフラットファイルに基づくソーストランスフォーメーション
  • HDFSでの入力ファイルのストリーミングやローカル入力ファイルの処理を行うための、Hadoop Files V2接続に基づくソーストランスフォーメーション
構造パーサートランスフォーメーションの設定時に、このトランスフォーメーションを
インテリジェント構造モデル
に関連付けます。
インテリジェント構造モデル
とは、実行時にモデルが解析することが想定されるデータを表すために
インテリジェント構造検出
によって生成されるアセットです。モデルは、構造パーサートランスフォーメーションを設定する前、または構造パーサートランスフォーメーションの設定時に作成できます。
インテリジェント構造検出
は、入力データのサンプルまたは提供されたスキーマに基づいて
インテリジェント構造モデル
を生成します。モデルは次のような入力タイプから作成することができます。
  • テキストファイル(CSVファイルなどの区切りファイルやテキスト階層を含む複雑なファイルを含む)
  • 機械生成されたファイル(Webログやクリックストリームなど)
  • JSONファイル
  • XMLファイル
  • ORCファイル
  • Avroファイル
  • Parquetファイル
  • Microsoft Excelファイル
  • PDFフォームフィールド内のデータ
  • Microsoft Wordテーブル内のデータ
  • XSDファイル
  • COBOLコピーブック
  • PDFファイル
インテリジェント構造検出
によって
インテリジェント構造モデル
が生成された後に、そのモデルを調整して出力データの構造をカスタマイズできます。モデルのノードを編集し、ノードの結合、除外、フラット化、または縮小を行うことができます。