目次

Search

  1. はじめに
  2. トランスフォーメーションについて
  3. トランスフォーメーションポート
  4. トランスフォーメーションキャッシュ
  5. アドレスバリデータトランスフォーメーション
  6. アグリゲータトランスフォーメーション
  7. 関連付けトランスフォーメーション
  8. 不良レコードの例外トランスフォーメーション
  9. 大文字小文字変換プログラムトランスフォーメーション
  10. 分類子トランスフォーメーション
  11. 比較トランスフォーメーション
  12. 統合トランスフォーメーション
  13. 1028データマスキングトランスフォーメーション
  14. データプロセッサトランスフォーメーション
  15. ディシジョントランスフォーメーション
  16. 重複レコードの例外トランスフォーメーション
  17. 式トランスフォーメーション
  18. フィルタトランスフォーメーション
  19. 階層型からリレーショナルへのトランスフォーメーション
  20. Javaトランスフォーメーション
  21. JavaトランスフォーメーションAPIのリファレンス
  22. Java式
  23. ジョイナトランスフォーメーション
  24. キージェネレータトランスフォーメーション
  25. ラベラトランスフォーメーション
  26. ルックアップトランスフォーメーション
  27. ルックアップキャッシュ
  28. 動的ルックアップキャッシュ
  29. 一致トランスフォーメーション
  30. フィールド分析での一致トランスフォーメーション
  31. ID分析での一致トランスフォーメーション
  32. ノーマライザトランスフォーメーション
  33. マージトランスフォーメーション
  34. パーサートランスフォーメーション
  35. Pythonトランスフォーメーション
  36. ランクトランスフォーメーション
  37. 読み取りトランスフォーメーション
  38. リレーショナルから階層型へのトランスフォーメーション
  39. REST Webサービスコンシューマトランスフォーメーション
  40. ルータトランスフォーメーション
  41. シーケンスジェネレータトランスフォーメーション
  42. ソータートランスフォーメーション
  43. SQLトランスフォーメーション
  44. 標準化トランスフォーメーション
  45. 共有体トランスフォーメーション
  46. アップデートストラテジトランスフォーメーション
  47. Webサービスコンシューマトランスフォーメーション
  48. WebサービスSOAPメッセージの解析
  49. WebサービスSOAPメッセージの生成
  50. 加重平均トランスフォーメーション
  51. ウィンドウトランスフォーメーション
  52. 書き込みトランスフォーメーション
  53. トランスフォーメーションの区切り文字

Developerトランスフォーメーションガイド

Developerトランスフォーメーションガイド

パーサートランスフォーメーションを使用するとき

パーサートランスフォーメーションを使用するとき

パーサートランスフォーメーションは、カラム内のデータフィールドに複数のタイプの情報が含まれ、フィールド値を新しいカラムに移動するときに使用します。 パーサートランスフォーメーションを使用すると、データセット内の情報のタイプごとに新しいカラムを作成できます。
以下の例に、パーサートランスフォーメーションで実行できるいくつかのタイプの構造変更を示します。
連絡先データの新しいカラムの作成
名前データを単一のカラムから複数のカラムに解析するデータ構造を作成することができます。 例えば、敬称、名前、ミドルネーム、姓などのカラムを作成できます。
入力ポートで人名の構造を表す確率モデルのあるパーサートランスフォーメーションを設定します。 モデルを定義するには、入力ポートデータのサンプルを使用します。
確率モデルを入力ポートに適用し、名前の値を新しいカラムに書き込む、トークン解析ストラテジを作成します。 パーサートランスフォーメーションは、入力文字列の各値の位置と値が表す名前のタイプに基づいて、名前の値を新しいカラムに書き込みます。
パターンベースの解析ストラテジを使用して連絡先データを解析することもできます。 パターンベースの解析ストラテジを設定するときは、入力ポートで名前の構造を表すパターンを定義します。
住所カラムの作成
住所データの単一のカラムを配達可能な住所を示す複数のカラムに解析するデータ構造を作成することができます。
郵便番号、州名、市区町村名などの認識可能な住所要素が含まれる参照テーブルのあるパーサートランスフォーメーションを設定します。 各住所要素を新しいポートに書き込むトークン解析ストラテジを作成します。
町名と番地のデータは参照テーブルでキャプチャするには一般的すぎるため、参照テーブルを使用して入力文字列から所在地住所データを解析することはできません。 ただし、オーバーフローポートを使用してこのデータをキャプチャすることは可能です。 すべての市区町村、州、および郵便番号データを住所から解析すると、残りのデータに町名と番地の情報が含まれます。
例えば、トークン解析ストラテジを使用して次の住所を住所要素に分割します。
123 MAIN ST NW STE 12 ANYTOWN NY 12345
解析ストラテジは、住所要素を次のカラムに書き込むことができます。
カラム名
データ
オーバーフロー
123 MAIN ST NW STE 12
City
ANYTOWN
State
NY
ZIP
12345
製品データカラムの作成
製品データの単一のカラムを製品在庫の詳細を示す複数のカラムに解析するデータ構造を作成することができます。
寸法、色、重量などの在庫要素が含まれるトークンセットのあるトランスフォーメーションを設定します。 各在庫要素を新しいポートに書き込むトークン解析ストラテジを作成します。
例えば、トークン解析ストラテジを使用して次の塗料の説明を別個の在庫要素に分割します。
500ML Red Matt Exterior
解析ストラテジは、住所要素を次のカラムに書き込むことができます。
カラム名
データ
サイズ
500ML
Red
スタイル
Matt
外装
Y