目次

Search

  1. はじめに
  2. コンポーネント
  3. APIコレクション
  4. ビジネスサービス
  5. ファイルリスナ
  6. 固定長ファイル形式
  7. 階層マッパー
  8. 階層スキーマ
  9. 業種別データサービスカスタマイザ
  10. インテリジェント構造モデル
  11. インテリジェント構造モデルの改良
  12. マップレット
  13. 保存済みクエリ
  14. 共有シーケンス
  15. ユーザー定義関数

コンポーネント

コンポーネント

インテリジェント構造検出のプロセス

インテリジェント構造検出
のプロセス

インテリジェント構造
モデルは、
インテリジェント構造検出
を使用して作成できます。
入力ファイルの指定後
インテリジェント構造検出
は、繰り返し発生するデータパターンの基礎的な部分を判別し、データフィールドとその関係を表す構造を作成します。ログファイル、クリックストリーム、顧客のWebアクセス、エラーテキストファイル、その他業界標準に準拠しないインターネットデータ、センターデータ、デバイスデータなど、ファイルの構造がきわめて複雑で、検出に時間とコストがかかる場合でも、データをすばやくモデル化できます。
次の図は、
インテリジェント構造検出
が、根底にあるデータパターンを解読し、そのデータパターンのモデルを作成するプロセスを示しています。
この図は、非構造化データまたは構造化データがIntelligent Structure Discoveryによって解読され、データのモデルが作成される様子を示しています。
モデルがHadoopファイルソースからの入力に基づいている場合、
インテリジェント構造検出
は、Hadoopスキーマのタイプと構造に基づいてモデルで使用するデータ型を決定します。
インテリジェント構造検出
は、モデル内にマップ型のデータのキーと値のペアの構造の配列を作成します。Enum型のノードは文字列として表されます。