목차

Search

  1. 데이터 검색 소개
  2. Informatica Analyst를 사용한 데이터 검색
  3. Informatica Developer를 사용한 데이터 검색
  4. 프로파일링 웨어하우스 연결에 기반한 기능 지원

Data Discovery 가이드

Data Discovery 가이드

Spark 엔진에 대한 데이터 도메인 검색

Spark 엔진에 대한 데이터 도메인 검색

Spark 엔진에서 데이터 검색을 수행할 프로필을 실행하는 경우 참조 테이블이 Hadoop 클러스터에서 준비됩니다. 모든 데이터 도메인에 대한 참조 테이블이 클러스터에서 준비되도록 하려는 경우 다음 단계를 수행할 수 있습니다.

선행 조건:

데이터 도메인 검색을 수행할 때 HDFS 사용자를 가장할 수 있는 사용 권한이 있어야 합니다.

JDBC .JAR 파일 다운로드

  1. 사용하는 참조 데이터베이스의 JDBC .jar 파일을 얻습니다. 데이터베이스 공급업체 웹 사이트에서 파일을 다운로드할 수 있습니다.
  2. 다운로드하는 파일을 다음 위치에 복사합니다.
    <INFA_HOME>/externaljdbcjars

데이터 통합 서비스에서 사용자 지정 속성 구성

  1. Informatica Administrator를 실행한 다음
    도메인 탐색기
    에서
    데이터 통합 서비스
    를 선택합니다.
  2. 속성 탭
    에서
    사용자 지정 속성
    옵션을 클릭합니다.
  3. 데이터 도메인에 대한 참조 테이블을 준비하도록 다음 사용자 지정 속성을 설정합니다.
    속성 이름
    속성 값
    AdvancedProfilingServiceOptions.ProfilingSparkReferenceDataHDFSDir
    hdfs://<이름 노드>:<포트>/tmp/cms
    ExecutionContextOptions.SparkRefTableHadoopConnectorArgs
    --connect <JDBC 씬 드라이버 연결 URL>
  4. hdfs://<이름 노드>:<포트>/tmp/cms
    디렉터리가 클러스터에 있는지 확인하십시오. 디렉터리가 없는 경우 데이터를 준비할 사용자 지정 디렉터리 또는
    hdfs://<이름 노드>:<포트>/tmp/cms
    디렉터리를 생성합니다. 참조 데이터는 기본적으로
    hdfs://<이름 노드>:<포트>/tmp/cms
    디렉터리에서 준비됩니다.
  5. 데이터 통합 서비스를 재사용합니다.
  6. Analyst 도구 또는 Developer tool을 열고 참조 데이터를 준비할 모든 데이터 도메인이 포함된 첫 번째 프로필을 실행해야 합니다.
첫 번째 프로필 실행에서 모든 데이터 도메인을 선택하지 않은 후 다음 프로필 실행에서 추가 데이터 도메인을 선택하는 경우 프로필 실행이 실패할 수 있습니다.