Data Discovery 가이드

이전 다음

Spark 엔진에 대한 데이터 도메인 검색

Spark 엔진에서 데이터 검색을 수행할 프로필을 실행하는 경우 참조 테이블이 Hadoop 클러스터에서 준비됩니다. 모든 데이터 도메인에 대한 참조 테이블이 클러스터에서 준비되도록 하려는 경우 다음 단계를 수행할 수 있습니다.

데이터 도메인 검색을 수행할 때 HDFS 사용자를 가장할 수 있는 사용 권한이 있어야 합니다.

사용하는 참조 데이터베이스의 JDBC .jar 파일을 얻습니다. 데이터베이스 공급업체 웹 사이트에서 파일을 다운로드할 수 있습니다.

다운로드하는 파일을 다음 위치에 복사합니다.

<INFA_HOME>/externaljdbcjars

Informatica Administrator를 실행한 다음

도메인 탐색기

에서

데이터 통합 서비스

를 선택합니다.

속성 탭

에서

사용자 지정 속성

옵션을 클릭합니다.

데이터 도메인에 대한 참조 테이블을 준비하도록 다음 사용자 지정 속성을 설정합니다.

속성 이름	속성 값
AdvancedProfilingServiceOptions.ProfilingSparkReferenceDataHDFSDir	hdfs://<이름 노드>:<포트>/tmp/cms
ExecutionContextOptions.SparkRefTableHadoopConnectorArgs	--connect <JDBC 씬 드라이버 연결 URL>

hdfs://<이름 노드>:<포트>/tmp/cms

디렉터리가 클러스터에 있는지 확인하십시오. 디렉터리가 없는 경우 데이터를 준비할 사용자 지정 디렉터리 또는

hdfs://<이름 노드>:<포트>/tmp/cms

디렉터리를 생성합니다. 참조 데이터는 기본적으로

hdfs://<이름 노드>:<포트>/tmp/cms

디렉터리에서 준비됩니다.

데이터 통합 서비스를 재사용합니다.

Analyst 도구 또는 Developer tool을 열고 참조 데이터를 준비할 모든 데이터 도메인이 포함된 첫 번째 프로필을 실행해야 합니다.

첫 번째 프로필 실행에서 모든 데이터 도메인을 선택하지 않은 후 다음 프로필 실행에서 추가 데이터 도메인을 선택하는 경우 프로필 실행이 실패할 수 있습니다.

피드백 보내기