목차

Search

  1. 서문
  2. Informatica Developer
  3. 모델 리포지토리
  4. Informatica Developer에서 검색
  5. 연결
  6. 실제 데이터 개체
  7. 플랫 파일 데이터 개체
  8. 데이터의 논리적 보기
  9. 데이터 보기
  10. 응용 프로그램 배포
  11. 응용 프로그램 패치 배포
  12. 응용 프로그램 패치 배포 예
  13. CI/CD(지속적인 통합 및 지속적인 전달)
  14. 개체 가져오기 및 내보내기
  15. 부록 A: 데이터 유형 참조
  16. 부록 B: 키보드 바로 가기
  17. 부록 C: 연결 속성

Developer tool 가이드

Developer tool 가이드

Hadoop 클러스터 속성

Hadoop 클러스터 속성

데이터 통합 서비스와 Hadoop 클러스터 간의 통신이 가능하도록 Hadoop 연결에서 속성을 구성합니다.
다음 테이블에는 Hadoop 연결 관련 일반 연결 속성이 설명되어 있습니다.
속성
설명
이름
연결 이름입니다. 이름은 대/소문자를 구분하지 않으며 도메인 내에서 고유해야 합니다. 연결을 생성한 후 이 속성을 변경할 수 있습니다. 이름은 128자를 초과할 수 없고, 공백이나 다음 특수 문자를 포함할 수 없습니다.
~ ` ! $ % ^ & * ( ) - + = { [ } ] | \ : ; " ' < , > . ? /
ID
데이터 통합 서비스에서 연결을 식별하기 위해 사용하는 문자열입니다. ID는 대/소문자를 구분하지 않습니다. ID는 255자 이하여야 하고 도메인 내에서 고유해야 합니다. 연결을 생성한 후 이 속성을 변경할 수 없습니다. 기본값은 연결 이름입니다.
설명
연결의 설명입니다. 연결을 식별하는 데 사용할 수 있는 문자열을 입력합니다. 설명은 4,000자를 초과할 수 없습니다.
클러스터 구성
Hadoop 환경에 연결된 클러스터 구성의 이름입니다.
클라우드 프로비저닝 구성을 구성하지 않은 경우 필요합니다.
클라우드 프로비저닝 구성
Amazon AWS 또는 Microsoft Azure와 같은 클라우드 플랫폼과 연결된 클라우드 프로비저닝 구성의 이름입니다.
클러스터 구성을 구성하지 않은 경우 필요합니다.
클러스터 환경 변수*
Hadoop 클러스터가 사용하는 환경 변수입니다.
Cloudera CDH 6.x 클러스터 또는 Cloudera CDP 클러스터를 사용하는 경우 로캘 설정을 클러스터 환경 변수로 구성합니다. Cloudera Manager에서, 환경 변수를 다음 YARN 속성에도 추가해야 합니다.
yarn.nodemanager.env-whitelist
예를 들어, ORACLE_HOME 변수는 Oracle 데이터베이스 클라이언트 소프트웨어가 설치된 디렉터리를 나타냅니다.
데이터 통합 서비스, Hadoop 연결 및 매핑에서 Hadoop 환경에 대한 런타임 속성을 구성할 수 있습니다. 상위 수준에서 구성된 속성을 하위 수준에서 값을 설정하여 재정의할 수 있습니다. 예를 들어 데이터 통합 서비스 사용자 지정 속성에서 속성을 구성하는 경우 Hadoop 연결 또는 매핑에서 속성을 재정의할 수 있습니다. 데이터 통합 서비스는 다음 우선 순위에 따라 속성 재정의를 처리합니다.
  1. infacmd ms runMapping
    -cp
    옵션을 사용하여 설정된 매핑 사용자 지정 속성
  2. Hadoop 환경에 대한 매핑 런타임 속성
  3. 런타임 엔진에 대한 Hadoop 연결 고급 속성
  4. Hadoop 연결 고급 일반 속성, 환경 변수 및 클래스 경로
  5. 데이터 통합 서비스 사용자 지정 속성
매핑에서 Hive Server 2를 사용하여 작업 또는 작업 일부를 실행하는 경우, preSQL 또는 post-SQL 쿼리나 SQL 재정의 문에 클러스터 수준에서 구성된 속성을 재정의할 수 없습니다.
해결 방법: 도메인의 클러스터 구성을 사용하여 클러스터 속성을 재정의하는 대신 재정의 설정을 JDBC URL로 전달합니다. 예:
beeline -u "jdbc:hive2://<도메인 호스트>:<port_number>/tpch_text_100" --hiveconf hive.execution.engine=tez
클러스터 라이브러리 경로*
클러스터의 공유 라이브러리에 대한 경로입니다.
$DEFAULT_CLUSTER_LIBRARY_PATH 변수에는 기본 디렉터리 목록이 포함됩니다.
클러스터 클래스 경로*
Hadoop jar 파일과 필요한 라이브러리에 액세스할 수 있는 클래스 경로입니다.
$DEFAULT_CLUSTER_CLASSPATH 변수에는 기본 jar 파일 및 라이브러리에 대한 경로 목록이 포함됩니다.
데이터 통합 서비스, Hadoop 연결 및 매핑에서 Hadoop 환경에 대한 런타임 속성을 구성할 수 있습니다. 상위 수준에서 구성된 속성을 하위 수준에서 값을 설정하여 재정의할 수 있습니다. 예를 들어 데이터 통합 서비스 사용자 지정 속성에서 속성을 구성하는 경우 Hadoop 연결 또는 매핑에서 속성을 재정의할 수 있습니다. 데이터 통합 서비스는 다음 우선 순위에 따라 속성 재정의를 처리합니다.
  1. infacmd ms runMapping
    -cp
    옵션을 사용하여 설정된 매핑 사용자 지정 속성
  2. Hadoop 환경에 대한 매핑 런타임 속성
  3. 런타임 엔진에 대한 Hadoop 연결 고급 속성
  4. Hadoop 연결 고급 일반 속성, 환경 변수 및 클래스 경로
  5. 데이터 통합 서비스 사용자 지정 속성
매핑에서 Hive Server 2를 사용하여 작업 또는 작업 일부를 실행하는 경우, preSQL 또는 post-SQL 쿼리나 SQL 재정의 문에 클러스터 수준에서 구성된 속성을 재정의할 수 없습니다.
해결 방법: 도메인의 클러스터 구성을 사용하여 클러스터 속성을 재정의하는 대신 재정의 설정을 JDBC URL로 전달합니다. 예:
beeline -u "jdbc:hive2://<도메인 호스트>:<port_number>/tpch_text_100" --hiveconf hive.execution.engine=tez
클러스터 실행 파일 경로*
클러스터의 실행 파일 경로입니다.
$DEFAULT_CLUSTER_EXEC_PATH 변수에는 기본 실행 파일에 대한 경로 목록이 포함됩니다.
* 타사 설명서, Informatica 설명서 또는 Informatica 글로벌 고객 지원 센터에 문의하기 전에 이러한 속성 값을 변경하지 않는 것이 좋습니다. 속성에 대한 지식 없이 값을 변경하면 성능 저하 또는 기타 예상치 못한 결과가 발생할 수 있습니다.