목차

Search

  1. 서문
  2. Informatica Developer
  3. 모델 리포지토리
  4. Informatica Developer에서 검색
  5. 연결
  6. 실제 데이터 개체
  7. 플랫 파일 데이터 개체
  8. 데이터의 논리적 보기
  9. 데이터 보기
  10. 응용 프로그램 배포
  11. 응용 프로그램 패치 배포
  12. 응용 프로그램 패치 배포 예
  13. CI/CD(지속적인 통합 및 지속적인 전달)
  14. 개체 가져오기 및 내보내기
  15. 부록 A: 데이터 유형 참조
  16. 부록 B: 키보드 바로 가기
  17. 부록 C: 연결 속성

Developer tool 가이드

Developer tool 가이드

공통 속성

공통 속성

다음 테이블에는 Hadoop 연결에 대해 구성하는 공통 연결 속성이 설명되어 있습니다.
속성
설명
가장 사용자 이름
Hadoop 클러스터가 Kerberos 인증을 사용하는 경우에 필요합니다. Hadoop 가장 사용자. 데이터 통합 서비스가 Hadoop 환경에서 매핑을 실행하기 위해 가장하는 사용자 이름입니다.
Data Engineering Integration은 모든 Hadoop 배포에서 운영 체제 프로필을 지원합니다. Hadoop 런타임 환경에서 데이터 통합 서비스는 처리를 Hadoop 클러스터로 푸시하고 런타임 엔진은 운영 체제 프로필에서 지정한 Hadoop 가장 속성을 사용하여 매핑을 실행합니다.
임시 테이블 압축 코덱
압축 코덱 클래스 이름을 위한 Hadoop 압축 라이브러리입니다.
Spark 엔진은 임시 테이블에 대한 압축 설정을 지원하지 않습니다. Spark 엔진에서 매핑을 실행하면 Spark 엔진이 임시 테이블을 압축되지 않은 파일 형식으로 저장합니다.
코덱 클래스 이름
데이터 압축을 할 수 있게 하고 임시 준비 테이블의 성능을 향상시키는 코덱 클래스 이름입니다.
Hive 준비 데이터베이스 이름
Hive 준비 테이블의 네임스페이스입니다. 지정된 데이터베이스 이름이 없는 테이블에는
default
라는 이름을 사용합니다.
네임스페이스를 구성하지 않으면 데이터 통합 서비스에서 Hive 대상 연결의 Hive 데이터베이스 이름을 사용하여 준비 테이블을 생성합니다.
원시 환경에서 Hive에 데이터를 쓰는 매핑을 실행하는 경우 Hive 연결에 Hive 준비 데이터베이스 이름을 구성해야 합니다. 데이터 통합 서비스는 Hadoop 연결에 구성된 값을 무시합니다.
환경 SQL
Hadoop 환경을 설정하는 SQL 명령입니다. 데이터 통합 서비스는 HiveServer2 작업에서 생성된 각 Hive 스크립트를 시작할 때 환경 SQL을 실행합니다.
환경 SQL을 사용할 때는 다음과 같은 규칙 및 지침이 적용됩니다.
  • 또한 환경 SQL을 사용하여 PreSQL 명령 또는 사용자 지정 쿼리에서 사용하려는 Hadoop 또는 Hive 매개 변수를 정의할 수도 있습니다.
  • 환경 SQL 속성에 여러 값을 사용할 경우 값 사이에 공백이 없어야 합니다.
엔진 유형
데이터 통합 서비스는 Spark 엔진에서 HiveServer2 태스크를 실행하여 HiveServer2를 사용하여 일부 작업의 부분을 처리합니다. Administrator 도구를 통해 클러스터 구성을 가져오는 경우 연결을 생성하도록 선택할 수 있습니다. 엔진 유형 속성은 기본적으로 배포를 기반으로 채워집니다.
수동으로 연결을 생성하는 경우 엔진 유형을 구성해야 합니다.
다음 Hadoop 배포를 기반으로 엔진 유형을 지정할 수 있습니다.
  • Amazon EMR. Tez
  • Azure HDI. Tez
  • Cloudera CDH. MRv2
  • Cloudera CDP. Tez
  • Dataproc. MRv2
  • Hortonworks HDP. Tez
  • MapR. MRv2
고급 속성
Hadoop 환경에 고유한 고급 속성 목록입니다. 속성은 Blaze 및 Spark 엔진에 공통됩니다. 고급 속성에는 기본 속성 목록이 포함됩니다.
데이터 통합 서비스, Hadoop 연결 및 매핑에서 Hadoop 환경에 대한 런타임 속성을 구성할 수 있습니다. 상위 수준에서 구성된 속성을 하위 수준에서 값을 설정하여 재정의할 수 있습니다. 예를 들어 데이터 통합 서비스 사용자 지정 속성에서 속성을 구성하는 경우 Hadoop 연결 또는 매핑에서 속성을 재정의할 수 있습니다. 데이터 통합 서비스는 다음 우선 순위에 따라 속성 재정의를 처리합니다.
  1. infacmd ms runMapping
    -cp
    옵션을 사용하여 설정된 매핑 사용자 지정 속성
  2. Hadoop 환경에 대한 매핑 런타임 속성
  3. 런타임 엔진에 대한 Hadoop 연결 고급 속성
  4. Hadoop 연결 고급 일반 속성, 환경 변수 및 클래스 경로
  5. 데이터 통합 서비스 사용자 지정 속성
매핑에서 Hive Server 2를 사용하여 작업 또는 작업 일부를 실행하는 경우, preSQL 또는 post-SQL 쿼리나 SQL 재정의 문에 클러스터 수준에서 구성된 속성을 재정의할 수 없습니다.
해결 방법: 도메인의 클러스터 구성을 사용하여 클러스터 속성을 재정의하는 대신 재정의 설정을 JDBC URL로 전달합니다. 예:
beeline -u "jdbc:hive2://<도메인 호스트>:<port_number>/tpch_text_100" --hiveconf hive.execution.engine=tez
타사 설명서, Informatica 설명서 또는 Informatica 글로벌 고객 지원 센터에 문의하기 전에 이러한 속성 값을 변경하지 않는 것이 좋습니다. 속성에 대한 지식 없이 값을 변경하면 성능 저하 또는 기타 예상치 못한 결과가 발생할 수 있습니다.