목차

Search

  1. 서문
  2. 파트 1: 데이터 검색 소개
  3. 파트 2: Informatica Analyst를 사용한 데이터 검색
  4. 파트 3: Informatica Developer를 사용한 데이터 검색
  5. 부록 A: 프로파일링 웨어하우스 연결에 기반한 기능 지원

데이터 검색 가이드

데이터 검색 가이드

Avro 또는 Parquet 데이터 소스로부터 복잡한 파일 데이터 개체 생성

Avro 또는 Parquet 데이터 소스로부터 복잡한 파일 데이터 개체 생성

액세스 유형을
파일
또는
연결
로 지정하여 Avro 또는 Parquet 데이터 소스로부터 복잡한 파일 데이터 개체를 생성할 수 있습니다. 데이터 개체에 대해 열 프로필을 생성할 수 있습니다.
  1. Object Explorer
    보기에서 프로젝트를 선택합니다.
  2. 파일
    새로 만들기
    데이터 개체
    를 클릭합니다.
    새로 만들기
    대화 상자가 나타납니다.
  3. 실제 데이터 개체
    복잡한 파일 데이터 개체
    를 선택하고
    다음
    을 클릭합니다.
    새 복잡한 파일 데이터 개체
    대화 상자가 나타납니다.
  4. 데이터 개체의 이름을 입력합니다.
  5. 액세스 유형으로
    연결
    또는
    파일
    을 선택할 수 있습니다.
    • 액세스 유형으로
      연결
      을 선택한 경우, 다음 단계를 수행합니다.
      1. 찾아보기
        를 클릭하고 HDFS 연결을 선택합니다.
      2. 연결 선택
        대화 상자에서 데이터 소스를 선택하고
        확인
        을 클릭합니다.
      3. 새 복잡한 파일 데이터 개체
        대화 상자에서
        마침
        을 클릭합니다.
        데이터 개체가 프로젝트 폴더에 나타납니다.
    • 액세스 유형으로
      파일
      을 선택하고 리소스 형식으로
      이진
      을 선택한 경우, 다음 단계를 수행합니다.
      1. 찾아보기
        를 클릭하고 로컬 시스템에서 Avro 또는 Parquet 파일을 선택합니다.
      2. 새 복잡한 파일 데이터 개체
        대화 상자에서
        마침
        을 클릭합니다.
        데이터 개체가 프로젝트 폴더에 나타납니다.
      3. 프로젝트 폴더에서 데이터 개체를 선택하고
        데이터 개체 작업
        보기를 클릭합니다.
      4. 데이터 개체 작업
        보기에서
        읽기
        고급
        탭을 클릭합니다.
      5. 고급
        탭의
        파일 경로
        필드에 Linux 또는 Windows 시스템에 있는 데이터 소스의 파일 경로를 입력합니다.
      6. 파일 형식으로
        사용자 지정 입력
        을 입력합니다.
      7. Avro 데이터 소스의 경우
        입력 형식
        필드에
        com.informatica.avro.AvroToXML
        을 입력하고, Parquet 데이터 소스의 경우
        입력 형식
        필드에
        com.informatica.parquet.ParquetToXML
        을 입력합니다. 입력 형식을 추가하면 데이터 프로세서 변환이 런타임 시 Avro 또는 Parquet 형식의 데이터 소스를 XML 형식의 데이터 소스로 변환합니다.
    • 액세스 유형으로
      파일
      을 선택하고 리소스 형식으로
      Avro
      또는
      Parquet
      을 선택한 경우, 다음 단계를 수행합니다.
      1. 찾아보기
        를 클릭하고 로컬 시스템에서 Avro 또는 Parquet 파일을 선택합니다.
      2. 새 복잡한 파일 데이터 개체
        대화 상자에서
        마침
        을 클릭합니다.
        데이터 개체가 프로젝트 폴더에 나타납니다.
      3. 데이터 개체를 생성한 후에는
        데이터 개체 작업
        읽기
        고급
        탭으로 이동한 후
        파일 경로
        필드의 파일 경로가 Linux 또는 Windows 시스템에 있는 데이터 소스의 경로인지 확인합니다.
      Avro 및 Parquet 데이터 소스가 플랫 형식으로 구조화된 경우에만 리소스 형식으로
      Avro
      또는
      Parquet
      을 선택할 수 있습니다.
      데이터 개체를 생성하기 위해 여러 개의 Avro 파일 또는 여러 개의 Parquet 파일이 있는 폴더를 선택할 수 있습니다. 데이터 개체를 생성한 후에는
      데이터 개체 작업
      읽기
      고급
      탭으로 이동한 후
      파일 경로
      필드의 파일 경로가 Linux 또는 Windows 시스템에 있는 데이터 소스 폴더의 경로를 가리키는지 확인합니다.