Sumário

Search

  1. Prefácio
  2. Parte   1: Versão 10.4.1
  3. Parte   2: Versão 10.4.0
  4. Parte   3: Versão 10.2.2
  5. Parte   4: Versão 10.2.1
  6. Parte   5: Versão 10.2
  7. Parte   6: Versão 10.1.1
  8. Parte   7: Versão 10.1

Guia de Versão (10.4.1.2)

Guia de Versão (10.4.1.2)

Opções de descoberta e amostragem de dados no mecanismo Spark

Opções de descoberta e amostragem de dados no mecanismo Spark

Em vigor na versão 10.4.0, você pode executar perfis para descobrir domínios de dados e escolher opções de amostragem no Mecanismo Spark.
Descoberta de domínio de dados no mecanismo Spark
Você pode executar a descoberta de domínio de dados no mecanismo Spark.
Opções de amostragem no mecanismo Spark
Você pode escolher as seguintes opções de amostragem para descobrir domínios de dados no mecanismo Spark:
  • A opção de amostragem
    Limitar n
    executa um perfil com base no número de linhas no objeto de dados. Quando você opta por descobrir domínios de dados no ambiente Hadoop, o mecanismo Spark coleta amostras de várias partições do objeto de dados e envia as amostras para um único nó para calcular o tamanho da amostra.
  • A opção de amostragem
    Porcentagem aleatória
    executa um perfil com base na porcentagem de linhas no objeto de dados.
Para obter mais informações, consulte o capítulo
Conceitos do Enterprise Data Catalog
no
Guia do Administrador do Informatica 10.4.0 Enterprise Catalog.