Sumário

Search

  1. Versão 10.4.0
  2. Versão 10.2.2
  3. Versão 10.2.1
  4. Versão 10.2
  5. Versão 10.1.1
  6. Versão 10.1

Opções de descoberta e amostragem de dados no mecanismo Spark

Opções de descoberta e amostragem de dados no mecanismo Spark

Em vigor na versão 10.4.0, você pode executar perfis para descobrir domínios de dados e escolher opções de amostragem no Mecanismo Spark.
Descoberta de domínio de dados no mecanismo Spark
Você pode executar a descoberta de domínio de dados no mecanismo Spark.
Opções de amostragem no mecanismo Spark
Você pode escolher as seguintes opções de amostragem para descobrir domínios de dados no mecanismo Spark:
  • A opção de amostragem
    Limitar n
    executa um perfil com base no número de linhas no objeto de dados. Quando você opta por descobrir domínios de dados no ambiente Hadoop, o mecanismo Spark coleta amostras de várias partições do objeto de dados e envia as amostras para um único nó para calcular o tamanho da amostra.
  • A opção de amostragem
    Porcentagem aleatória
    executa um perfil com base na porcentagem de linhas no objeto de dados.
Para obter mais informações, consulte o capítulo
Conceitos do Enterprise Data Catalog
no
Guia do Administrador do Informatica 10.4.0 Enterprise Catalog.