Opções de descoberta e amostragem de dados no mecanismo Spark
Opções de descoberta e amostragem de dados no mecanismo Spark
Em vigor na versão 10.4.0, você pode executar perfis para descobrir domínios de dados e escolher opções de amostragem no Mecanismo Spark.
Descoberta de domínio de dados no mecanismo Spark
Você pode executar a descoberta de domínio de dados no mecanismo Spark.
Opções de amostragem no mecanismo Spark
Você pode escolher as seguintes opções de amostragem para descobrir domínios de dados no mecanismo Spark:
A opção de amostragem
Limitar n
executa um perfil com base no número de linhas no objeto de dados. Quando você opta por descobrir domínios de dados no ambiente Hadoop, o mecanismo Spark coleta amostras de várias partições do objeto de dados e envia as amostras para um único nó para calcular o tamanho da amostra.
A opção de amostragem
Porcentagem aleatória
executa um perfil com base na porcentagem de linhas no objeto de dados.
Para obter mais informações, consulte o capítulo
Conceitos do Enterprise Data Catalog
no
Guia do Administrador do Informatica 10.4.0 Enterprise Catalog.