Guia de Versão (10.4.1.2)

Anterior Avançar

Opções de descoberta e amostragem de dados no mecanismo Spark

Em vigor na versão 10.4.0, você pode executar perfis para descobrir domínios de dados e escolher opções de amostragem no Mecanismo Spark.

Descoberta de domínio de dados no mecanismo Spark: Você pode executar a descoberta de domínio de dados no mecanismo Spark.

Opções de amostragem no mecanismo Spark: Você pode escolher as seguintes opções de amostragem para descobrir domínios de dados no mecanismo Spark:
A opção de amostragem
Limitar n
executa um perfil com base no número de linhas no objeto de dados. Quando você opta por descobrir domínios de dados no ambiente Hadoop, o mecanismo Spark coleta amostras de várias partições do objeto de dados e envia as amostras para um único nó para calcular o tamanho da amostra.
A opção de amostragem
Porcentagem aleatória
executa um perfil com base na porcentagem de linhas no objeto de dados.

Para obter mais informações, consulte o capítulo

Conceitos do Enterprise Data Catalog

Guia do Administrador do Informatica 10.4.0 Enterprise Catalog.

Enviar comentários