Em vigor na versão 10.4.0, você pode executar perfis e escolher opções de amostragem no Spark.
Criação de perfil no mecanismo Spark
Você pode criar e executar perfis no mecanismo Spark nas ferramentas Informatica Developer e Informatica Analyst. Você pode executar a descoberta de domínio de dados e criar scorecards no mecanismo Spark.
Opções de amostragem no mecanismo Spark
Você pode escolher as seguintes opções de amostragem para executar perfis no mecanismo Spark:
A opção de amostragem
Limitar n
executa um perfil com base no número de linhas no objeto de dados. Quando você opta por executar um perfil no ambiente Hadoop, o mecanismo Spark coleta amostras de várias partições do objeto de dados e envia as amostras para um único nó para calcular o tamanho da amostra. Você não pode aplicar as opções de amostragem limitar n nos perfis com filtro avançado.
Compatível com os bancos de dados Oracle, SQL Server e DB2.
A opção de amostragem
Porcentagem aleatória
executa um perfil com base na porcentagem de linhas no objeto de dados.
Para obter informações sobre os perfis e as opções de amostragem no mecanismo Spark, consulte o