Esta seção descreve novos recursos da Developer tool para perfis e scorecards.
Perfis de colunas com fontes de dados Avro e Parquet
Em vigor na versão 10.1, é possível criar um perfil de coluna em uma fonte de dados Avro ou Parquet no HDFS.
Para obter mais informações sobre perfis de coluna em fontes de dados Avro e Parquet, consulte o capítulo "Perfis de coluna em fonte de dados semiestruturadas" do
Guia de Descoberta de Dados do Informatica 10.1
.
Critérios de conformidade
Em vigor na versão 10.1, é possível selecionar um número mínimo de linhas em conformidade como critérios de conformidade para a descoberta do domínio de dados.
Para obter mais informações sobre critérios de conformidade, consulte o capítulo "Descoberta do domínio de dados no Informatica Developer" do
Guia de Descoberta de Dados do Informatica 10.1
.
Excluir valores nulos para descoberta do domínio de dados
Em vigor na versão 10.1, você pode excluir valores nulos do conjunto de dados ao executar uma descoberta do domínio de dados em uma fonte de dados. Quando você seleciona a porcentagem mínima de linhas com a opção de exclusão de valores nulos, a porcentagem de conformidade é a proporção do número de linhas correspondentes dividido pelo número total de linhas, excluindo os valores nulos na coluna.
Para obter mais informações sobre a opção de exclusão de valores nulos da descoberta do domínio de dados, consulte o capítulo "Descoberta do domínio de dados no Informatica Developer" do
Guia de Descoberta de Dados do Informatica 10.1
.
Ambiente de tempo de execução
Em vigor na versão 10.1, você pode escolher a opção Hadoop como o ambiente de tempo de execução ao criar ou editar um perfil de coluna, um perfil de descoberta do domínio de dados, um perfil de descoberta empresarial ou um scorecard. Quando você escolhe a opção Hadoop, o Serviço de Integração de Dados envia a lógica de perfil por push para o mecanismo Blaze no cluster Hadoop para executar perfis.
Para obter mais informações sobre o ambiente de tempo de execução, consulte o capítulo "Perfis de objetos de dados" no