Índice

Search

  1. Prólogo
  2. Parte 1: Introducción a la obtención de datos
  3. Parte 2: Obtención de datos con Informatica Analyst
  4. Parte 3: Obtención de datos con Informatica Developer
  5. Apéndice A: Compatibilidad de función basada en la conexión del almacén de creación de perfiles

Guía de detección de datos

Guía de detección de datos

Detección del dominio de datos en el motor de Spark

Detección del dominio de datos en el motor de Spark

Cuando se ejecuta un perfil para llevar a cabo detecciones de datos en el motor de Spark, las tablas de referencia se transfieren provisionalmente al clúster de Hadoop. Para garantizar que las tablas de referencia de todos los dominios de datos se transfieren provisionalmente al clúster, puede realizar los siguientes pasos:

Requisito previo:

Debe tener un permiso para suplantar al usuario de HDFS cuando realice una detección de dominio de datos.

Descargar los archivos .jar de JDBC

  1. Obtenga los archivos .jar de JDBC de la base de datos de referencia que utilice. Puede descargarlos del sitio web de proveedores de bases de datos.
  2. Copie los archivos que descargue en la siguiente ubicación:
    <INFA_HOME>/externaljdbcjars
    .

Configurar las propiedades personalizadas en el servicio de integración de datos

  1. Inicie Informatica Administrator y, después, seleccione el
    servicio de integración de datos
    en el
    navegador del dominio
    .
  2. Haga clic en la opción
    Propiedades personalizadas
    de la ficha
    Propiedades
    .
  3. Establezca las siguientes propiedades personalizadas para transferir provisionalmente las tablas de referencia de los dominios de datos:
    Nombre de la propiedad
    Valor de propiedad
    AdvancedProfilingServiceOptions.ProfilingSparkReferenceDataHDFSDir
    /tmp/cms
    ExecutionContextOptions.SparkRefTableHadoopConnectorArgs
    --connect <URL de conexión de controlador fino de JDBC>
  4. Asegúrese de que el directorio
    /tmp/cms
    existe en el clúster. Si el directorio
    /tmp/cms
    no existe, créelo o cree un directorio personalizado donde quiera transferir los datos temporalmente. Los datos de referencia se transfieren temporalmente al directorio
    /tmp/cms
    de forma predeterminada.
  5. Recicle el servicio de integración de datos.
  6. Abra la Herramienta del analista o Developer tool y asegúrese de ejecutar primero un perfil con todos los dominios de datos para transferir temporalmente los datos de referencia.
Si no selecciona todos los dominios de datos en la primera ejecución del perfil y, luego, selecciona más dominios de datos en la siguiente ejecución del perfil, la ejecución del perfil podría generar errores.