Índice

Search

  1. Prólogo
  2. Informatica Developer
  3. El repositorio de modelos
  4. Búsquedas en Informatica Developer
  5. Conexiones
  6. Objetos de datos físicos
  7. Objetos de datos de archivo sin formato
  8. Vista lógica de datos
  9. Cómo visualizar datos
  10. Implementación de aplicaciones
  11. Implementación de revisiones de la aplicación
  12. Implementación de revisiones de la aplicación Ejemplo
  13. Integración continua y entrega continua (CI/CD)
  14. Importación y exportación de objetos
  15. Apéndice A: Referencia de tipos de datos
  16. Apéndice B: Accesos directos del teclado
  17. Apéndice C: Propiedades de conexión

Guía de Developer Tool

Guía de Developer Tool

Propiedades de clúster de Hadoop

Propiedades de clúster de Hadoop

Configure las propiedades en la conexión de Hadoop para permitir la comunicación entre el servicio de integración de datos y el clúster Hadoop.
En la tabla siguiente se describen las propiedades de conexión generales de la conexión de Hadoop:
Propiedad
Descripción
Nombre
El nombre de la conexión. No se aplica la distinción entre mayúsculas y minúsculas al nombre, el cual debe ser único en el dominio. Puede cambiar esta propiedad después de crear la conexión. El nombre no puede superar los 128 caracteres, contener espacios ni contener los siguientes caracteres especiales:
~ ` ! $ % ^ & * ( ) - + = { [ } ] | \ : ; " ' < , > . ? /
ID
Cadena que utiliza el servicio de integración de datos para identificar la conexión. El ID no distingue entre mayúsculas y minúsculas. Debe tener 255 caracteres o menos y debe ser único en el dominio. No puede modificar esta propiedad después de crear la conexión. El valor predeterminado es el nombre de la conexión.
Descripción
La descripción de la conexión. Introduzca una cadena que pueda utilizar para identificar la conexión. La descripción no puede tener más de 4000 caracteres.
Configuración de clúster
Nombre de la configuración de clúster asociada al entorno de Hadoop.
Requerido si no configura la configuración de aprovisionamiento de nube.
Configuración de aprovisionamiento de nube
Nombre de la configuración de aprovisionamiento de nube asociada a una plataforma de nube como Amazon AWS o Microsoft Azure.
Requerido si no configura la configuración del clúster.
Variables de entorno de clúster*
Variables de entorno que utiliza el clúster Hadoop.
Si utiliza un clúster de Cloudera CDH 6.x o de Cloudera CDP, establezca la configuración regional como variables de entorno de clúster. En Cloudera Manager, deberá añadir también las variables de entorno a la siguiente propiedad de YARN:
yarn.nodemanager.env-whitelist
Por ejemplo, la variable ORACLE_HOME representa el directorio donde está instalado el software cliente de base de datos Oracle.
Las propiedades en tiempo de ejecución del entorno de Hadoop se pueden configurar en el servicio de integración de datos, en la conexión de Hadoop y en la asignación. Puede reemplazar una propiedad configurada a un alto nivel estableciendo el valor en un nivel inferior. Por ejemplo, si configura una propiedad personalizada del servicio de integración de datos, podrá reemplazarla en la conexión de Hadoop o en la asignación. El servicio de integración de datos procesa las sustituciones de propiedades en función de las siguientes prioridades:
  1. Asignación de propiedades personalizadas configurada mediante
    infacmd ms runMapping
    con la opción
    -cp
  2. Asignación de propiedades en tiempo de ejecución para el entorno de Hadoop
  3. Propiedades avanzadas de la conexión de Hadoop para motores en tiempo de ejecución
  4. Propiedades generales avanzadas, variables de entorno y classpaths de la conexión de Hadoop
  5. Propiedades personalizadas del servicio de integración de datos
Ruta de acceso a la biblioteca de clúster*
La ruta de acceso de las bibliotecas compartidas del clúster.
La variable $DEFAULT _CLUSTER_LIBRARY_PATH contiene una lista de directorios predeterminados.
Classpath de clúster*
La classpath para acceder a los archivos jar de Hadoop y a las bibliotecas necesarias.
La variable $DEFAULT _CLUSTER_CLASSPATH contiene una lista de rutas de acceso a las bibliotecas y archivos jar predeterminados.
Las propiedades en tiempo de ejecución del entorno de Hadoop se pueden configurar en el servicio de integración de datos, en la conexión de Hadoop y en la asignación. Puede reemplazar una propiedad configurada a un alto nivel estableciendo el valor en un nivel inferior. Por ejemplo, si configura una propiedad personalizada del servicio de integración de datos, podrá reemplazarla en la conexión de Hadoop o en la asignación. El servicio de integración de datos procesa las sustituciones de propiedades en función de las siguientes prioridades:
  1. Asignación de propiedades personalizadas configurada mediante
    infacmd ms runMapping
    con la opción
    -cp
  2. Asignación de propiedades en tiempo de ejecución para el entorno de Hadoop
  3. Propiedades avanzadas de la conexión de Hadoop para motores en tiempo de ejecución
  4. Propiedades generales avanzadas, variables de entorno y classpaths de la conexión de Hadoop
  5. Propiedades personalizadas del servicio de integración de datos
Ruta de ejecutables de clúster*
La ruta de acceso de los archivos ejecutables del clúster.
La variable $DEFAULT _CLUSTER_EXEC_PATH contiene una lista de rutas de acceso a los archivos ejecutables predeterminados.
* Informatica no recomienda cambiar estos valores de propiedad antes de consultar la documentación de terceros, la documentación de Informatica o con el servicio de atención al cliente global de informatica. Si cambia un valor sin conocimiento de la propiedad, es posible que experimente degradación del rendimiento u otros resultados inesperados.