Índice

Search

  1. Prólogo
  2. Introducción a Test Data Management
  3. Test Data Manager
  4. Proyectos
  5. Políticas
  6. Obtención de datos
  7. Crear de un subconjunto de datos
  8. Realizar una operación de enmascaramiento de datos
  9. Parámetros y técnicas de enmascaramiento de datos
  10. Generación de datos
  11. Parámetros y técnicas de generación de datos
  12. Trabajo con Test Data Warehouse
  13. Análisis de datos de prueba con cobertura de datos
  14. Planes y flujos de trabajo
  15. Supervisor
  16. Informes
  17. ilmcmd
  18. tdwcmd
  19. tdwquery
  20. Apéndice A: Referencia de tipos de datos
  21. Apéndice B: Referencia de tipos de datos para Test Data Warehouse
  22. Apéndice C: Referencia de tipos de datos para Hadoop
  23. Apéndice D: Glosario

Guía del usuario

Guía del usuario

Configuración de orígenes de datos de Hadoop

Configuración de orígenes de datos de Hadoop

Introduzca las conexiones de origen y destino del plan de Hadoop.
La tabla siguiente describe las opciones de conexión:
Opciones de conexión
Descripción
Conexión de origen
Obligatorio. Una conexión a la base de datos de origen. Seleccione una conexión de origen de la lista. Cuando se crea un plan de Hadoop, se pueden seleccionar conexiones Oracle, DB2, Sybase, Microsoft SQL Server, Hive, archivo sin formato o HDFS.
Conexión de destino
Obligatorio. Cuando se crea un plan de Hadoop, se puede seleccionar una conexión de destino relacional o HDFS de la lista. Al seleccionar un tipo de conexión de destino relacional, puede seleccionar la conexión Hive.
Nombre de archivo de salida
El nombre del archivo de destino. Obligatorio si el destino es HDFS. La extensión predeterminada es .csv.
Delimitador de columna
Un carácter que separa unas columnas de otras en el archivo .csv. Obligatorio si el origen es un archivo sin formato. El valor predeterminado es una coma (,).
Separador de fila
Un carácter que separa unas columnas de otras en el archivo .csv. Obligatorio si el origen es un archivo sin formato. El valor predeterminado es una nueva línea.
Truncar tablas
Trunca la tabla antes de cargarla. Esta opción está seleccionada de forma predeterminada. Puede truncar las tablas para conexiones Hive. No se pueden truncar tablas para conexiones HDFS.
Cadena de formato de fecha y hora
Formato de fecha y hora definido en las propiedades de la sesión. Puede especificar segundos, milisegundos, microsegundos o nanosegundos.
  • Segundos. MM/DD/YYYY HH24:MI:SS
  • Milisegundos. MM/DD/YYYY HH24:MI:SS.MS
  • Microsegundos. MM/DD/YYYY HH24:MI:SS.US
  • Nanosegundos. MM/DD/YYYY HH24:MI:SS.NS
El valor predeterminado es microsegundos.
Número máximo de sesiones paralelas
El número máximo de asignaciones que se pueden ejecutar al mismo tiempo. El número predeterminado de asignaciones es 5.
Configuración regional
Establece la configuración regional para las operaciones de movimiento y enmascaramiento de datos.