A partir de la versión 10.2.1, puede utilizar las siguientes nuevas características de Sqoop:
Compatibilidad del conector MapR de Teradata
Puede utilizar el conector MapR de Teradata para leer o escribir datos en Teradata en el motor Spark. El conector MapR de Teradata es un conector especializado Teradata Connector for Hadoop (TDCH) para Sqoop. Cuando se ejecutan asignaciones de Sqoop en el motor Spark, el servicio de integración de datos invoca al conector de forma predeterminada.
Para obtener más información, consulte la
Guía del usuario de Informatica Big Data Management 10.2.1
.
Optimización del motor Spark para asignaciones de transferencia de Sqoop
Cuando se ejecuta una asignación de transferencia de Sqoop en el motor Spark, el servicio de integración de datos optimiza el rendimiento de la asignación en los siguientes escenarios:
Se leen datos de un origen de Sqoop y se escriben datos en un destino de Hive que utiliza el formato de texto.
Se leen datos de un origen de Sqoop y se escriben datos en un destino de HDFS que utiliza el formato Flat, Avro o Parquet.
Para obtener más información, consulte la
Guía del usuario de Informatica Big Data Management 10.2.1
.
Compatibilidad del motor Spark con las características de alta disponibilidad y seguridad
Sqoop incluye las mismas características de alta disponibilidad y seguridad que el inicio de sesión de Kerberos y el cifrado KMS compatibles con el motor Spark.
Para obtener más información, consulte el capítulo "Servicio de integración de datos" de la
Guía del servicio de aplicación de Informatica 10.2.1
y el capítulo "Referencia del comando infacmd dis" de la
Referencia de comandos de Informatica 10.2.1
.
Compatibilidad del motor Spark con objetos de datos de Teradata
Si utiliza un objeto de datos de Teradata y ejecuta una asignación en el motor Spark y en un clúster de Hortonworks o Cloudera, el servicio de integración de datos ejecutará la asignación a través de Sqoop.
Si utiliza un clúster de Hortonworks, el servicio de integración de datos invocará al conector de Hortonworks para Teradata en tiempo de ejecución. Si utiliza un clúster de Cloudera, el servicio de integración de datos invocará al conector de Cloudera para Teradata en tiempo de ejecución.
Para obtener más información, consulte la
Guía del usuario de Informatica PowerExchange for Teradata Parallel Transporter API 10.2.1