Índice

Search

  1. Prólogo
  2. Parte 1: Version10.5.3
  3. Parte 2: Version10.5.2 - 10.5.2.1.x
  4. Parte 3: Versión 10.5.1-10.5.1.1
  5. Parte 4: Versiones 10.5-10.5.0.1
  6. Parte 5: Versiones 10.4.1-10.4.1.3
  7. Parte 6: Versiones 10.4-10.4.0.2
  8. Parte 7: Versión 10.2.2 a 10.2.2 HotFix 1
  9. Parte 8: Versión 10.2.1
  10. Parte 9: Versión 10.2 a 10.2 HotFix 2

Novedades y cambios(10.5.3)

Novedades y cambios(10.5.3)

Integración de Azure Databricks

Integración de Azure Databricks

A partir de la versión 10.2.2, puede integrar el dominio de Informatica con el entorno de Azure Databricks.
Azure Databricks es una plataforma de nube de análisis que está optimizada para los servicios de nube de Microsoft Azure. Incorpora las funciones y tecnologías de clúster de Apache Spark de código abierto.
El dominio de Informatica puede instalarse en una máquina virtual de Azure o en las instalaciones. El proceso de integración es similar a la integración con el entorno de Hadoop. Se pueden realizar tareas de integración, incluso la importación de la configuración del clúster desde el entorno de Databricks. El dominio de Informatica usa autenticación de token para acceder al entorno de Databricks. El ID del token de Databricks se almacena en la conexión de Databricks.

Orígenes y destinos

Puede ejecutar asignaciones contra los siguientes orígenes y destinos dentro del entorno de Databricks:

    Microsoft Azure Data Lake Store

    Microsoft Azure Blob Storage

    Almacén de datos de Microsoft Azure SQL

    Microsoft Azure Cosmos DB

Transformaciones

Puede agregar las siguientes transformaciones a una asignación de Databricks:

    Agregación

    Expresión

    Filtro

    Unión

    Búsqueda

    Normalizador

    Rango

    Enrutador

    Ordenación

    Unión

El motor de Databricks Spark procesa la transformación de una manera muy similar a como lo hace el motor de Spark en el entorno de Hadoop.

Tipos de datos

Se admiten los siguientes tipos de datos:

    Array

    Bigint

    Date/time

    Decimal

    Doble

    Entero

    Map

    Struct

    Text

    String

Asignaciones

Cuando se configura una asignación, puede elegir validar y ejecutar la asignación en el entorno de Databricks. Cuando ejecuta la asignación, el servicio de integración de datos genera un código de Scala y lo pasa al motor de Databricks Spark.

Flujos de trabajo

Puede desarrollar flujos de trabajo de clúster para crear clústeres efímeros en el entorno de Databricks.
Para obtener más información, consulte las siguientes guías:

    Guía de integración de Big Data Management 10.2.2

    Guía del administrador de Informatica Big Data Management 10.2.2

    Guía del usuario de Big Data Management 10.2.2