Utilisez un moteur Blaze ou Spark pour exécuter les mappages Hadoop dans un flux de travail.
Le service d'intégration de données génère le script du moteur Blaze ou Spark selon la logique de mappage, un identificateur unique pour le script et les tâches dont dépend ce script.
Vous pouvez sélectionner le moteur d'exécution au niveau du plan. Si vous sélectionnez le moteur d'exécution Blaze, le traitement est plus rapide, car Blaze utilise un compilateur de flux de travail interne pour exécuter le mappage. Utilisez un moteur Blaze pour améliorer la vitesse et les performances de la tâche.
Si vous n'utilisez pas l'authentification Kerberos, vous pouvez utiliser un moteur Blaze pour les cibles de fichiers complexes. Dans un masquage en place Hive, vous pouvez utiliser le moteur d'exécution Spark.
Si vous utilisez un moteur Blaze, vous pouvez utiliser les transformations suivantes dans une règle de mapplet :
Expression
Masquage des données
Convertisseur de cas
Comparaison
Décision
Libellé
Fusion
Analyseur
Moyenne pondérée
Normalisation
Java passive
Si vous utilisez un moteur Spark, vous pouvez utiliser les transformations suivantes dans une règle de mapplet :
Expression
Masquage des données
Java passive
Vous ne pouvez pas utiliser le moteur Blaze dans les cas suivants :
Sources et dictionnaires ODBC
Cible de fichier complexe si vous utilisez l'authentification Kerberos
Tronquer la table cible
La source est Hive et la cible HDFS
Masquage en place Hive
Le moteur Spark a les limitations suivantes :
Pour utiliser un moteur Spark lorsque les sources sont des bases de données relationnelles, telles qu'Oracle, Sybase, Microsoft SQL Server et DB2 for Linux, UNIX et Windows, vous devez utiliser le type de connexion JDBC pour créer la connexion. Vous ne pouvez pas utiliser les autres types de connexion.
Vous ne pouvez pas effectuer un masquage aléatoire et de substitution avec un moteur Spark.
Avec le moteur Spark, vous ne pouvez pas effectuer d'opérations de masquage de données sur le type de données binaire dans Hive.