Table des matières

Search

  1. Préface
  2. Présentation du réglage des performances
  3. Optimisation de cible
  4. Optimisation de source
  5. Optimisation de transformation
  6. Optimisation du mappage
  7. Optimisation du mappage partitionné
  8. Optimisation du temps d'exécution
  9. Optimisation du service de données SQL
  10. Optimisation du service Web
  11. Optimisation des connexions

Guide du réglage de performance

Guide du réglage de performance

Optimisation de la transformation Jointure

Optimisation de la transformation Jointure

Les transformations Jointure peuvent ralentir les performances, car elles requièrent un espace supplémentaire lors de l'exécution pour contenir les résultats intermédiaires.
Envisagez les solutions suivantes pour les goulots d'étranglement de la transformation Jointure :
Indiquez la source principale comme source contenant le moins de valeurs de clés dupliquées.
Lorsque le service d'intégration de données traite une transformation Jointure triée, il met en cache les lignes de cent clés uniques à la fois. Si la source principale contient plusieurs lignes avec la même valeur de clé, le service d'intégration de données doit mettre en cache plusieurs lignes, ce qui peut diminuer les performances.
Indiquez la source principale comme source contenant le moins de lignes.
La transformation Jointure compare chaque ligne de la source secondaire avec la source principale. Moins la source principale contient de lignes, moins d'itérations de la comparaison de jointure devront avoir lieu, ce qui accélère la jointure.
Effectuez les jointures dans une base de données lorsque c'est possible.
L'exécution d'une jointure dans une base de données est plus rapide que l'exécution d'une jointure lors de l'exécution du mappage. Le type de jointure de base de données que vous utilisez peut affecter les performances. Les jointures normales sont plus rapides que les jointures extérieures et produisent moins de lignes. Parfois, vous ne pouvez pas effectuer la jointure dans la base de données, par exemple des jointures de tables à partir de deux bases de données ou systèmes de fichiers simples différents.
Joignez des données triées lorsque c'est possible.
Configurez la transformation Jointure pour utiliser l'entrée triée. Le service d'intégration de données améliore les performances en réduisant l'entrée et la sortie de disque. La plus forte augmentation des performances se produit lorsque vous travaillez avec des ensembles de données volumineux. Pour une transformation Jointure non triée, indiquez la source contenant le moins de lignes comme source principale.
Optimisez la condition de jointure.
Le Data Integration Service tente de réduire la taille de l'ensemble de données d'un opérande de jointure en lisant les lignes du plus petit groupe, en trouvant les lignes correspondantes dans le plus grand groupe, et en effectuant ensuite l'opération de jointure. Le fait de réduire la taille de l'ensemble de données améliore les performances du mappage car le Data Integration Service ne lit plus de lignes inutiles dans la source du plus grand groupe. Le Data Integration Service déplace la condition de jointure vers la source du plus grand groupe et ne lit que les lignes qui correspondent au plus petit groupe.
Utilisez la méthode d'optimisation de semi-jointure.
Utilisez la méthode d'optimisation de semi-jointure pour améliorer les performances du mappage lorsqu'un groupe d'entrée a beaucoup plus de lignes que l'autre et lorsque le plus grand groupe a beaucoup de lignes sans correspondance dans le plus petit groupe en fonction de la condition de jointure.