Consejos sobre el rendimiento de la transformación de combinación
Consejos sobre el rendimiento de la transformación de combinación
Siga estos consejos para aumentar el rendimiento de la transformación de combinación.
Las transformaciones de incorporación pueden reducir el rendimiento porque necesitan espacio adicional en tiempo de ejecución para guardar los resultados intermedios. Puede consultar la información del contador de rendimiento de combinación para determinar si es necesario optimizar las transformaciones de combinación.
Siga los consejos que se dan a continuación para aumentar el rendimiento de la transformación de combinación:
Designe el origen principal como origen con menos valores de clave duplicadas.
Cuando el servicio de integración de datos procesa una transformación de combinación ordenada, guarda simultáneamente en la memoria caché cien claves únicas. Si el origen principal contiene muchas filas con el mismo valor de clave, el servicio de integración de datos debe guardar más filas en la memoria caché, con lo cual se reduce el rendimiento.
Designe el origen principal como origen con menos filas.
La transformación de combinación compara cada fila del origen de detalle con el origen principal. A menor número de filas que haya en el origen principal se producen menos iteraciones de la comparación de uniones, lo que acelera el proceso de unión.
Realice uniones en una base de datos siempre que sea posible.
Las uniones en bases de datos se realizan más rápido que las que se realizan durante la ejecución de la asignación. El rendimiento puede variar en función del tipo de unión de base de datos que se utilice. Las uniones normales son más rápidas que los outer joins y producen menos filas. En ocasiones no es posible realizar la unión en la base de datos, como unir tablas de dos bases de datos o sistemas de archivos sin formato diferentes.
Una datos ordenados siempre que sea posible.
Configure la transformación de combinación para que utilice la entrada ordenada. El servicio de integración de datos aumenta el rendimiento reduciendo al mínimo la entrada y la salida de disco. Se observa el mayor rendimiento al trabajar con conjuntos de datos de gran tamaño. Para una transformación de combinación no ordenada, designe como origen principal el origen con menos filas.
Optimizar la condición de combinación.
El servicio de integración de datos intenta reducir el tamaño del conjunto de datos de un operando de combinación leyendo las filas del grupo más pequeño, buscando las filas coincidentes en el grupo más grande y luego llevando a cabo la operación de combinación. La reducción del tamaño del conjunto de datos mejora el rendimiento de la asignación, ya que el servicio de integración de datos ya no necesita leer filas innecesarias desde el origen del grupo más grande. El servicio de integración de datos mueve la condición de combinación al origen del grupo más grande y solamente lee las filas que coinciden con el grupo más pequeño.
Utilice el método de optimización semi-join.
Utilice el método de optimización semi-join para mejorar el rendimiento de la asignación cuando un grupo de entrada tiene muchas más filas que el otro y cuando el grupo más grande tiene muchas filas sin coincidencia en el grupo más pequeño en función de la condición de combinación.