Utilice el algoritmo Distancia de Jaro para comparar dos cadenas cuando la similitud entre los caracteres iniciales de las cadenas tenga prioridad.
La puntuación de coincidencia de la Distancia de Jaro refleja el grado de similitud entre los primeros cuatro caracteres de ambas cadenas y el número de transposiciones de carácter identificadas. La transformación pondera la importancia de la coincidencia entre los primeros cuatro caracteres utilizando el valor que se introduce en la propiedad
Penalización
.
Propiedades de la distancia de Jaro
Cuando se configura un algoritmo Distancia de Jaro, puede configurar las siguientes propiedades:
Penalización
Determina la penalización para la puntuación de coincidencia si los primeros cuatro caracteres en dos cadenas comparadas no son idénticos. La transformación resta el valor completo de la penalización cuando no hay ninguna coincidencia con el primer carácter. La transformación resta fracciones de la penalización según la posición que ocupan los otros caracteres sin coincidencia. El valor predeterminado de la penalización es
0,20
.
Distinguir mayúsculas de minúsculas
Determina si el algoritmo Distancia de Jaro tiene en cuenta el formato de mayúsculas y minúsculas de los caracteres cuando los compara.
Ejemplo de la distancia de Jaro
Considere las siguientes cadenas:
391859
813995
Si utiliza el valor de
Penalización
predeterminado de
0,20
para analizar estas cadenas, el algoritmo Distancia de Jaro devuelve una puntuación de coincidencia de
0,513
. Esta puntuación de coincidencia indica que las cadenas tienen una similitud del 51,3%.