Utilice el algoritmo Distancia de Hamming cuando la posición de los caracteres de datos sea un factor crítico; por ejemplo, en campos numéricos o de códigos como números de teléfono, códigos postales o códigos de producto.
El algoritmo de la distancia de Hamming calcula una puntuación de coincidencia para dos cadenas de datos calculando el número de posiciones en las que los caracteres difieren de una cadena de datos a otra. En el caso de que las cadenas tengan una longitud diferente, cada carácter adicional de la cadena más larga se cuenta como una diferencia de una cadena a otra.
Ejemplo de distancia de Hamming
Considere las siguientes cadenas:
Morlow
M
a
rlow
es
Los caracteres resaltados indican las posiciones que el algoritmo de Hamming identifica como diferentes.
Para calcular la puntuación de coincidencia Hamming, la transformación divide el número de caracteres coincidentes (5) por la longitud de la cadena más larga (8). En este ejemplo, las cadenas son similares en un 62,5% y la puntuación de coincidencia es de