Configurar palabras no significativas, sinónimos y asignaciones de caracteres
Configurar palabras no significativas, sinónimos y asignaciones de caracteres
Cuando se realiza una búsqueda, MDM puede omitir las palabras comunes como "y", "un", "una" o "es". Asimismo, MDM puede buscar los sinónimos de la cadena de búsqueda. Por ejemplo, al buscar "William", el resultado de la búsqueda puede incluir los sinónimos "Will" y "Willy".
Para configurar las palabras comunes de manera que omitan o incluyan los sinónimos en los resultados de búsqueda, Informatica proporciona archivos de texto que contienen palabras no significativas y sinónimos. Si lo prefiere, también puede configurar el suyo propio.
Para utilizar los analizadores predeterminados de Elasticsearch para idiomas como chino, japonés y coreano, Informatica proporciona un archivo de asignaciones,
mapping-FoldToASCII.txt
. El filtro de caracteres de estos analizadores predeterminados utiliza el archivo de asignaciones para convertir caracteres alfabéticos, numéricos y simbólicos que no estén en el bloque Unicode de caracteres latinos básicos en su equivalente ASCII. Para obtener más información sobre los analizadores de idiomas, consulte la documentación de Elasticsearch.
Para configurar las palabras no significativas, los sinónimos y las asignaciones de caracteres, lleve a cabo los siguientes pasos:
Cree un directorio
analysis
en la siguiente ubicación:
<directorio de instalación de elasticsearch>/config
Copie los archivos
stopwords.txt
y
synonyms.txt
en el directorio
analysis
.
Para configurar las palabras no significativas para idiomas como japonés, cree un directorio
lang
en la siguiente ubicación:
<directorio de instalación de elasticsearch>/config/analysis
Copie los archivos de palabras no significativas para otros idiomas, como