Configurar palabras no significativas, sinónimos y asignaciones de caracteres
Configurar palabras no significativas, sinónimos y asignaciones de caracteres
Cuando se realiza una búsqueda, MDM puede omitir las palabras comunes como "y", "un", "una" o "es". Asimismo, MDM puede buscar los sinónimos de la cadena de búsqueda. Por ejemplo, al buscar "William", el resultado de la búsqueda puede incluir los sinónimos "Will" y "Willy".
Para configurar las palabras comunes de manera que omitan o incluyan los sinónimos en los resultados de búsqueda, Informatica proporciona archivos de texto que contienen palabras no significativas y sinónimos. Si lo prefiere, también puede configurar el suyo propio.
Para utilizar los analizadores predeterminados de Elasticsearch para idiomas como chino, japonés y coreano, Informatica proporciona un archivo de asignaciones,
mapping-FoldToASCII.txt
. El filtro de caracteres de estos analizadores predeterminados utiliza el archivo de asignaciones para convertir caracteres alfabéticos, numéricos y simbólicos que no estén en el bloque Unicode de caracteres latinos básicos en su equivalente ASCII.
Para obtener los archivos
stopwords.txt
,
synonyms.txt
,
stopwords_ja.txt
y
mapping-FoldToASCII.txt
, póngase en contacto con el servicio internacional de atención al cliente de Informatica.
Para configurar las palabras no significativas, los sinónimos y las asignaciones de caracteres, lleve a cabo los siguientes pasos:
Cree un directorio
analysis
en la siguiente ubicación:
<directorio de instalación de elasticsearch>/config
Copie los archivos
stopwords.txt
y
synonyms.txt
en el directorio
analysis
.
Para configurar las palabras no significativas para idiomas como japonés, cree un directorio
lang
en la siguiente ubicación:
<directorio de instalación de elasticsearch>/config/analysis
Copie los archivos de palabras no significativas para otros idiomas, como