Índice

Search

  1. Prólogo
  2. Servicio del analista
  3. Servicio de catálogo
  4. Servicio de administración de contenido
  5. Servicio de integración de datos
  6. Arquitectura del Servicio de integración de datos
  7. Administración del Servicio de integración de datos
  8. Malla del Servicio de integración de datos
  9. API de REST del servicio de integración de datos
  10. Aplicaciones del servicio de integración de datos
  11. Servicio de Data Privacy Management
  12. Servicio de Enterprise Data Preparation
  13. Servicio de preparación de datos interactivo
  14. Servicio de clúster de Informatica
  15. Servicio de ingesta masiva
  16. Servicio de acceso a metadatos
  17. Servicio de Metadata Manager
  18. Servicio de repositorio de modelos
  19. Servicio de integración de PowerCenter
  20. Arquitectura del servicio de integración de PowerCenter
  21. Alta disponibilidad del Servicio de integración de PowerCenter
  22. Servicio de repositorio de PowerCenter
  23. Administración de repositorios de PowerCenter
  24. Servicio de escucha de PowerExchange
  25. Servicio de registrador de PowerExchange
  26. Servicio SAP BW
  27. Servicio de Búsqueda
  28. Servicios del sistema
  29. Servicio de Test Data Manager
  30. Servicio de Test Data Warehouse
  31. Concentrador de servicios web
  32. Actualización de servicios de aplicaciones
  33. Apéndice A: Bases de datos de servicios de aplicación
  34. Apéndice B: Conexión con las bases de datos desde Windows
  35. Apéndice C: Conexión con bases de datos desde UNIX o Linux
  36. Apéndice D: Cómo actualizar el parámetro DynamicSections de una base de datos DB2

Guía del servicio de aplicación

Guía del servicio de aplicación

Modelos probabilísticos y modelos de clasificador

Modelos probabilísticos y modelos de clasificador

El servicio de repositorio de modelos lee los datos de los archivos de modelos probabilísticos y de modelos de clasificador en el equipo que aloja el servicio de administración de contenido principal en el dominio. Cuando se compila un modelo probabilístico o un modelo de clasificador en la Herramienta del desarrollador, los archivos de modelos se actualizan en el equipo del servicio de administración de contenido principal.
Si un nodo del dominio ejecuta un servicio de administración de contenido, el nodo almacena copias locales de los archivos de modelos probabilísticos y de modelos de clasificador. Especifique la ruta de acceso local para los archivos de los modelos probabilísticos y de clasificador en la propiedad
Opciones de NLP
de cada servicio de administración de contenido. El servicio de administración de contenido principal sincroniza los archivos de los modelos probabilísticos y de clasificador en los nodos del dominio con los archivos del servicio de administración de contenido principal cada 10 minutos.
Para sincronizar un equipo del servicio de administración de contenido con los archivos actuales desde el equipo del servicio de administración de contenido principal, ejecute el siguiente comando:
infacmd cms ResyncData
El comando actualiza el equipo que aloja el nuevo servicio con los archivos de los modelos probabilísticos y de clasificador desde el equipo del servicio de administración de contenido principal. Cuando añada un servicio de administración de contenido en un dominio que incluye un servicio de administración de contenido principal, ejecute el comando ResyncData.
Especifique un único tipo de archivo de modelo cuando ejecute el comando. Para sincronizar los archivos de modelos probabilísticos y los archivos de modelos de clasificador, ejecute el comando una vez para cada tipo de archivo de modelo.

Operaciones de sincronización

El servicio de administración de contenido principal almacena una lista de los servicios de administración de contenido en el dominio. Cuando el servicio de administración de contenido principal se sincroniza con los servicios del dominio, el servicio de administración de contenido principal copia los archivos de modelos actuales de forma secuencial en cada nodo del dominio. Si un nodo no está disponible, el servicio de administración de contenido principal mueve el nodo al final de la lista y se sincroniza con el siguiente nodo de la lista. Una vez que la operación de sincronización ha copiado los archivos en todos los equipos del servicio de administración de contenido disponibles, la operación finaliza.
Para comprobar que una operación de sincronización ha sido satisfactoria en un nodo, vaya a la estructura del directorio en el nodo y localice los archivos de modelos probabilísticos o de clasificador. Compare los archivos con los archivos del equipo del servicio de administración de contenido principal.
Informatica emplea las siguientes rutas de directorio como ubicaciones predeterminadas para los archivos:

    [Informatica_install_directory]/tomcat/bin/ner

    [Informatica_install_directory]/tomcat/bin/classifier

Los nombres de archivo tienen las siguientes extensiones:

    Archivos de modelos probabilísticos:
    .ner

    Archivos de modelos de clasificador:
    .classifier

El tiempo necesario para sincronizar los archivos de modelos depende del número de archivos en el equipo del servicio de administración de contenido principal. El comando ResyncData copia los archivos de modelos en lotes de 15 archivos cada vez.