O Padrão Unicode é o trabalho do Unicode Consortium, um órgão corporação internacional que promove o intercâmbio de dados em todos os idiomas. O Padrão Unicode foi projetado para oferecer suporte a qualquer idioma, não importando a quantidade de bytes que cada caractere no idioma possa exigir. Atualmente, ele oferece suporte a todos os idiomas comuns e oferece suporte limitado para outros idiomas menos comuns. O Unicode Consortium está aprimorando continuamente o Padrão Unicode com novas codificações de caracteres. Para obter mais informações sobre o Padrão Unicode, consulte http://www.unicode.org.
O Padrão Unicode inclui vários conjuntos de caracteres. A Informatica usa os seguintes padrões Unicode:
UCS-2 (Conjunto Universal de Caracteres, byte duplo). Um conjunto de caracteres em que cada caractere usa dois bytes.
UTF-16LE (Formato de Transformação Unicode). Um formato de codificação em que cada caractere pode usar de um a quatro bytes.
UTF-16LE (Formato de Transformação Unicode). Um formato de codificação em que cada caractere usa dois ou quatro bytes.
UTF-32 (Formato de Transformação Unicode). Um formato de codificação em que cada caractere usa quatro bytes.
GB18030. O formato de codificação Unicode definido pelo governo chinês em que cada caractere pode usar de um a quatro bytes.
O Informatica é um aplicativo Unicode. O Cliente do PowerCenter, o Serviço de Integração do PowerCenter e o Data Integration Service usam o UCS-2 internamente. O Cliente do PowerCenter converte as entradas de usuário de qualquer idioma em UCS-2 e converte do UCS-2 antes de gravar no repositório do PowerCenter. O Serviço de Integração do PowerCenter e o Data Integration Service convertem dados de origem em UCS-2 antes de processar e os converte de UCS-2, após processar. O repositório do PowerCenter, o repositório do modelo, o Serviço de Integração do PowerCenter e o Data Integration Service oferecem suporte para UTF-16LE. Você pode usar o Informatica para processar dados em qualquer idioma.