A transformação de Rotulador é uma transformação passiva que analisa os campos da porta de entrada e grava rótulos de texto que descrevem os dados em cada campo.
Use uma transformação de Rotulador quando quiser entender os tipos de informação que uma porta contém. Você usa uma transformação de Rotulador quando você não sabe os tipos de informação em uma porta ou quando quer identificar registros que não contêm os tipos esperados de informação em uma porta.
Um rótulo é uma string de um ou mais caracteres que descreve uma string de entrada. Você configura a transformação de Rotulador para atribuir rótulos a strings de entrada com base nos dados que cada string contém.
Ao configurar a transformação, você especifica os tipos de caractere ou string que devem ser pesquisados, bem como o rótulo que a transformação grava como saída quando encontra o caractere ou string associado(a). Você insere os tipos de caractere e string a serem pesquisados quando configura uma operação de rotulagem. Também é possível usar objetos de dados de referência para especificar os caracteres, strings e rótulos.
Você configura a transformação para executar a rotulagem de caractere ou token:
Rotulagem de Caractere
Grava um rótulo que descreve a estrutura de caracteres da string de entrada, incluindo pontuação e espaços. A transformação grava um único rótulo para cada linha em uma coluna. Por exemplo, a transformação de Rotulador pode rotular o código postal 10028 como "nnnnn", onde "n" representa um caractere numérico.
Rotulagem de Token
Grava um rótulo que descreve o tipo de informação na string de entrada. A transformação grava um rótulo para cada token identificado nos dados de entrada. Por exemplo, você pode configurar a transformação de Rotulador para rotular a string "John J. Smith" com os tokens "Palavra Init Palavra".
Um token é um valor delimitado em uma string de entrada.
Quando o Rotulador encontra um caractere ou string que corresponde a um rótulo especificado, ele grava o nome do rótulo em uma nova porta de saída.
A transformação de Rotulador usa dados de referência para identificar caracteres e tokens. Você seleciona o objeto de dados de referência ao configurar uma operação em uma estratégia de Rotulador.