Analisar texto de um arquivo horizontal

  • Versão de lançamento: Washingtondc
  • Atualizado 1 de fev. de 2024
  • 2 min. de leitura
  • É possível usar a estratégia de análise de tipo de arquivo para analisar texto em arquivos dos seguintes formatos: arquivo .ora (usado por vários produtos Oracle), arquivo .properties (comum para Java), arquivo .xml e arquivo .ini. Para arquivos verticais, use a estratégia de análise de arquivo vertical.

    Antes de Iniciar

    Conhecimento básico de programação é desejável.

    Função necessária: pd_admin

    Por Que e Quando Desempenhar Esta Tarefa

    Você pode usar esta estratégia de análise somente para arquivos de texto.
    Aviso:
    Não use esta estratégia de análise para arquivos que não sejam de texto, como arquivos binários.

    É possível definir várias extrações e variáveis. Ao identificar o texto para extração em variáveis, o que você está realmente fazendo é identificar o local do texto dentro de um contexto.

    É possível usar um dos seguintes métodos:
    • No modo de Depuração, é possível selecionar a cadeia de caracteres relevante no conteúdo do arquivo na caixa de texto. Para cada cadeia de caracteres selecionada, sua posição e delimitadores relativos ao contexto são armazenados. Ele permite que as mesmas definições se apliquem a outros arquivos com a mesma estrutura, embora o texto varie. No entanto, ele seleciona o texto inteiro em um contexto.

      Por exemplo, se você tentar selecionar apenas 456 na caixa de texto de um arquivo XML com a linha a seguir, a cadeia de caracteres inteira entre as palavras-chave vai ser selecionada.

      <ciTypeID>123-456-7890000000</ciTypeID>
    • No formulário Opções de análise avançada (fora do modo de Depuração), é possível especificar um delimitador e uma posição para identificar a cadeia de caracteres de texto. Também é possível usar este formulário para fazer uma seleção mais refinada do que na caixa de texto.

      Por exemplo, é possível especificar um delimitador (-) e o número de posições a serem extraídas após o delimitador (3) para extrair a cadeia de caracteres (456).

    Procedimento

    1. Selecione uma das operações de análise na lista Operação.
    2. Selecione uma destas opções da lista Estratégia de análise:
      • Oracle
      • Arquivo JSON
      • Arquivo de propriedades
      • Arquivo XML
      • Arquivo LDAP
      • Arquivo INI
    3. Se estiver trabalhando no modo de Depuração, siga estas etapas:
      1. Clique em Recuperar ou Recuperar conteúdo do arquivo para exibir o conteúdo do que está sendo analisado no painel Saída.
      2. Selecione a cadeia de caracteres na caixa de texto.
        Todas as cadeias de caracteres correspondentes no mesmo contexto são selecionadas automaticamente.
      3. No formulário Definir nome de variável, atribua a cadeia de caracteres a uma variável fornecendo um nome exclusivo e significativo e selecionando OK.
      4. Para identificar cadeias de caracteres e variáveis adicionais, clique no ícone de adição.
    4. Defina a cadeia de caracteres a ser analisada dentro do modo de Depuração ou no formulário de Opções de análise avançada (fora do modo de Depuração).

      Exibição da área de Opções de análise avançada
      OpçãoDescrição
      Fora do modo de Depuração (formulário de Opções de análise avançada)
      1. Clique em Avançado e especifique o caminho da raiz. O caminho da raiz é a seção (ramificação hierárquica na estrutura do arquivo) onde ocorre a análise.
      2. Clique no ícone de adição de cada cadeia de caracteres e variável a ser adicionada e preencha os campos, conforme o adequado.
        • Nome: especifique o nome da coluna.
        • Consulta XPath: especifique a consulta XPath para a cadeia de caracteres. Por exemplo, appcmd/APP/@APP.NAME.
        • Delimitador: especifique o delimitador da cadeia de caracteres.
        • Posição: especifique a posição da cadeia de caracteres.
    5. Para encerrar o processo de descoberta se nenhum resultado for encontrado, marque a caixa de seleção Se não encontrado.
    6. Clique em Fechar Avançada.