Formulário de definição de semelhança

  • Versão de lançamento: Yokohama
  • Atualizado 30 de jan. de 2025
  • 3 min. de leitura
  • Use o formulário Formulário de definição de semelhança em Espaço de conformidade para criar uma definição de semelhança para mapeamento de conformidade regulatória.

    Formulário Definição de semelhança

    Para obter uma descrição dos valores de campo, consulte a tabela a seguir.
    Tabela 1. Formulário Definição de semelhança
    Campo Descrição
    Rótulo Nome exclusivo da solução de semelhança.
    Nome Nome da solução de semelhança. Este campo é definido automaticamente com o nome atribuído pelo sistema que é mais semelhante ao seu valor para o campo Rótulo.
    Corpus de palavras Corpus de palavras existente que é relevante para sua solução. Para este caso de uso, selecione o corpus de palavras para o corpus de palavras de atribuição de problemas.
    Nota:
    Para corpora de palavras em soluções de semelhança, o número de registros de acordo com a tabela é limitado a 300.000.
    Tabela Tabela que contém os registros para os quais você deseja treinar e prever. Quando você atribui um valor de tabela, um link aparece no formulário. O link mostra o número de registros que correspondem às suas condições atuais.

    Para este caso de uso, o campo é definido automaticamente para a tabela [sn_compliance_citation]. Não modifique este campo para esta definição de solução.

    Campos Tipos de campo que provavelmente ajudarão a recomendar as citações. Você pode selecionar as colunas da tabela no campo Tabela para que seus dados ajudem a prever as citações com mais precisão. Neste caso de uso, os campos Nome, Nome do documento, Descrição do documentoe Descrição são selecionados. Esses campos são os tipos de campo que contêm os registros de citação que você deseja recomendar.
    Nota:
    Você pode modificar os campos selecionados aqui se houver outros campos importantes não vazios no registro do problema em seu banco de dados, de modo que esses campos possam ajudar a descobrir citações semelhantes para mapeamento para os alertas regulatórios.
    Tabela de Teste Tabela que contém as citações para as quais você deseja prever. Para este caso de uso, o campo é definido automaticamente para a tabela Problema [sn_grc_reg_change_regulatory_feed].
    Nota:
    O número de registros que a janela Semelhança pode recuperar é limitado a 10. Este campo não deve ser modificado para esta definição de solução.
    Campos de Testes Campos que são usados como entrada durante a previsão. Neste caso de uso, selecione Título e Descrição.
    Nota:
    Você pode modificar os campos selecionados aqui se houver outros campos importantes não vazios no registro do problema em seu banco de dados, de modo que esses campos possam ajudar a descobrir problemas semelhantes para prever os responsáveis pelo problema.
    Filtro Deixe este campo em branco.
    Idioma de Processamento Idioma dominante do conjunto de dados que você está treinando na definição da solução. Se o idioma do conjunto de dados for inglês, escolha English.
    Por padrão, o processamento em inglês é aplicado a todos os conjuntos de dados. Por exemplo, se você selecionar English, o sistema processará os dados em inglês e italiano.
    Nota:
    O termo processamento indica algumas das etapas específicas do idioma que são usadas como parte do treinamento de uma solução. Essas etapas incluem tokenização de palavras, remoção de palavras irrelevantes e truncamento.
    Palavras irrelevantes Lista de palavras irrelevantes. Quando você seleciona o idioma de processamento, o sistema adiciona automaticamente uma lista de palavras irrelevantes que usa o mesmo idioma. Por exemplo, se o idioma de processamento for o inglês, a opção Palavras irrelevantes padrão em inglês será exibida. A lista Palavras irrelevantes padrão em inglês também aparece em sua seleção. Você pode adicionar sua própria lista personalizada de palavras irrelevantes.
    Frequência de Treinamento Frequência de treinamento. O intervalo da opção de retreinamento é de 180 dias.
    Frequência de Atualização Frequência com que você deseja atualizar os dados usados para recuperar os resultados de semelhança.

    Por exemplo, novas citações normalmente ocorrem com frequência ao longo do dia. Se você tiver novas citações, convém selecionar uma frequência de atualização de A cada 15 minutos. Essa frequência pode aumentar a probabilidade de novas citações serem incluídas na atualização.