Configurar TF-IDF para soluções
Aplique a codificação Frequência de termo–Frequência inversa do documento (TF-IDF) a soluções de classificação, semelhança, regressão ou clustering.
Antes de Iniciar
Nota:
Definir configurações avançadas em suas soluções de ML é opcional. Se você optar por definir qualquer uma dessas configurações, certifique-se de estar bem informado sobre a tecnologia que está habilitando na solução e de ter um caso de uso que se beneficie do que a tecnologia oferece.
- Crie uma definição de solução de semelhança ou use uma existente.
- Crie uma definição de solução de classificação ou use uma existente do one.w
- Crie uma definição de solução de regressão ou use uma existente.
- Se você tiver uma assinatura Professional e estiver implementando Inteligência preditiva pela primeira vez em Vancouver, crie uma definição de solução de cluster ou use uma existente.
- Função necessária: admin ou ml_admin
Por Que e Quando Desempenhar Esta Tarefa
O Predictive Intelligence usa incorporação de palavra de vetor de parágrafo por padrão em suas estruturas de classificação, semelhança e regressão, o que é altamente eficaz para o processamento de dados compostos principalmente por conteúdo legível por humanos. No entanto, o TF-IDF é conhecido por às vezes retornar melhores resultados de previsão para registros que têm conteúdo gerado por máquina, como alertas e mensagens de erro para arquivos de log. Portanto, você pode escolher aqui com base no tipo de dados que sua solução está processando.
Nota:
As etapas para configurar o TF-IDF são as mesmas para todas as estruturas do modelo, mas o suporte do IF-IDF para definições de solução de cluster só será aplicável se você tiver uma assinatura Professional e estiver implementando Inteligência preditiva pela primeira vez em Vancouver.