솔루션에 대한 TF-IDF 구성
TF-IDF(Term Frequency–Inverse Document Frequency) 인코딩을 분류, 유사성, 회귀 또는 클러스터링 솔루션에 적용합니다.
시작하기 전에
주:
ML 솔루션에서 고급 설정을 구성하는 것은 선택 사항입니다. 이러한 설정을 구성하도록 선택하는 경우 솔루션에서 사용하도록 설정하는 기술에 대해 잘 알고 있는지, 기술이 제공하는 이점을 활용할 수 있는 사용 사례가 있는지 확인합니다.
- 유사성 솔루션 정의를 생성하거나 기존 유사성 솔루션 정의를 사용합니다.
- 분류 솔루션 정의를 생성하거나 기존 솔루션 정의를 사용합니다.wo
- 회귀 솔루션 정의를 생성하거나 기존 솔루션 정의를 사용합니다.
- Professional 구독이 있고 에서 처음 Vancouver구현하는 예측 인텔리전스 경우 클러스터링 솔루션 정의를 생성하거나 기존 정의를 사용합니다.
- 필요한 역할: admin 또는 ml_admin
이 태스크 정보
Predictive Intelligence는 분류, 유사성 및 회귀 프레임워크에서 기본적으로 단락 벡터 단어 임베딩을 사용하며, 이는 주로 사람이 읽을 수 있는 콘텐츠로 구성된 데이터를 처리하는 데 매우 효과적입니다. 그러나 TF-IDF는 때때로 로그 파일에 대한 경고 및 오류 메시지와 같이 기계에서 생성된 콘텐츠가 있는 레코드에 대해 더 나은 예측 결과를 반환하는 것으로 알려져 있습니다. 따라서 솔루션에서 처리하는 데이터의 종류에 따라 선택할 수 있습니다.
주:
TF-IDF를 구성하는 단계는 모든 모델 프레임워크에 대해 동일하지만, 클러스터링 솔루션 정의에 대한 IF-IDF 지원은 Professional 구독이 있고 에서 시작하여 Vancouver처음 구현하는 예측 인텔리전스 경우에만 적용할 수 있습니다.