세그먼트에 대한 가이드라인
다음 제안을 따르면 시맨틱 계층에서 세그먼트를 효과적으로 사용할 수 있습니다.
세그먼트에 대한 일반 가이드라인
- 세그먼트와 일치해야 하는 자연어 질문을 하여 세그먼트를 테스트합니다. 세그먼트는 다음 위치에 나타나야 합니다. .
- 쿼리 로그를 모니터링하여 세그먼트가 올바르게 일치하는지 확인하고 가장 가치 있는 세그먼트를 식별합니다.
- 여러 수동 세그먼트로 과적합하지 않고 노이지가 많은 자동 생성 세그먼트를 비활성화합니다.
- 사용자가 실제로 말하는 방식과 일치하는 자연스러운 표현을 사용합니다.
- 혼동을 피하기 위해 개념당 하나의 세그먼트를 유지합니다.
- 사용자 피드백 및 사용 패턴에 따라 세그먼트 이름 및 설명 구체화
- 기존 세그먼트로 잘 처리되지 않는 반복되는 질문에 대한 수동 세그먼트를 만드는 것이 좋습니다.
수동 세그먼트에 대한 가이드라인
수동 세그먼트는 도메인별 저장된 검색을 애플리케이션과 함께 제공하는 데 권장되는 방법입니다. 검색하는 동안 자동화된 세그먼트보다 우선순위가 향상되며, LLM은 전혀 관련이 없는 경우가 아닌 한 모든 필터를 유지하도록 지시받습니다.
- 고가치, 트래픽이 많은 테이블로 시작
- 사용자가 가장 많이 묻는 테이블에 수동 세그먼트를 집중합니다. 인시던트, sc_req_item 또는 애플리케이션의 기본 테이블에 잘 구성된 소수의 세그먼트는 거의 쿼리되지 않는 테이블에 대한 광범위한 범위보다 더 큰 영향을 미칩니다.
- 선택이 많은 모든 필터를 명확한 이름과 페어링
- 세그먼트가 선택 값(예:
state=6^priority<=2)으로 필터링하는 경우 세그먼트 이름은 해당 코드를 비즈니스 언어로 번역해야 합니다. LLM은 필터가 아닌 이름과 일치합니다. "해결된 중요 및 높은 인시던트"는 검색할 수 있지만state=6^priority<=2는 검색할 수 없습니다. - 설명을 사용하여 유사한 세그먼트의 모호성을 해소합니다.
- 동일한 테이블에 대해 여러 세그먼트(예: "미해결 인시던트" 및 "미해결 중요 인시던트")를 제공하는 경우 설명은 LLM이 올바른 세그먼트를 선택하는 데 도움이 됩니다. 설명이 없으면 LLM은 두 개의 가까운 일치 항목 중에서 임의로 선택할 수 있습니다.
- 필터의 포커스를 유지하기
- 15개의 필터 조건이 있는 세그먼트는 LLM이 추론하기 어렵고 잘릴 가능성이 높습니다. 사용 사례가 복잡한 경우 간단한 필터를 사용하여 여러 세그먼트로 분할합니다. LLM은 쿼리를 구성할 때 여러 세그먼트의 필터를 결합할 수 있습니다.
- 세그먼트로 시맨틱 설명 보완
- 수동 세그먼트와 의미 설명(엔터티/열 구성)이 함께 작동합니다. 설명은 LLM이 테이블과 해당 열이 나타내는 바 를 이해하는 데 도움이 됩니다. 세그먼트는 LLM이 사용자가 일반적으로 해당 테이블을 필터링하는 방법을 이해하는 데 도움이 됩니다. 최상의 결과를 얻으려면 둘 다 배송하십시오.
- 자동화된 세그먼트 중복 방지
- 수동 세그먼트를 만들기 전에 자동화된 세그먼트가 이미 동일한 필터를 포함하고 있는지 확인합니다. 하지만 이름이 좋지 않은 경우에는 중복된 수동 세그먼트를 만드는 것보다 보고서 이름 바꾸기와 같이 소스를 개선하는 것이 더 나은 방법인지 고려하십시오.
- 배포 후 검토
- 배송 후에는 일치하는 세그먼트와 생성된 쿼리가 올바른지 여부를 모니터링합니다. 세그먼트가 일치하지만 잘못된 결과를 생성하는 경우 문제는 일반적으로 이름이 너무 일반적이거나 필터가 너무 광범위하기 때문입니다. 시스템 속성을 조정하기 전에 먼저 이름과 설명을 반복합니다.
속성 조정 제안
세그먼트가 예상대로 수행되지 않을 때 이러한 제안을 사용하여 시스템 속성을 조정합니다. 모든 세그먼트 속성과 해당 기본값의 전체 목록은 다음 문서를 참조하십시오 쿼리 작성 속성.
- 세그먼트가 사용자 질문과 일치하지 않습니다.
- 더 낮습니다 segments_match_threshold (예:
0.60으로 설정). 기본0.70은 사용자의 표현이 세그먼트 이름과 다른 도메인별 용어에는 너무 엄격할 수 있습니다. 더 낮게 시작하여 충분한 세그먼트가 있으면 조입니다. - 수동 세그먼트가 자동화된 세그먼트에 가려지고 있음
- 증가하면 manual_segment_scale_factor 수동 세그먼트에 더 강력한 우위를 제공할 수 있지만 부스트가 높다고 해서 반드시 더 나은 결과를 의미하지는 않습니다. 이름이 잘못된 수동 세그먼트가 실제로 관련성이 높은 자동화 세그먼트 위로 부스트되면 쿼리 품질이 저하됩니다. 부스트를 조정하기 전에 먼저 수동 세그먼트의 이름과 설명이 잘 작성되었는지 확인하세요. 이것이 일반적으로 진짜 해결책입니다. 수동 세그먼트의 품질이 높지만 여전히 약한 자동 일치에 패배한다고 확신하는 경우에만 계수를 늘리십시오.
- LLM 프롬프트에 관련 없는 세그먼트가 너무 많습니다.
- 더 낮습니다 segments_result_limit (예:
6또는8). 프롬프트에 세그먼트가 적다는 것은 LLM의 노이즈가 적다는 것을 의미하지만 적용 범위도 줄어듭니다. 도메인의 잔액을 찾습니다. 또는 품질이 낮은 일치가 빠져나가는 경우 올리 segments_match_threshold 십시오. - 긴 필터가 잘림
- 세그먼트에 복잡한 필터가 필요한 경우 증가 max_filter_length 합니다. 필터가 길수록 LLM의 컨텍스트 창을 더 많이 소비하고 전반적인 생성 품질이 저하될 수 있습니다. 대신 복잡한 세그먼트를 여러 개의 포커스된 세그먼트로 분할하는 것이 좋습니다.
- 배치 검색이 비활성화되고 수동 세그먼트가 표시되지 않습니다.
- 속성을 segments.ais_batch_fetch_enabled활성화합니다AI 검색. 일괄 검색이 없으면 수동 및 자동 세그먼트가 동일한 결과 슬롯을 놓고 경쟁합니다. 일괄 검색은 각 유형에 전용 검색을 제공하여 수동 세그먼트 범위를 크게 개선합니다.