검색 쿼리 매개변수 평가 프레임워크

  • 릴리스 버전: Washingtondc
  • 업데이트 날짜 2024년 02월 01일
  • 읽기9분
  • AI 검색 는 검색 쿼리 매개변수 값의 대체 집합에 대한 결과 관련성을 비교하는 A/B 테스트 평가를 수행합니다. 이러한 평가는 기계 학습 관련성 및 Q&A Genius 결과에 사용하는 모델을 AI 검색 결정합니다.

    검색 쿼리 매개변수 평가 프레임워크를 사용하면 라이브 검색 트래픽에 대한 A/B 관련성 테스트를 수행할 수 있습니다. AI 검색 는 다음과 같은 결정을 내릴 때 집계된 검색 신호 데이터의 오프라인 평가와 함께 이 실시간 테스트의 결과를 고려합니다.
    • 검색 프로파일에 게시할 관련성 모델 결정 관련성 모델의 생성 및 게시에 대한 자세한 내용은 을 참조하십시오 의 머신 러닝 관련성 AI 검색.
    • 잠재적인 Q&A Genius 결과 대답의 유효성을 검사할 때 사용할 MRC(기계 독해) 모델을 결정합니다. Q&A Genius 결과에 사용되는 MRC 모델에 대한 자세한 내용은 을 참조하십시오 Q&A Genius 결과.

    AI 검색 야간에 A/B 테스트 평가 결과를 계산합니다.

    검색 쿼리 매개 변수 평가 프레임워크는 Adaptive Telemetry 기능 제품군의 일부입니다.

    검색 쿼리 매개변수 평가 프레임워크 테이블

    에 대한 AI 검색 검색 쿼리 매개변수 평가 프레임워크는 테이블을 사용하여 라이브 검색 트래픽의 A/B 테스트에서 얻은 결과와 메트릭을 저장합니다. AI 검색 는 검색 애플리케이션에 게시할 관련성 모델 및 Q&A Genius 결과 답변 확인 모델을 결정할 때 저장된 데이터를 사용합니다.

    A/B 테스트 평가 테이블

    A/B 테스트 평가 [evaluation] 테이블에는 라이브 검색 트래픽에서 수행된 A/B 테스트 평가에 대한 세부 정보가 저장됩니다.
    주:
    시스템이 자동으로 이 테이블을 정리하여 2년 이상 된 비활성 평가 기록을 제거합니다.
    표 1. 평가
    설명
    번호 평가를 식별하기 위해 자동으로 생성된 번호입니다.
    이름 평가에 대한 이름 및 설명입니다.
    소스 평가를 실행할 기록이 포함된 테이블의 이름입니다.
    테스트 범위 평가의 범위입니다.
    • 지원되는 값:
      • ALL: 원본으로 지정된 테이블의 모든 레코드에 대해 평가를 실행합니다.
      • SELECTED: 선택한 아티팩트 필드 값에 지정된 기록에 대해서만 평가를 실행합니다.
    • 기본값: ALL
    아티팩트 제공자

    테스트용 기록을 제공하는 아티팩트 필터링 클래스의 목록입니다.

    선택한 아티팩트 쉼표로 구분된 기록 sys_id 값 목록입니다. 테스트 범위선택됨으로 설정되면 이 목록에 지정된 sys_id 값이 있는 레코드에 대해서만 평가가 실행됩니다.
    평가 최소 신호
    평가가 종료되기 전에 수집해야 하는 최소 검색 신호 수입니다.
    • 유형: 정수
    • 기본값: 0 (최소값 없음)
    • 최대값: 30000

    이 조건이 평가 최소 일 수 조건과 상호 작용하는 방식에 대한 자세한 내용은 종료 기준 연산자를 참조하십시오.

    평가 최소 일수
    종료되기 전에 평가를 활성화해야 하는 최소 일 수입니다.
    • 유형: 정수
    • 기본값: 0 (최소값 없음)
    • 최대값: 180

    이 조건이 평가를 위한 최소 신호 조건과 상호 작용하는 방식에 대한 자세한 내용은 End Criteria Operator 항목을 참조하십시오.

    종료 기준 연산자 평가를 위한 최소 신호와 평가 조건을 위한 최소 일수가 모두 있는 경우 평가 종료 조건에 사용할 논리 연산자입니다.
    • 지원되는 값:
      • AND: 평가를 위한 최소 신호 및 평가 조건을 위한 최소 일 수가 모두 충족될 때까지 평가가 활성 상태로 유지됩니다.
      • OR: 평가를 위한 최소 신호 또는 평가 조건을 위한 최소 일 중 하나가 충족될 때까지 평가가 활성 상태로 유지됩니다.
    • 기본값: OR

    A/B 테스트 평가 실행 테이블

    A/B 테스트 평가 실행 [evaluation_execution] 테이블에는 라이브 검색 트래픽에 대한 A/B 테스트 평가의 일부로 실행된 개별 작업의 세부 정보가 저장됩니다.

    표 2. evaluation_execution
    설명
    번호 평가 작업을 식별하기 위해 자동 생성된 번호입니다.
    평가 A/B 테스트 평가 [evaluation] 테이블의 평가 기록을 참조합니다.
    아티팩트 ID 이 평가 작업에서 분석한 기록에 대한 Sys_id입니다.
    상태 기록 평가 실행의 상태입니다.
    • 지원되는 값:
      • Queued: 평가 작업이 실행을 위해 대기 중입니다.
      • In Progress: 평가 작업이 진행 중입니다.
      • Scoring: 평가 작업이 점수 매기기 단계에 있습니다.
      • Complete: 평가 작업이 성공적으로 완료되었습니다.
      • Errored: 오류로 인해 평가 작업이 실패했습니다.
      • Canceled: 시스템에 의해 평가 작업이 취소되었습니다.
      • Suspended: 시스템에 의해 평가 작업이 일시 중단되었습니다.
    • 기본값: Queued
    시작 날짜 평가 작업이 시작된 날짜 및 시간입니다.
    종료 날짜 평가 작업이 종료된 날짜 및 시간입니다.

    A/B 테스트 평가 매개변수 테이블

    A/B 테스트 평가 매개 변수 [evaluation_parameter] 테이블에는 라이브 검색 트래픽에 대한 A/B 테스트 평가에서 고려된 개별 검색 쿼리 매개 변수의 세부 정보가 저장됩니다.

    표 3. evaluation_parameter
    설명
    평가 A/B 테스트 평가 [evaluation] 테이블의 평가 기록을 참조합니다.
    이름 평가 매개변수의 이름 및 설명입니다.
    아티팩트의 할당된 매개변수 사용
    • 유형: 부울
    • 지원되는 값:
      • true: 지정된 Parameter Values 값을 제공된 아티팩트에서 현재 할당된 검색 쿼리 매개변수 값과 비교합니다.
      • false: 지정된 Parameter Values 것을 제공된 아티팩트에서 현재 할당된 검색 쿼리 매개변수 값과 비교하지 마십시오.
    • 기본값: true
    매개변수 값 트래픽 백분율 A/B 평가 중에 지정 Parameter Values 을 적용할 검색 쿼리의 비율입니다.
    • 유형: 정수
    • 기본값: 0
    • 최대값: 100
    매개변수 값 예일 경우 Use Artifact's Assigned Parameter 현재 검색 쿼리 매개변수 값과 비교할 값의 JSON 목록입니다.
    매개변수 유형

    검색 쿼리 매개변수의 유형입니다. 선택한 값에 따라 A/B 평가 중과 후에 A/B 평가가 사용되는 방식이 Parameter Values 결정됩니다.

    지원되는 값:
    • Search Context Parameters: 검색 프로파일 컨텍스트 매개 변수를 for 검색 쿼리 요청으로 Parameter Values 병합하고 재정의합니다. 평가가 종료되면 최우선 점수로 설정된 검색 쿼리 컨텍스트 매개변수 값을 사용하여 관련 검색 프로파일 컨텍스트 매개변수를 재정의하거나 병합합니다.
    • Search QnA Genius Result Configuration: 검색 쿼리 요청에 사용되는 Q&A Genius Result 구성에 Parameter Values 적용합니다. 평가가 끝나면 관련 검색 프로파일을 업데이트하여 Genius Result 구성 매개변수 값을 우승 점수와 함께 포함시킵니다.
    • Search QnA Model: 검색 쿼리 요청에 사용되는 Q&A Genius Result 모델에 적용합니다 Parameter Values . 평가가 종료되면 Q&A Genius 결과 모델 매개변수 값을 우승 점수와 함께 포함하도록 관련 검색 프로파일을 업데이트합니다.
    • Search Relevancy Model: 검색 쿼리 요청에 사용할 검색 관련성 모델을 적용 Parameter Values 합니다. 평가가 종료되면 관련 검색 프로파일을 업데이트하여 관련성 모델 매개변수 값을 최우선 점수와 함께 포함합니다.
    • Search REST Parameters: 검색 프로파일 쿼리 매개변수를 검색 쿼리 요청에 대한 병합 및 재정의합니다 Parameter Values . 평가가 종료되면 우승 점수로 설정된 검색 쿼리 매개변수 값을 사용하여 관련 검색 프로파일 매개변수를 재정의하거나 병합합니다.
    점수 계산 유형

    검색 쿼리 매개변수 값 점수를 계산하고 최상의 값을 찾는 데 사용되는 계산 형식입니다.

    지원되는 값:
    • Average Click Position: 최상의 검색 쿼리 매개 변수 값은 평균 클릭 위치 점수가 가장 낮은 값입니다.
      주:
      AI 검색 선택한 모든 검색 결과 순위의 합계를 검색 수로 나누어 평균 클릭 위치 점수를 계산합니다. 순위가 가장 높은 검색 결과의 순위는 1위, 다음으로 높은 검색 결과의 순위는 2위입니다. 예를 들어 두 개의 검색을 수행하여 한 경우에는 첫 번째 결과를 선택하고 다른 경우에는 두 번째 결과를 선택하면 평균 클릭 위치 점수는 (1 + 2) / 2 = 1.5입니다.
    • Genius Result Helpfulness: 최상의 검색 쿼리 매개 변수 값은 유용성 점수가 가장 높은 값입니다. 이 계산은 관련 Genius Result 답변이 검색 결과에 나타났는지 여부를 고려합니다.
      주:
      유용성 점수는 Genius Result 답변이 검색 컨텍스트에서 유용했는지 여부를 나타내는 메트릭입니다.
    • Helpfulness: 최상의 검색 쿼리 매개 변수 값은 유용성 점수가 가장 높은 값입니다. 와 달리 Genius Result Helpfulness이 계산은 관련 Genius Result 답변이 검색 결과에 나타났는지 여부를 고려하지 않습니다.
    신호 제공자 검색 쿼리 매개변수의 점수를 매기는 데 필요한 검색 신호 제공자입니다. Search Event Signal Provider 은(는) 유일하게 지원되는 값입니다.

    A/B 테스트 평가 파라미터 결과 테이블

    A/B 테스트 평가 매개 변수 결과[evaluation_parameter_result] 테이블에는 라이브 검색 트래픽에 대한 A/B 테스트 평가에서 고려된 개별 검색 쿼리 매개 변수에 대한 계산 결과가 저장됩니다.

    표 4. evaluation_parameter_result
    설명
    평가 실행 A/B 테스트 평가 실행 [evaluation_execution] 테이블의 평가 실행에 대한 기록을 참조합니다.
    파라미터 평가 A/B 테스트 평가 매개변수 [evaluation_parameter] 테이블의 검색 쿼리 매개변수에 대한 기록 참조입니다.
    최고의 값 검색 쿼리 매개 변수에 가장 적합한 값으로 Winning Score, 에 의해 결정됩니다.
    승리 점수 검색 쿼리 매개 변수에 대한 숫자 점수로, 를 Score Calculation Type사용하여 결정됩니다.
    점수 메타데이터 검색 쿼리 매개변수에 대한 점수 계산의 메타데이터입니다.

    검색 쿼리 매개변수 평가 프레임워크에서 검색 프로파일 제외

    실시간 AI 검색 트래픽의 A/B 테스트 평가에서 검색 프로필을 제외합니다. 이 절차에서는 검색 프로필의 검색 결과 관련성 모델과 Q&A Genius 결과 답변 확인 모델을 게시할 때 A/B 테스트 평가 결과를 사용하지 않도록 합니다 AI 검색 .

    시작하기 전에

    필요한 역할: ais_admin

    이 태스크 정보

    검색 쿼리 매개변수 평가 프레임워크는 실시간 검색 트래픽을 사용하여 검색 구성 설정에 대한 A/B 테스트 평가를 수행합니다. 기본적으로 AI 검색 모든 검색 프로파일의 구성 설정을 평가합니다.

    검색 관리자는 검색 쿼리 매개변수 평가 프레임워크에서 개별 검색 프로파일을 제외할 수 있습니다. 프레임워크에서 검색 프로필을 제외하면 AI 검색 제외된 검색 프로필을 사용하는 라이브 검색 트래픽에 대한 A/B 테스트 평가를 수행할 수 없습니다.
    주:
    평가 AI 검색 에서 검색 프로파일을 제외하면 해당 검색 프로파일에 대한 머신 러닝 관련성 및 머신 독해력(MRC) 모델을 업데이트할 때 더 이상 평가 결과를 고려하지 않습니다. 따라서 검색 프로필에 대한 관련성 점수 설정 및 Q&A Genius 결과 답변 필터링 설정은 검색 트래픽을 덜 반영할 수 있습니다. 이러한 모델을 게시할 때 A/B 평가 테스트 결과를 사용하는 방법에 AI 검색 대한 자세한 내용은 및 Q&A Genius 결과를 참조하십시오의 머신 러닝 관련성 AI 검색.

    프로시저

    1. 다음으로 이동 모두 > AI 검색 > 검색 환경 > 검색 프로파일레이블이 표시됩니다.
    2. 라이브 검색 트래픽의 A/B 테스트 평가에서 제외하려는 검색 프로파일에 대한 기록을 엽니다.
    3. 검색 프로파일 양식에 평가에서 제외 필드가 아직 표시되지 않은 경우 필드가 표시되도록 양식 레이아웃을 구성합니다.
      필드를 표시하도록 양식 레이아웃을 구성하는 방법에 대한 자세한 내용은 을 참조하십시오 양식 레이아웃 구성.
    4. 평가에서 제외 옵션을 선택합니다.
    5. 업데이트를 선택합니다.

    결과

    AI 검색 는 제외된 검색 프로필을 사용하는 트래픽에 대해 더 이상 A/B 테스트 평가를 수행하지 않습니다. 머신 러닝 관련성은 더 이상 검색 프로파일의 관련성 모델을 업데이트하지 않습니다.