DatasetDefinition - 전역
DatasetDefinition API는 식별하는 메서드를 제공합니다.ML 교육 알고리즘에 대한 입력으로 사용할 테이블 이름, 열 및 행 선택 기준을 포함하는 일련의 기록입니다. 데이터 세트에는 실제 데이터가 포함되어 있지 않습니다.
자세한 API에는 플러그인(com.glide.platform_ml)이 필요 예측 인텔리전스 하며 sn_ml 네임스페이스 내에서 제공됩니다. 내용은 예측 인텔리전스를 참조하십시오.
사용 지침은 ML API 사용을 참조하세요.
데이터 세트 정의 - 데이터 세트 정의(객체)
테이블 이름, 필드 및 쿼리로 데이터 세트를 정의할 수 있도록 DatasetDefinition 클래스의 인스턴스를 만듭니다.
테이블과 필드 목록을 전달하여 데이터 세트 정의를 생성합니다. 쿼리를 전달하여 특정 특성을 가진 행을 포함하도록 데이터 세트를 제한할 수도 있습니다.
생성한 후에는 DatasetDefinition 개체를 수정할 수 없습니다.
| 이름 | 유형 | 설명 |
|---|---|---|
| 구성 | 객체 | 데이터 세트 정의 속성을 포함하는 JavaScript 객체입니다. |
| config.tableName | 문자열 | 데이터 세트의 테이블 이름입니다. 예: "tableName" : "Incident". |
| config.fieldNames | 배열 | 옵션입니다. 지정된 테이블의 필드 이름을 문자열로 나열합니다. 예: "fieldNames" : ["short_description", "priority"]. 기본값: 모든 필드 |
| config.fieldDetails | 배열 | 옵션입니다. 필드 속성을 지정하는 JavaScript 객체의 목록입니다. 이 속성을 사용하여 머신 러닝 알고리즘이 필드를 특정 유형으로 해석하도록 강제합니다. 속성에 fieldNames 나열된 모든 필드에 대한 필드 상세 정보를 가져올 필요는 없습니다. 모든 상세 정보는 배열에 fieldNames 나열된 필드와 일치해야 합니다. |
| config.fieldDetails.name | 문자열 | 이 데이터 세트를 제한하는 정보 유형을 정의하는 필드의 이름입니다. 사용할 경우 이 필드 이름은 속성에 나열된 해당 이름과 fieldNames 일치해야 합니다. |
| config.fieldDetails.type | 문자열 | 머신 러닝 필드 유형입니다. 데이터 유형을 지정하면 ML 트레이너가 필드를 해당 유형을 갖는 것으로 해석합니다. 데이터 유형이 지정되지 않으면 시스템에서 유형을 결정합니다. 지원되는 유형:
이러한 유형은 머신 러닝 관점에서 데이터 유형을 식별합니다. ML 유형은 소스 테이블에 나열된 유형과 다를 수 있습니다. 필드는 문자열 형식일 수 있지만 그 목적은 명목 값을 인코딩하는 것일 수 있습니다. 예를 들어 "XL", "L" 또는 "M"과 같은 티셔츠 크기는 테이블의 문자열 유형이지만 각 값은 ML 관점에서 명목 속성의 범주를 나타냅니다. |
| config.encodedQuery | 문자열 | 옵션입니다. 표준 Glide 형식으로 인코딩된 쿼리 문자열입니다. 인코딩된 쿼리 문자열을 참조하세요. 쿼리를 절대 또는 상대로 생성할 수 있습니다. 예를 들어 쿼리는 이전 3개월(상대적) 또는 5월에서 7월까지의 기간(절대 값)에 대한 행을 반환할 수 있습니다. 절대 패턴을 사용하든 상대 패턴을 사용하든 기본 테이블의 행이 변경되면 정의가 식별하는 데이터를 변경할 수 있습니다. |
다음 예제에서는 데이터 세트 정의를 생성하는 방법을 보여줍니다.
var myData = new sn_ml.DatasetDefinition(
{
'tableName' : 'incident',
'fieldNames' : ['category', 'short_description', 'priority', 'assignment_group.name'],
'fieldDetails' : [
{
'name' : 'category',
'type' : 'nominal'
},
{
'name' : 'short_description',
'type' : 'text'
}],
'encodedQuery' : 'sys_created_onONLast%202%20quarters@javascript:gs.beginningOfLast2Quarters()@javascript:gs.endOfLast2Quarters()^state=3'
});
데이터 세트 정의 - getEligibleFields(문자열 역량)
지정된 역량의 솔루션(예: 분류 솔루션)과 관련하여 입력 필드(기능) 또는 예측 필드로 적격한 필드 목록을 반환합니다. 자격은 적절한 Glide 데이터 유형이 있는 필드에 따라 결정됩니다.
| 이름 | 유형 | 설명 |
|---|---|---|
| 역량 | 문자열 | 교육에 적합한 필드를 검색할 역량입니다. 이 메서드는 현재 분류 솔루션만 지원하며, 역량에 대한 다른 값은 "지원되지 않는 역량" 예외를 발생시킵니다. 유효한 값: |
| 유형 | 설명 |
|---|---|
| 객체 | 적격 입력 필드 이름과 적격 출력 필드 이름을 포함하는 객체입니다. |
| <Object>.eligibleInputFieldNames | 교육에 적합한 입력 필드를 나타내는 문자열 목록입니다. 데이터 유형: 배열 |
| <Object>.eligibleOutputFieldNames | 교육에 적합한 출력 필드를 나타내는 문자열 목록입니다. 데이터 유형: 배열 |
다음 예는 분류 솔루션에 적합한 필드를 표시하는 방법을 보여줍니다.
var myIncidentData = new sn_ml.DatasetDefinition({
'tableName' : 'incident',
'encodedQuery' : 'activeANYTHING'
});
var eligibleFields = JSON.parse(myIncidentData.getEligibleFields('classification'));
gs.print(JSON.stringify(eligibleFields, null, 2));
출력:
{
"eligibleInputFieldNames": [
"resolved_by",
"short_description",
"description",
"notify"
],
"eligibleOutputFieldNames": [
"parent",
"caused_by",
"location",
"category"
]
}