fit_predict¶
Fit_predict 명령어 문법 및 연동규격 설명입니다.
개요¶
이 명령어는 해당 데이터를 선택한 알고리즘으로 기계학습 모델에 TEST set을 넣은 값을 출력합니다.
설명¶
데이터를 학습하고 싶은 알고리즘(ex:classfication,regeression,clustering,ranking,…)을 선택하여 해당 알고리즘에 맞게 기계학습한 모델을 만들고 저장 여부를 선택합니다. 이 때, 해당 알고리즘 각각의 하이퍼파라미터를 조정하여 사용자가 원하는 모델의 결과 값을 확인할 수 있습니다.
Examples¶
- 검색대상이되는 데이터가 다음과 같이 존재합니다.
UPDATE_TIME | SYS_OUT | OUT_TYPE | LAT | LON |
---|---|---|---|---|
2018-03-08 1:00 | a | 37.5 | 127.5 | 107 |
2018-03-08 1:00 | b | 37 | 126.5 | 145 |
2018-03-08 1:00 | c | 38.5 | 126 | 797 |
2018-03-08 1:00 | a | 38 | 128 | 456 |
2018-03-08 1:00 | d | 36.5 | 127 | 41 |
2018-03-08 1:00 | c | 37 | 126 | 179 |
Fit_predict으로 logicsticregression을 적용해 TEST set을 출력하는 명령어 예제입니다.
... | fit_predcit logisr FEATURES LAT,LON LABEL SYS_OUT maxIter=100 regParem=0.01 (INTO modelA)
명령어 이후 예측 값 출력
SYS_OUT | LAT | LON | (PROBABILTY) | PREDICTION |
---|---|---|---|---|
a | 127.5 | 107 | 0.77231 | a |
b | 126.5 | 145 | 0.67525 | b |
c | 126 | 797 | 0.22345 | c |
a | 128 | 456 | 0.22456 | b |
a | 126 | 179 | 0.23098 | b |
c | 127 | 41 | 0.45671 | b |
Parameters¶
fit_predictCommand : alg option
이름 | 설명 | 필수/옵션 |
---|---|---|
alg | *학습 알고리즘입니다. 예 : LogisticRegression |
필수 |
option | 해당 알고리즘의 내부 파라미터 및 모델 저장 이름입니다. 예 : FEATURES fieldA, fieldB, LABEL target maxIter=100 regParam=0.1 fitIntercept=True INTO modelA |
필수 |
*학습 알고리즘
알고리즘 | 지정파라미터 | 필수요소 |
---|---|---|
LogisticRegression | Label, Features, regParam, maxIter, name | Label, Features, name |
SVM | Label, Features, regType, maxIter, name | Label, Features, name |
Decisontree | (Label), Features, maxDepth, name | (Label), Features, name |
RandomForest | (Label), Features, numTree, name | (Label), Features, name |
LinearRegression | Label, Features, regParam, name | Label, Features, name |
Kmeans | Features, numk,name | Features,numk,name |
FPGrowh | Features, minSupport, minConfidance, name | Features, name |
Parameters BNF¶
fit_command : alg options
alg : WORD
options : any
| options any
any : WORD
| NUMBER
| DOUBLE
| EQUALS
| COMMA
| SPACE
| DOT
| TIMES
| MINUS
| LBRACKET
| RBRACKET
WORD = r'\w+'
COMMA = r','
TIMES = r'\*'
MINUS = r'-'
EQUALS = r'\='
SPACE = r'\ '
DOT = r'\.'
LBRACKET = r'\['
RBRACKET = r'\]'
NUMBER = \d+
DOUBLE = [-+]?[0-9]+(\.([0-9]+)?([eE][-+]?[0-9]+)?|[eE][-+]?[0-9]+)