scaler
개요
scaling을 진행하는 명령어 입니다.
타입
설명
input으로 받은 DataFrame과 파라미터로 scaling하려는 field명을 입력받습니다. 선택한 field끼리 벡터화 한 후, scaling을 진행하고 결과 벡터값을 다시 field 단위로 쪼개 하나의 숫자로 변환하여 결과적으로 한 field씩 scaling된 결과값을 출력합니다.
Examples
대상이 되는 데이터가 다음과 같이 존재합니다.
a |
b |
c |
d |
species |
---|---|---|---|---|
5.1 |
3.5 |
4.0 |
0.2 |
Iris-setosa |
6.3 |
3.7 |
4.9 |
0.1 |
Iris-setosa |
7.8 |
2.0 |
3.5 |
0.3 |
Iris-versicolor |
6.1 |
3.1 |
3.8 |
0.2 |
Iris-virginica |
a,b,c,d 필드를 minmax scaling한 예
... | scaler minmax a to minmax_a, b to minmax_b, c to minmax_c, d to minmax_d
명령어 이후 테이블(minmax 적용)
a |
b |
c |
d |
species |
minmax_a |
minmax_b |
minmax_c |
minmax_d |
---|---|---|---|---|---|---|---|---|
5.1 |
3.5 |
4.0 |
0.2 |
Iris-setosa |
0.00 |
0.88 |
0.36 |
0.50 |
6.3 |
3.7 |
4.9 |
0.1 |
Iris-setosa |
0.44 |
1.00 |
1.00 |
0.00 |
7.8 |
2.0 |
3.5 |
0.3 |
Iris-versicolor |
1.00 |
0.00 |
0.00 |
1.00 |
6.1 |
3.1 |
3.8 |
0.2 |
Iris-virginica |
0.37 |
0.65 |
0.21 |
0.50 |
a,b,c,d 필드를 standard scaling한 예
... | scaler standard a to _a, b to _b, c to _c, d to _d
명령어 이후 테이블(standard적용)
a |
b |
c |
d |
species |
_a |
_b |
_c |
_d |
---|---|---|---|---|---|---|---|---|
5.1 |
3.5 |
4.0 |
0.2 |
Iris-setosa |
-1.1 |
0.56 |
-0.08 |
0.0 |
6.3 |
3.7 |
4.9 |
0.1 |
Iris-setosa |
-0.02 |
0.82 |
1.41 |
-1.22 |
7.8 |
2.0 |
3.5 |
0.3 |
Iris-versicolor |
1.32 |
-1.42 |
-0.91 |
1.22 |
6.1 |
3.1 |
3.8 |
0.2 |
Iris-virginica |
-0.2 |
0.03 |
-0.41 |
0.0 |
a,b,c,d 필드를 maxabs scaling한 예
... | scaler maxabs a to _a, b to _b, c to _c, d to _d
명령어 이후 테이블(maxabs적용)
a |
b |
c |
d |
species |
_a |
_b |
_c |
_d |
---|---|---|---|---|---|---|---|---|
5.1 |
3.5 |
4.0 |
0.2 |
Iris-setosa |
0.65 |
0.95 |
0.82 |
0.67 |
6.3 |
3.7 |
4.9 |
0.1 |
Iris-setosa |
0.82 |
1.0 |
1.0 |
0.33 |
7.8 |
2.0 |
3.5 |
0.3 |
Iris-versicolor |
1.0 |
0.54 |
0.71 |
1.0 |
6.1 |
3.1 |
3.8 |
0.2 |
Iris-virginica |
0.78 |
0.84 |
0.78 |
0.67 |
Parameters
SCALER alg fields_as_out
이름 |
설명 |
필수/옵션 |
---|---|---|
alg |
사용할 scaler에 대한 정보입니다. |
필수 |
fields_as_out |
원하는 input 필드명과 output 필드명들입니다. |
필수 |
Parameters BNF
minmaxscaler_command : alg field_as_out
alg : WORD
field_as_out : params
params : param
| params COMMA param
param : field TO field
| field
field : WORD
WORD = \w+
COMMA = ,
TO = to
| TO