scaler¶
개요¶
scaling을 진행하는 명령어 입니다.
설명¶
input으로 받은 DataFrame과 파라미터로 scaling하려는 field명을 입력받습니다. 선택한 field끼리 벡터화 한 후, scaling을 진행하고 결과 벡터값을 다시 field 단위로 쪼개 하나의 숫자로 변환하여 결과적으로 한 field씩 scaling된 결과값을 출력합니다.
Examples¶
대상이 되는 데이터가 다음과 같이 존재합니다.
a | b | c | d | species |
---|---|---|---|---|
5.1 | 3.5 | 4.0 | 0.2 | Iris-setosa |
6.3 | 3.7 | 4.9 | 0.1 | Iris-setosa |
7.8 | 2.0 | 3.5 | 0.3 | Iris-versicolor |
6.1 | 3.1 | 3.8 | 0.2 | Iris-virginica |
a,b,c,d 필드를 minmax scaling한 예
... | scaler minmax a to minmax_a, b to minmax_b, c to minmax_c, d to minmax_d
명령어 이후 테이블(minmax 적용)
a | b | c | d | species | minmax_a | minmax_b | minmax_c | minmax_d |
---|---|---|---|---|---|---|---|---|
5.1 | 3.5 | 4.0 | 0.2 | Iris-setosa | 0.00 | 0.88 | 0.36 | 0.50 |
6.3 | 3.7 | 4.9 | 0.1 | Iris-setosa | 0.44 | 1.00 | 1.00 | 0.00 |
7.8 | 2.0 | 3.5 | 0.3 | Iris-versicolor | 1.00 | 0.00 | 0.00 | 1.00 |
6.1 | 3.1 | 3.8 | 0.2 | Iris-virginica | 0.37 | 0.65 | 0.21 | 0.50 |
a,b,c,d 필드를 standard scaling한 예
... | scaler standard a to _a, b to _b, c to _c, d to _d
명령어 이후 테이블(standard적용)
a | b | c | d | species | _a | _b | _c | _d |
---|---|---|---|---|---|---|---|---|
5.1 | 3.5 | 4.0 | 0.2 | Iris-setosa | 4.57 | 4.61 | 6.63 | 2.44 |
6.3 | 3.7 | 4.9 | 0.1 | Iris-setosa | 5.65 | 4.87 | 8.12 | 1.22 |
7.8 | 2.0 | 3.5 | 0.3 | Iris-versicolor | 6.99 | 2.63 | 5.80 | 3.67 |
6.1 | 3.1 | 3.8 | 0.2 | Iris-virginica | 5.47 | 4.08 | 6.30 | 2.44 |
Parameters¶
SCALER alg fields_as_out
이름 | 설명 | 필수/옵션 |
---|---|---|
alg | 사용할 scaler에 대한 정보입니다. minmax / standard 중 원하는 scaling방법을 입력할 수 있습니다. |
필수 |
fields_as_out | 원하는 input 필드명과 output 필드명들입니다. 예 : input_name1 to ouput_name1, input_name2 to ouput_name2,… |
필수 |
Parameters BNF¶
minmaxscaler_command : alg field_as_out
alg : WORD
field_as_out : params
params : param
| params COMMA param
param : field TO field
| field
field : WORD
WORD = \w+
COMMA = ,
TO = to
| TO