.. role:: raw-html-m2r(raw) :format: html kmeans ==================================================================================================== 개요 ---------------------------------------------------------------------------------------------------- kmeans를 진행하는 명령어 입니다. 타입 ---------------------------------------------------------------------------------------------------- 설명 ---------------------------------------------------------------------------------------------------- input으로 받은 DataFrame과 파라미터로 원하는 필드명, k 에대한 정보를 입력받습니다. 선택한 필드를 k개로 군집화시켜 데이터가 어떤 군집에 속하는지 알려주는 새로운 필드를 생성합니다. Examples ---------------------------------------------------------------------------------------------------- 데이터가 다음과 같이 존재합니다. .. list-table:: :header-rows: 1 * - UPDATE_TIME - in_bytes - Country_abbr - latitude - longitude * - 2.02E+13 - 33216 - KR - 37.5986 - 127.1394 * - 2.02E+13 - 3539 - CN - 35.23972 - 113.2331 * - 2.02E+13 - 687 - KR - 37.27917 - 127.4425 * - 2.02E+13 - 435 - JP - 34.35 - 134.05 * - 2.02E+13 - 810 - KR - 37.56826 - 126.9778 * - 2.02E+13 - 42144 - KR - 37.56826 - 126.9778 * - 2.02E+13 - 19185 - US - 42.03417 - -91.5977 * - ... - ... - ... - ... - ... latitude, longtitued 필드값을 이용해 군집화된 데이터의 label을 예측하는 prediction을 생성해 테이블에 추가하는 예 .. code-block:: none * | kmeans latitude,longitude k=3 명령어 이후 테이블 .. list-table:: :header-rows: 1 * - UPDATE_TIME - in_bytes - Country_abbr - latitude - longitude - prediction * - 2.02E+13 - 33216 - KR - 37.5986 - 127.1394 - 0 * - 2.02E+13 - 3539 - CN - 35.23972 - 113.2331 - 1 * - 2.02E+13 - 687 - KR - 37.27917 - 127.4425 - 1 * - 2.02E+13 - 435 - JP - 34.35 - 134.05 - 2 * - 2.02E+13 - 810 - KR - 37.56826 - 126.9778 - 0 * - 2.02E+13 - 42144 - KR - 37.56826 - 126.9778 - 0 * - 2.02E+13 - 19185 - US - 42.03417 - -91.5977 - 2 * - ... - ... - ... - ... - ... - ... Parameters ---------------------------------------------------------------------------------------------------- .. code-block:: none kmeans_command : fields k_param .. list-table:: :header-rows: 1 * - 이름 - 설명 - 필수/옵션 * - fields - 학습에 사용될 특징 column을 입력 받습니다. - 필수 * - params - 군집의 개수 k에 대한 정보입니다. 입력한 k값을 이용해 군집화된 데이터의 label에 대한 정보를 담은 새로운 output 필드를 생성합니다.\ :raw-html-m2r:`
`\ 예 : k=3 - 필수 Parameters BNF ---------------------------------------------------------------------------------------------------- .. code-block:: none kmeans_command : fields k_param fields : field | fields COMMA field field : WORD k_param : WORD EQUALS NUMBER WORD = \w+ COMMA = , EQUALS = \=