Note
DSL 에서 사용되는 규칙
컬럼명
한 단어로 이루어진 문자열인 경우
그대로 사용
예) host, level, 시간, 문장
여러 단어 or 특수문자 or 숫자 등이 포함되어 복잡한 경우
백쿼터(back-quote : `) 를 사용하여 표현
예) `test column`, `%2컬럼명 abc`
문자열
문자열 표현은 따옴표(single-quote : ‘) 를 사용하여 표현
예) ‘문자열입니다.’
Command References
Command |
Description |
Category |
---|---|---|
integer, bigint, real 등 숫자 컬럼의 절댓값을 구하는 명령어 입니다. |
||
테이블의 각종 통계 정보를 구하거나 pivoting 할 수 있습니다. 고급시각화 화면에 사용되는 명령어 모음입니다. |
||
주어진 input 데이터에서 일반적인 범위를 벗어난 비정상적인 값을 찾아내는 기능입니다. |
||
bimatrix에 쓰기를 하는 명령어 입니다. |
||
행 or 열 간의 간단한 수식 계산을 합니다. |
||
조건 처리가 가능한 명령어 입니다. |
||
쿼리의 결과를 일정시간동안 저장해 놓을수 있는 명령어 |
||
선택한 컬럼을 concatenation 하는 명령어 입니다. |
||
input 으로 받은 컬럼들 간의 상관계수를 구하는 명령어입니다. |
||
입력의 래코드 건수를 계산합니다. |
||
curl 을 통해 가져온 데이터를 DataFrame 으로 만들어 spark 을 통해 처리 가능하도록 합니다. |
||
선택한 컬럼에 대한 중복값 없는 데이터를 반환합니다. |
||
학습된 모델을 이용해 예측 결과를 반환하는 명령어 입니다. |
||
선택한 컬럼의 데이터를 구분자를 이용해 분리하고, 새로운 레코드로 만듭니다. (원래 데이터는 삭제) |
||
검색 결과가 출력 될 field를 설정합니다. |
||
이 명령어는 특정한 필드의 결측치 처리에 사용합니다. |
||
이 명령어는 해당 데이터를 선택한 알고리즘으로 기계학습 모델을 만들어줍니다. |
||
이 명령어는 해당 데이터를 선택한 알고리즘으로 기계학습 모델에 TEST set을 넣은 값을 출력합니다. |
||
주어진 데이터의 미래 시점 데이터를 예측합니다. |
||
주소, 우편번호, 위경도 등의 데이터 컬럼에 해당하는 geometry 데이터를 찾아주는 명령어 입니다. |
||
gemotery / geojson 형태를 서로 바꿔주는 명령어 입니다. |
||
공간 데이터의 경도/위도 <-> 위도/경도 의 순서를 변환 하는 명령어 입니다. |
||
이 명령어는 ip가 포함된 필드를 기반으로 위, 경도 등의 추가정보를 제공합니다. |
||
이 명령어는 업로드 되어있는 컬렉션을 기반으로 사용자가 요청하는 테이블에 지역 경계(geometry) 정보를 제공합니다. |
||
|
||
geometry 타입의 데이터를 필터 조건을 이용해 필터링 하는 명령어 입니다. |
||
이 명령어는 위, 경도 데이터를 포함한 두 개의 필드를 기반으로 그룹(지정 지역 클러스터)별 통계정보를 제공합니다. |
||
HDFS에 읽기 및 쓰기를 하는 명령어 입니다. |
||
상위 records를 원하는 갯수 만큼 검색 결과에 출력 합니다. |
||
이미지 파일을 읽어서 TSV 포멧으로 변환 저장하는 명령어 입니다. |
||
설정한 컬럼의 데이터를 기반으로 indexing하는 명령어 입니다. 컬럼의 데이터가 다를 경우 같은 값이라도 index 결과가 다를 수 있습니다. |
||
시계열 데이터를 이용하여 집계를 할 때, 설정한 간격 사이의 시계열 데이터가 없으면 해당 데이터를 추가(보간) 해주는 명령어 입니다. |
||
IRIS에 읽기를 하는 명령어 입니다. |
||
현재 동작하고 있는 DSL 작업들을 관리 할 수 있습니다. |
||
이 명령어는 다른 데이터 모델과 join을 할 때 사용됩니다. |
||
kmeans를 진행하는 명령어 입니다. |
||
현재 행 이전의 행의 값을 가져오는 명령어입니다. |
||
현재 행의 다음 행의 값을 가져오는 명령어입니다. |
||
string length를 계산 하는 명령어입니다. |
||
이 명령어는 다른 데이터 모델과 join을 할 때 사용됩니다. |
||
metatron에 쓰기를 하는 명령어 입니다. |
||
DSL 에 작성한 데이터를 이용하여 DataFrame 을 만드는 명령어 |
||
Data-Discovery-Service ML 관련 명령어 이며, ML 명령어 중 fit 명령어를 통해 생성되는 모델 및 메타데이터를 관리하는 명령어 입니다. |
||
모델에 해당하는 데이터 소스의 데이터를 로드합니다. |
||
지정된 필드에 대한 distinct count 값을 제공합니다. |
||
지정된 필드에 존재하는 값들의 상위 빈도 10개 값을 제공합니다. |
||
지정된 데이터 모델의 Timeline을 생성합니다. |
||
이 명령어는 Data-Discovery-Service ML 관련 명령어 이며, 사용자가 입력한 한 데이터를 데이터 프레임으로 반환 합니다. |
||
objectstorage 읽기 및 쓰기를 하는 명령어 입니다. |
||
여러 그룹을 대상으로 outlier 에 해당하는 그룹을 찾는 명령어 입니다. |
||
테이블을 여러 컬럼들을 축으로 회전 및 각종 통계 정보를 행과 열 별로 구할 수 있습니다. |
||
입력된 컬럼의 문장들을 단어로 쪼개고, 품사를 표기하는 명령어 입니다. |
||
이 명령어는 Data-Discovery-Service ML 관련 명령어 이며, 사전에 학습되어 있는 ML 모델을 불러와 넘겨받은 데이터에 적용하는 명령어 입니다. |
||
해당 명령어는 Python의 lambda 함수를 실행 합니다. |
||
regex 명령을 사용하여 지정된 정규식과 일치하지 않는 결과를 제거합니다. |
||
이 명령어는 특정한 field를 다른 명칭으로 이름을 바꾸고자 할 때 사용됩니다. |
||
선택한 컬럼의 데이터의 글자를 변환하는 명령어 입니다. |
||
대치어(replace)사전을 통해 단어를 대치합니다. |
||
이 명령어는 지정된 실수형 필드의 소수점을 반올림 하는 명령어 입니다. |
||
이 명령어는 Data-Discovery-Service ML 관련 명령어 이며, 사용자가 입력한 수 만큼의 데이터를 반환합니다. |
||
scaling을 진행하는 명령어 입니다. |
||
이 명령어는 전문 검색(full-text search)을 하는데 사용 됩니다. |
||
Tensorflow Serving을 통해 예측, 모델의 서빙 상태를 확인하는 명령어입니다. |
||
이 명령어는 검색 결과를 지정된 필드를 기준으로 정렬합니다. |
||
json/xml 과 같은 구조화된 데이터의 key 를 이용해서 해당하는 데이터를 추출하는 명령어입니다. |
||
선택한 컬럼을 구분자를 통해서 분리하여 새로운 레코드로 만드는 명령어 |
||
레코드형 파일(들)을 train/test 로 분리 저장하는 명령어 입니다. |
||
SQL 형태의 질의를 합니다. |
||
각종 통계 데이터를 구하는 명령어 입니다. |
||
이 명령어는 특정한 필드나 문자열을 SUBSTRING 하고자 할 때 사용됩니다. |
||
DF 의 각 컬럼에 대한 집계 정보를 보여주는 명령어 입니다. |
||
|
||
선택한 컬럼 끼리 혹은 원하는 데이터와 컬럼 간의 시간 차이를 구해주는 명령어 입니다. |
||
시간 범위에 따라 group by된 카운트의 숫자를 출력 합니다. |
||
지정한 필드에 대해 tokenizer를 진행하는 명령어 입니다. |
||
이 명령어는 검색 결과를 지정된 필드를 기준으로 정렬 후 상위 값을 출력합니다. |
||
선택한 컬럼의 데이터 타입을 원하는 타입으로 변환시켜 반환합니다. |
||
이 명령어는 다른 데이터 모델과 union 을 할 때 사용됩니다. |
||
가로로 출력되는 열(COLUMN) 데이터를 세로로 돌려 행(ROW)으로 출력할 수 있습니다. |
||
특정 필드에 대한 고유값과 해당 값의 count를 리턴합니다. |
||
정수를 이용해 해당 주차의 시작일과 종료일을 찾는 명령어입니다. |
||
이 명령어는 주말/주중 데이터를 필터링하는데 사용합니다. |
||
데이터의 날짜가 1년의 몇 번째 주인지 계산하는 명령어입니다. |
||
데이터를 일정 조건에 따라 filter 합니다. |
||
이 명령어는 검색 결과로 생성된 필드의 순서를 지정된 기준으로 정렬합니다. |
- abs
- adv
- anomalies
- bimatrix
- calculate
- case
- checkpoint
- concat
- corr
- count
- curl
- distinct
- eval
- explode
- fields
- fillna
- fit
- fit_predict
- forecasts
- geocode
- geoconverter
- geoflip
- geoip
- geomap
- geometric
- georelation
- geostats
- hdfs
- head
- img2tsv
- indexer
- interpolation
- iris
- job
- join
- kmeans
- lag
- lead
- length
- merge
- metatron
- mkdata
- RandomForest Classification
- RandomForest Regression
- Spark DecisionTree Classification
- Spark DecisionTree Regression
- Spark FP-Growth
- Spark Kmeans
- generalizedLinearRegression
- linearRegression
- logisticRegression(LBFGS)
- mlmodel
- model
- model-stats
- model-statsdetails
- model-timeline
- modeldata
- numbering
- objectstorage
- outlier
- pivot
- postagger
- predict
- pylambda
- regex
- rename
- replace
- replacewords
- round
- sampling
- scaler
- search
- serving
- sort
- spath
- split
- splitter
- sql
- stats
- substr
- summary
- time2sec
- timediff
- timeline
- tokenizer
- top
- typecast
- union
- unpivot
- value_counts
- weekdates
- weekend
- weeknumber
- where
- ysort