IRIS Discovery ====================== | IRIS Discovery는 다양한 종류의 데이터 소스를 사용자가 단일 명령 인터페이스인 DSL(Domain Specifics Language) 명령을 통해 데이터를 검색 및 분석 할 수 있도록 지원하는 분석 미들웨어 서비스입니다. | 각 명령어는 파이프라인을 이용한 입출력 데이터 연결을 지원하며, 명령의 조합을 통한 다양한 분석으로 확장이 용이합니다. | IRIS Discovery의 각각의 메뉴는 Analyzer, Studio 에서 분석에 활용할 데이터를 파일로 찾거나 저장하고, 데이터 모델로 생성하고 관리할 수 있는 메뉴, 외부 데이터 소스를 선택하고 연결 및 관리할 수 있는 연결정보 메뉴로 구성되어 있습니다. | | 우측 상단의 메인 메뉴의 ‘Discovery’ 버튼을 눌러 접속하실 수 있습니다. .. image:: IRIS-02.png :width: 1000 :alt: IRIS-02 ------------------------------------------------------------------ 파일 브라우저 --------------- | IRIS Discovery의 파일 브라우저는 Anayzer, Studio 에서 사용할 여러 가지 파일들을 관리하는 메뉴입니다. | 파일을 저장하는 영역에 따라 HDFS(하둡 분산 파일 시스템; Hadoop Distributed File System), MINIO(오브젝트 스토리지, Minimal Object Storage) 등이 있습니다. | 계정별로 파일을 저장할 수 있는 공간을 제공합니다. .. image:: IRIS-02-1-1.png :width: 1000 :alt: IRIS-02-1-1 +------+-----------------------+------------------------------------------------------------------------------------------------------------------------+ | 번호 | 구분 | 설명 | +======+=======================+========================================================================================================================+ | 1 | 파일 브라우저 | 파일 브라우저의 폴더 유형을 선택할 수 있습니다. 제공하고 있는 파일 브라우저의 유형은 HDFS, MINIO 등이 있습니다. | +------+-----------------------+------------------------------------------------------------------------------------------------------------------------+ | 2 | 폴더 명 | 폴더명을 검색할 수 있습니다. | +------+-----------------------+------------------------------------------------------------------------------------------------------------------------+ | 3 | 폴더 목록 | 폴더 목록이 나타납니다. | +------+-----------------------+------------------------------------------------------------------------------------------------------------------------+ | 4 | 폴더 이동 | 폴더를 누르면 하위 폴더 목록으로 이동할 수 있습니다. | +------+-----------------------+------------------------------------------------------------------------------------------------------------------------+ - **파일 브라우저** - HDFS: 하둡 분산 파일 시스템의 약자로, 대용량 파일을 다룰 수 있도록 설계되어 있는 파일 시스템 입니다. 계정별로 폴더가 제공되며, 파일을 업로드하거나 관리할 수 있습니다. - MINIO: 클라우드 기반 Object Strorage의 하나입니다. 계정별로 bucket이 제공되며 파일을 업로드하거나 관리할 수 있습니다. .. image:: IRIS-02-1-1(2).png :width: 1000 :alt: IRIS-02-1-1(2) +------+--------------------------+-----------------------------------------------------------------------------------------------------------------------------+ | 번호 | 구분 | 설명 | +======+==========================+=============================================================================================================================+ | 1 | 파일 정보 | 이름, 권한, 소유자, 그룹, 파일 크기, 최종 수정 날짜, 상태 등의 파일 정보를 확인할 수 있습니다. | +------+--------------------------+-----------------------------------------------------------------------------------------------------------------------------+ | 2 | 파일 검색 | 파일 명을 검색할 수 있습니다. | +------+--------------------------+-----------------------------------------------------------------------------------------------------------------------------+ | 3 | 부가 기능 | 파일 목록 새로고침, 이름 변경(HDFS 한정), 새폴더, 파일 이동, 삭제, 다운로드 링크 복사, 업로드 및 다운로드를 할 수 있습니다. | +------+--------------------------+-----------------------------------------------------------------------------------------------------------------------------+ 데이터 모델 --------------- | 데이터 모델은 특정한 데이터 셋을 추상화 한 것입니다. 여기서 데이터 셋은 일반적으로 데이터베이스(DB)의 테이블 혹은 CSV 등의 형식의 파일을 말합니다. | 사용자는 연결정보를 통해 원하는 데이터 셋을 조회/접근하여 컬럼을 선택, 타입 변경과 같은 작업을 통해 자신에게 필요한 형태의 데이터 모델을 생성할 수 있으며, 하나의 데이터 셋에서 여러 개의 데이터 모델을 목적에 맞게 생성할 수 있는 장점이 있습니다. | IRIS Analyzer, Studio 에서 제공하는 대부분의 기능들은 데이터 모델을 기반으로 동작하기 때문에 데이터 모델을 생성은 모든 작업의 시작이라고 할 수 있습니다. | | 데이터 모델 메뉴는 IRIS Discovery 의 하위 메뉴이며, 데이터모델 목록을 보여줍니다. .. image:: IRIS-02-2-1.png :width: 1000 :alt: IRIS-02-2-1 +------+------------------------------------------------------------------------+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+ | 번호 | 구분 | 설명 | +======+========================================================================+==================================================================================================================================================================================================================================================================================================+ || 1 || 데이터 모델 조회 || 목록의 개수, 유형별 필터, 모델 명 검색을 할 수 있습니다. | +------+------------------------------------------------------------------------+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+ || 2 || 데이터 모델 목록 || 이름, 설명, 데이터 유형, 대상 데이터, 소유자, 수정일 등을 확인할 수 있으며, 편집(복사, 새 모델 뷰, 삭제) 및 접근 권한 설정(사용자/그룹 권한 부여 및 제거) 등의 설정을 할 수 있습니다. | +------+------------------------------------------------------------------------+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+ || 3 || 데이터 모델 정보 || 목록에서 모델명 좌측에 위치한 ‘▶ 아이콘’을 클릭하여 현재 생성된 데이터 모델의 상세 정보를 확인할 수 있으며, ‘▼ 아이콘’을 통해 데이터 모델의 상세 정보를 닫을 수 있습니다. | || || || 연결정보 상세보기를 통해 선택한 연결정보에 대한 설명, 데이터 유형, 대상 데이터, 컬럼 정보를 확인할 수 있습니다. | +------+------------------------------------------------------------------------+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+ - **데이터 모델 목록** - # : 데이터 모델의 순서가 표시 됩니다. - 이름 : 데이터 모델의 이름이 표시 됩니다. - 설명 : 데이터 모델에 대한 설명이 표시 됩니다. 데이터 모델을 생성할 때 입력한 설명 내용입니다. - 편집 : 해당 데이터 모델의 관리 메뉴입니다. 소유자가 아닐 경우 편집, 삭제 메뉴는 표시되지 않습니다. - 데이터 유형 : 데이터 모델의 데이터 유형이 표시됩니다. 데이터 유형은 MARIADB, HDFS, OBJECTSTORAGE(MinIO) 등이 있으며 데이터모델뷰의 경우 VIEW 로 표시됩니다. - 대상 데이터 : 데이터 모델의 원본 데이터셋에 대한 정보가 표시됩니다. DB 유형인 경우 테이블명이, 파일인 경우 파일 이름이 표시됩니다. - 소유자 : 데이터 모델을 생성한 소유자의 아이디가 표시 됩니다. - 수정일 : 데이터 모델이 마지막으로 수정된 날짜가 표시 됩니다. - 접근 권한: 데이터 모델에 대하여 개별 사용자에 대한 접근 권한을 부여/해제 할 수 있습니다. - **접근 권한 설정** - 사용자/그룹 탭: 사용자 혹은 그룹을 전환하기 위한 탭입니다. - 모든 사용자 체크박스: 모든 사용자에게 공유하고자 할 때 체크하는 설정입니다. - 현재 권한 목록: 현재 접근 권한을 가진 사용자 혹은 ‘사용자 목록’에서 권한을 부여한 사용자 목록입니다. - 사용자 목록: 모든 사용자 목록에 해당하며, ‘추가’ 버튼을 클릭하면 ‘현재 권한 목록’에 추가됩니다. - **편집(관리 메뉴)** - 편집: 데이터 모델의 이름/설명/필드 등을 수정할 수 있는 편집 창을 띄웁니다. - 복사: 해당 데이터 모델과 동일한 데이터 모델을 생성합니다. 메뉴를 선택하면 해당 데이터 모델의 내용을 가지고 새 모델 창을 띄웁니다. - 새 모델 뷰: 해당 데이터 모델을 참조로 하는 데이터 모델 뷰를 생성합니다. 메뉴를 선택하면 해당 데이터 모델의 정보를 가지고 '새 모델 뷰' 창을 띄웁니다. - 삭제: 해당 데이터 모델을 삭제합니다. 데이터 모델을 삭제하면 복구할 수 없으며, Studio 등의 관련된 UI 에서 더이상 사용할 수 없게 됩니다. | .. image:: IRIS-02-2-2.png :width: 1000 :alt: IRIS-02-2-2 | +------+--------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+ | 번호 | 구분 | 설명 | +======+====================+=======================================================================================================================================================================================================================================+ || 1 || 새 모델 || '새 모델’ 버튼을 클릭하면 새 모델 팝업창이 뜨고, 모델 이름/모델에 대한 설명/연결정보/대상 데이터/샘플 데이터/컬럼 설정을 바탕으로 새 데이터 모델을 생성할 수 있습니다. | || || || 연결정보의 연결 가능한 데이터 소스 유형은 다음을 확인합니다. | +------+--------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+ || 2 || 새 모델 뷰 || 기존 데이터 모델을 참조로 하는 새 데이터 모델 뷰(view) 를 생성할 수 있습니다. 참조 모델로 선택한 데이터 모델에 DSL 명령어 구문을 사용하여 변환, 집계, 필터링한 결과를 하나의 데이터 모델처럼 사용할 수 있습니다. | +------+--------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+ - **새 모델** - 모델 이름: (필수) 생성하는 데이터 모델의 이름을 입력합니다. - 설명: (선택) 생성하는 데이터 모델에 대한 설명을 입력합니다. - 연결정보: 데이터 유형과 연결정보를 선택합니다. 데이터 유형을 선택하면, 해당 데이터 유형의 연결정보가 콤보박스 목록에 표시됩니다. - 대상 데이터: 대상 데이터 셋을 지정합니다. 연결정보를 선택하면 해당 연결정보로 접근할 수 있는 데이터 셋이 콤보박스 목록에 표시됩니다. 데이터 유형이 HDFS, OBJECTSTORAGE 등 파일 유형인 경우에는 파일 경로를 입력하거나 선택하는 UI 가 나타나며, 파일 유형(csv, json, ...)에 따라 분리기호 등의 설정을 추가로 할 수 있습니다. - 샘플 데이터: 연결 정보와 대상 데이터를 지정하면 해당 데이터 셋의 샘플 데이터를 가져와 표시합니다. 이를 참고로 하여 컬럼 설정을 할 수 있습니다. - 컬럼 설정: 데이터 셋의 컬럼 중에서 분석 작업에 사용될 컬럼을 선택합니다. - 시간 - 날짜 혹은 시간 기준으로 분석 작업을 수행하고자 할 때, 기준이 되는 시간값을 지정하는 설정입니다. - 선택한 컬럼이 문자열 유형일 경우, "기타" 입력란의 시간 포맷(ex) YYYY-MM-DD HH:mm:ss)과 형식이 일치해야 정상 동작합니다. - 시간 포맷 입력 방법은 http://momentjs.com/docs/#/parsing/string-format/ 을 참고하시기 바랍니다. - 선택하지 않을 경우 시간과 관련된 기능을 사용할 수 없습니다. 단, IRIS-DB 테이블 중에서 LOCAL 테이블은 시간 컬럼을 필수로 선택해야 합니다 - 원시 - 전문 검색 기능(Full Text Search)에 사용될 컬럼을 선택합니다. - 선택됨 - 사용자에 의해 선택된 컬럼의 목록입니다. - 타입 변경이 가능하며 타입을 TIMESTAMP 로 변경 지정한 경우 시간 컬럼과 동일하게 시간 포맷을 입력해야 합니다. - 미선택 - 선택되지 않은 컬럼의 목록 입니다. - 선택되지 않은 컬럼은 분석 작업에서 제외되며 DSL 등의 문법에서 사용할 수 없습니다. - **새 모델 뷰** - 참조 모델 명: 뷰를 생성할 기존 데이터 모델을 선택합니다. - 시간 설정: 참조모델에 시간유형 컬럼이 있어서 뷰로 만들 시간을 지정할 수 있습니다. - 검색어: 참조할 데이터 모델을 대상으로 검색어 구문을 입력합니다. 생성되는 데이터 모델 뷰는 검색어 구문의 실행 결과가 데이터 모델로 설정되어 표시됩니다. - 샘플 데이터: 참조 데이터 모델 대상으로 검색어 구문을 실행한 결과가 10건만 표시됩니다. - 컬럼 설정: 검색어 실행 결과로 새로 생성되는 데이터의 컬럼이 표시되며, 컬럼 선택 여부 및 유형 변경도 가능합니다. - **데이터 모델 조회** - 설명: 데이터 모델을 생성할 때 데이터 모델에 대해 적은 설명이 표시됩니다. - 데이터 유형: IRIS DB 테이블(IRIS),HDFS 파일(HDFS), MINIO 파일(OBJECTSTORAGE), 데이터모델 뷰(VIEW)와 같은 데이터 유형을 선택할 수 있습니다. - 대상 데이터: 데이터 모델이 생성된 테이블, 파일의 이름 또는 경로가 표시됩니다. - 컬럼: 분류/컬럼 명/컬럼 유형/컬럼 별칭/기타 등 데이터 모델 컬럼의 정보가 표시됩니다. | - 연결 가능한 외부 데이터 소스 유형 +------+------------------+---------------------------------------------------+ | 번호 | 데이터 소스 이름 | 관련 URL | +======+==================+===================================================+ | 1 | ORACLE | oracle.com | +------+------------------+---------------------------------------------------+ | 2 | MARIADB | www.mariadb.org | +------+------------------+---------------------------------------------------+ | 3 | MySQL | mysql.com | +------+------------------+---------------------------------------------------+ | 4 | MONGODB | mongodb.com | +------+------------------+---------------------------------------------------+ | 5 | HDFS | hadoop.apache.org | +------+------------------+---------------------------------------------------+ | 6 | HBASE | hbase.apache.org | +------+------------------+---------------------------------------------------+ | 7 | POSTGRESQL | postgresql.org | +------+------------------+---------------------------------------------------+ | 8 | TIBRERO | tmaxdata.com | +------+------------------+---------------------------------------------------+ | 9 | IRIS | mobigen.com/solution/IRIS-Big-data-DB-Cluster.php | +------+------------------+---------------------------------------------------+ | 10 | OBJECTSTORAGE | min.io | +------+------------------+---------------------------------------------------+ | 11 | KTCLOUDSTORAGE | cloud.kt.com | +------+------------------+---------------------------------------------------+ | 12 | ELASTICSEARCH | elastic.com | +------+------------------+---------------------------------------------------+ | 13 | VECTORWISE | actian.com | +------+------------------+---------------------------------------------------+ | 14 | MySQL5 | mysql.com | +------+------------------+---------------------------------------------------+ | 15 | DRUID | druid.apache.org | +------+------------------+---------------------------------------------------+ | 16 | ALTIBASE | altibase.com | +------+------------------+---------------------------------------------------+ | 17 | MSSQL | microsoft.com/en-us/sql-server/sql-server-2022 | +------+------------------+---------------------------------------------------+ | 연결정보 --------------- 연결정보에서는 IRIS에서 사용할 수 있는 외부 데이터 소스를 선택하고 연결 및 관리할 수 있는 기능을 제공합니다. .. image:: IRIS-02-3-1.png :width: 1000 :alt: IRIS-02-3-1 +------+----------------------------------------+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+ | 번호 | 구분 | 설명 | +======+========================================+==============================================================================================================================================================================================================================================================================================================+ || 1 || 연결정보 목록 검색 || 연결정보 목록을 검색할 수 있습니다. | +------+----------------------------------------+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+ || 2 || 연결정보 목록 정보 || 이름, 설명, 유형, Host, Port, 데이터베이스, 사용자, 수정일, 소유자 정보를 확인하고, 연결정보를 편집하거나 접근 권한 설정을 할 수 있습니다. | +------+----------------------------------------+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+ || 3 || 연결정보 상세보기 || 목록에서 모델명 좌측에 위치한 ‘▶’ 아이콘을 클릭하여 현재 생성된 데이터 모델의 상세 정보를 확인할 수 있으며, ‘▼’ 아이콘을 통해 데이터 모델의 상세 정보를 닫을 수 있습니다. | || || || 연결정보 상세보기를 통해 선택한 연결정보에 대한 설명, 데이터 유형, 대상 데이터, 컬럼 정보를 확인할 수 있습니다. | +------+----------------------------------------+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+ || 4 || 새 연결 정보 || ‘+ 새 연결 정보’ 버튼을 클릭하여 연결정보 이름, 설명, 데이터소스 유형 선택, 연결 정보 입력을 통해 연결정보를 새롭게 추가할 수 있습니다. | || || || 데이터 소스 유형에 따라 입력해야 할 정보가 변경되어 나타나며, 입력한 정보로 ‘연결 테스트'를 진행하고 성공하면 연결 정보의 이름 및 설명 등을 저장할 수 있습니다. | +------+----------------------------------------+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+ - **새 연결 정보** - 연결 정보 이름: (필수) 생성하는 연결정보의 이름을 입력합니다. - 설명: (선택) 생성하는 연결정보에 대한 유의 사항이나 용도 등 사용시 도움이 되는 정보를 입력합니다. - 데이터 소스 유형: (필수) 데이터 소스 유형 중 원하는 유형을 선택합니다. - 연결 테스트: 연결이 원활하게 이루어 졌는지 시험해 볼 수 있습니다. - 저장: 저장을 통해 생성한 연결 정보를 저장할 수 있습니다. | - (연결정보) DBMS 관련 항목 +------+----------+--------------------------------------------------------------+ | 번호 | 구분 | 설명 | +======+==========+==============================================================+ | 1 | host | 해당 Database를 접속하기 위한 ip 주소입니다. | +------+----------+--------------------------------------------------------------+ | 2 | port | 해당 Database를 접속하기 위한 port 정보입니다. | +------+----------+--------------------------------------------------------------+ | 3 | database | 접속하려는 DBMS의 Database입니다. | +------+----------+--------------------------------------------------------------+ | 4 | user | 접속하려는 DBMS의 사용자 id입니다. | +------+----------+--------------------------------------------------------------+ | 5 | password | 접속하려는 DBMS의 사용자 비밀번호 입니다. | +------+----------+--------------------------------------------------------------+ | 6 | postgis | gis 관련 확장기능(extension)이 추가되었을 경우에 체크합니다. | +------+----------+--------------------------------------------------------------+ | - (연결정보) HDFS 관련 항목 +------+-----------+-----------------------------------------------------------+ | 번호 | 구분 | 설명 | +======+===========+===========================================================+ | 1 | host | HDFS 마스터 노드의 host 정보입니다. | +------+-----------+-----------------------------------------------------------+ | 2 | rest.port | HDFS의 Web API 포트 정보입니다. 기본값은 50070 입니다. | +------+-----------+-----------------------------------------------------------+ | 3 | port | HDFS 마스터 노드의 port 정보입니다. 기본값은 8082 입니다. | +------+-----------+-----------------------------------------------------------+ | 4 | user | HDFS Web API 요청 시 사용될 HDFS의 사용자 ID입니다. | +------+-----------+-----------------------------------------------------------+ | 5 | group | HDFS Web API 요청 시 사용될 HDFS의 그룹 정보입니다. | +------+-----------+-----------------------------------------------------------+ | 6 | path | HDFS 의 폴더/파일에 접근시 시작 경로입니다. | +------+-----------+-----------------------------------------------------------+ | - (연결정보) OBJECTSTORAGE 관련 항목 +------+------------+----------------------------------------------------------------------------------------------+ | 번호 | 구분 | 설명 | +======+============+==============================================================================================+ | 1 | host | OBJECTSTORAGE에 접속하기 위한 host 정보입니다. | +------+------------+----------------------------------------------------------------------------------------------+ | 2 | port | OBJECTSTORAGE에 접속하기 위한 port 정보입니다. | +------+------------+----------------------------------------------------------------------------------------------+ | 3 | bucket | OBJECTSTORAGE에 접속하려는 bucket 이름입니다. | +------+------------+----------------------------------------------------------------------------------------------+ | 4 | access_key | OBJECTSTORAGE에 접속하기 위한 access_key 입니다. | +------+------------+----------------------------------------------------------------------------------------------+ | 5 | secret_key | OBJECTSTORAGE에 접속하기 위한 secret_key 입니다. | +------+------------+----------------------------------------------------------------------------------------------+ | 6 | region | s3의 경우 스토리지가 속해 있는 영역(region)의 정보이며, MINIO의 경우 디폴트 값을 사용합니다. | +------+------------+----------------------------------------------------------------------------------------------+ | 7 | ssl | https 접속일 경우 체크합니다. | +------+------------+----------------------------------------------------------------------------------------------+ | - (연결정보) KTCLOUDSTORAGE 관련 항목 +------+-----------+---------------------------------------------------------------------------------------+ | 번호 | 구분 | 설명 | +======+===========+=======================================================================================+ | 1 | host | 접속을 위한 host 정보입니다. | +------+-----------+---------------------------------------------------------------------------------------+ | 2 | port | 접속을 위한 port 정보입니다. | +------+-----------+---------------------------------------------------------------------------------------+ | 3 | container | 접속을 위한 container 정보입니다. | +------+-----------+---------------------------------------------------------------------------------------+ | 4 | user | 접속하려는 사용자의 id입니다. | +------+-----------+---------------------------------------------------------------------------------------+ | 5 | password | 접속하려는 사용자의 비밀번호 입니다. | +------+-----------+---------------------------------------------------------------------------------------+ | 6 | account | 접속을 하기 위한 사용자의 account 정보입니다. 사용자 계졍벌로 namespace가 생성됩니다. | +------+-----------+---------------------------------------------------------------------------------------+ | - (연결정보) DRUID 관련 항목 +------+--------+------------------------------+ | 번호 | 구분 | 설명 | +======+========+==============================+ | 1 | host | 접속을 위한 host 정보입니다. | +------+--------+------------------------------+ | 2 | port | 접속을 위한 port 정보입니다. | +------+--------+------------------------------+ | 3 | zkhost | zookeeper host 정보입니다. | +------+--------+------------------------------+ | 4 | zkport | zookeeper port 정보입니다. | +------+--------+------------------------------+