img2tsv
개요
이미지 파일을 읽어서 TSV 포멧으로 변환 저장하는 명령어
타입
설명
객체 저장소에 저장되어 있는 이미지 파일 또는 폴더를 읽어서 TSV 포멧으로 변환 저장하는 명령어입니다. 이미지를 Spark 에서 지원하는 spark.read.format(“image”) API 를 사용하여 원시 이미지 표현으로 로드 후, float형의 벡터로 반환합니다. 단순히 벡터만 반환할 수도 있고 레이블 컬럼을 추가할수도 있습니다.
Parameters
img2tsv src=OBJECTSTORAGE.{CONNECTOR_NAME}:{KEY} dst={KEY} column_name=feature label=(label, 3) tag=three
이름 |
설명 |
기본값 |
예시값 |
타입 |
필수 |
---|---|---|---|---|---|
src |
이미지 파일 or 디렉토리 경로 |
OBJECTSTORAGE.MIN_AI:mnist/0 |
문자열 |
O |
|
dst |
저장할 TSV 파일 경로 |
mnist/tsv/0.tsv |
문자열 |
O |
|
column_name |
이미지 벡터를 저장할 컬럼명 |
feature |
feature |
문자열 |
|
label |
레이블 컬럼 이름, 타입, 값 |
(label, [1,0,0,0,0,0,0,0,0,0]) |
튜플 |
||
scale |
이미지 벡터를 나눌 값 |
255.0 |
255.0 |
플롯형 |
|
tag |
레이블이 의미하는 태그 값 |
zero |
문자열 |
CONNECTOR_NAME
: Conncetor Name입니다. IRIS UI에서 연결정보 생성 후, 연결정보의 이름
컬럼에서 확인할 수 있는 값입니다.
KEY
: OBJECTSTORAGE의 key입니다. bucket은 생략해야 합니다.
Examples
객체 저장소의 특정 이미지를 TSV로 변환하여 저장합니다.
img2tsv src=OBJECTSTORAGE.MIN_AI:USERS/pjh0347/mnist/0/35923.png dst=USERS/pjh0347/mnist/tsv/0.tsv column_name=feature label=(label, [1,0,0,0,0,0,0,0,0,0]) tag=zero
(label, [1,0,0,0,0,0,0,0,0,0]) : 라벨이 저장되는 컬럼 및 데이터입니다. 이 예제는 one-hot 벡터를 표현합니다.
출력 결과 - 변환한 이미지의 개수가 출력됩니다.
total |
---|
1 |
객체 저장소의 이미지 디렉토리를 읽어 TSV로 변환하여 저장합니다.
img2tsv src=OBJECTSTORAGE.MIN_AI:USERS/pjh0347/mnist/0 dst=USERS/pjh0347/mnist/tsv/0.tsv column_name=feature label=(label, [1,0,0,0,0,0,0,0,0,0]) tag=zero
출력 결과
total |
---|
6796 |
tsv 데이터 예시
label |
tag |
feature |
---|---|---|
0,1,0,0,0,0,0,0,0,0 |
one |
0.0,0.0,…,0.14901960784313725,0.8941176470588236,0.11372549019607843,…,0.0,0.0,0.0,0.0,0.0,0.0 |
… |
… |
… |
Parameters BNF
img2tsv_command : SRC EQ WORD DST EQ WORD options
options : option
| options option
|
option : WORD EQ WORD
| WORD EQ WORD_WITH_BRACKET
WORD : r'[^ |^\|^\'|\"|^\=]+'
WORD_WITH_BRACKET : r'\([^\|^\'|\"|^\=]+\)'
EQ : r'\='
SRC : r'(?i)src'
DST : r'(?i)dst'