상자그림 (Box Plot)

상자그림(box plot)는 양적 데이터의 최소값, 최대값, 중간값, 25% 에 해당하는 1사분위수, 75%에 해당하는 3사분위수를 동시에 표시할 수 있는 챠트입니다.

데이터 모델

  • 데이터 모델 : EDU_DATA_iris

  • 붓꽃(iris) 의 3개 종(Species) 별로
    • 꽃받침길이(Sepal_Length), 꽃받침넓이(Sepal_Width), 꽃잎길이(Petal_Length), 꽃잎넓이(Petal_Width)

Sepal_Length

Sepal_Width

Petal_Length

Petal_Width

Species

5.1

3.5

1.4

0.2

setosa

5.9

3

5.1

1.8

virginica

상자그림 (Box Plot)

예제의 붓꽃 데이터의 꼿받침 길이, 넓이와 같이 측정하여 얻을 수 있는 수치형 데이터(관측값 데이터)를 양적 데이터라고 합니다.
상자그림(box plot)는 양적 데이터의 최소값, 최대값, 중간값, 25% 에 해당하는 1사분위수, 75%에 해당하는 3사분위수를 동시에 표시할 수 있는 챠트입니다.
  • 검색어
    • 종(Species)별로 꽃받침 길이(Sepal_Length)의 사분위수를 구합니다.

* | stats  quantile(Sepal_Length, 25) as Sepal_L by Species
  • 검색어 결과

Species

Sepal_L_Q0

Sepal_L_Q25

Sepal_L_Q50

Sepal_L_Q75

Sepal_L_Q100

versicolor

4.9

5.6

5.9

6.3

7.0

setosa

4.3

4.8

5.0

5.2

5.8

virginica

4.9

6.2

6.5

6.9

7.9

  • 상자그림

boxplot01