본문 바로가기
SQL 문제 풀기/1. 프로그래머스 SQL : 2023.12.17~2024.2.29

<프로그래머스 48> 카테고리 별 도서 판매량 집계하기(Lv.3)

by HYEHYE_SON 2024. 2. 2.
728x90

 

프로그래머스에서 제공하는 SQL문제 매일 풀기 챌린지


 

문제 설명

다음은 어느 한 서점에서 판매중인 도서들의 도서 정보(BOOK), 판매 정보(BOOK_SALES) 테이블입니다.
BOOK 테이블은 각 도서의 정보를 담은 테이블로 아래와 같은 구조로 되어있습니다.

 

Column name Type Nullable Description
BOOK_ID INTEGER FALSE 도서 ID
CATEGORY VARCHAR(N) FALSE 카테고리 (경제, 인문, 소설, 생활, 기술)
AUTHOR_ID INTEGER FALSE 저자 ID
PRICE INTEGER FALSE 판매가 (원)
PUBLISHED_DATE DATE FALSE 출판일

 

BOOK_SALES 테이블은 각 도서의 날짜 별 판매량 정보를 담은 테이블로 아래와 같은 구조로 되어있습니다.

 

Column name Type Nullable Description
BOOK_ID INTEGER FALSE 도서 ID
SALES_DATE DATE FALSE 판매일
SALES INTEGER FALSE 판매량

문제

2022년 1월의 카테고리 별 도서 판매량을 합산하고, 카테고리(CATEGORY), 총 판매량(TOTAL_SALES) 리스트를 출력하는 SQL문을 작성해주세요.
결과는 카테고리명을 기준으로 오름차순 정렬해주세요

예시

예를 들어 BOOK 테이블과 BOOK_SALES 테이블이 다음과 같다면

 

BOOK_ID CATEGORY AUTHOR_ID PRICE PUBLISHED_DATE
1 인문 1 10000 2020-01-01
2 경제 1 9000 2021-02-05
3 경제 2 9000 2021-03-11

 

BOOK_ID SALES_DATE SALES
1 2022-01-01 2
2 2022-01-02 3
1 2022-01-05 1
2 2022-01-20 5
2 2022-01-21 6
3 2022-01-22 2
2 2022-02-11 3

 

2022년 1월의 도서 별 총 판매량은 도서 ID 가 1 인 도서가 총 3권, 도서 ID 가 2 인 도서가 총 14권 이고, 도서 ID 가 3 인 도서가 총 2권 입니다.

 

카테고리 별로 판매량을 집계한 결과는 다음과 같습니다.

CATEGORY TOTAL_SALES
인문 3
경제 16

 

카테고리명을 오름차순으로 정렬하면 다음과 같이 나와야 합니다.

CATEGORY TOTAL_SALES
경제 16
인문 3

오라클 정답 1 : BETWEEN .. AND 와 TO_DATE() 사용

select b.category, sum(s.sales) total_sales
    from book b, book_sales s
    where b.book_id = s.book_id
    and s.sales_date between to_date('20220101','rrrrmmdd') and to_date('20220131','rrrrmmdd')
    group by b.category
    order by b.category asc;

 

오라클 정답 2 : TO_CHAR() 사용

select b.category, sum(s.sales) total_sales
    from book b, book_sales s
    where b.book_id = s.book_id
    and to_char(s.sales_date, 'rrrrmm') = '202201'
    group by b.category
    order by b.category asc;


오라클 해설

EQUI JOIN 사용

두 테이블에 동일한 컬럼(BOOK_ID)이 존재하기 때문에

EQUI JOIN을 사용해서 JOIN을 할 수 있다.


# 1. SELECT절

출력해줘야 하는 컬럼명을 나열해주는데,

각 컬럼명 앞에 해당 컬럼명이 속하는 테이블 명과 온점(.)으로 연결해준다.

(두 테이블 간 동일 컬럼명을 사용하는게 아니라면 작성해주지 않아도 된다)

 

이때 total_sales는 카테고리 별 도서 판매량을 합산하여 구하는 것이기 때문에

BOOK_SALES 테이블에 있는 판매량 컬럼인 SALES를 SUM으로 합산해서 구해준다.

 

 

# 2. FROM절

조인할 두 테이블을 작성해주는데, 

컬럼명 앞에 넣어주기 편하게 별칭을 설정해준다.

 

 

# 3. WHERE절

 

--연결조건

두 테이블의 동일한 컬럼(BOOK_ID)을 EQUI 조인 연결 조건으로 사용해준다.

 

--일반조건

SALES_DATE가 2022년 1월인 데이터에 대해서만 출력해야한다.

이때 조건을 작성하는 방법이 2가지가 존재하는데, 

 

1번 : BETWEEN .. AND

1번은 BETWEEN .. AND 조건을 사용하여,

2022년 1월 1일 ~ 2022년 1월 31일의 데이터만 추출한다.

날짜를 조건으로 넣을 때

문자형 데이터를 TO_DATE()함수를 사용하여 날짜 데이터를 추출한다.

 

여기서 주의할 것은 DATE TYPE의 기본 구조는

년월일 시간:분:초 인데, 시간:분:초가 00:00:00으로 되어있다는 것이다.

따라서 2022년 1월 31일 00:00:00초까지의 값만 조건으로 걸러지는 것이기 때문에

+ 1을 해주어야 한다. 

왜냐하면 2022년 1월 31일 12:30:31초에 판매된 데이터도 포함되게 해야 하기 때문이다.

 

하지만, 제공된 데이터에 따르면, 아래와 같이 SALES_DATE의 모든 날짜가 

00:00:00 시간인 것만 존재하기 때문에 다른 1월 31일의 값은 신경 쓸 필요가 없다.

오히려 +1을 해주면, 2022년 2월 1일 00:00:00의 데이터도 

조건에 충족되기 때문에 +1을 해주면 오히려 틀린 정답이 된다.

 

2번 : TO_CHAR 함수 사용

2번은 TO_CHAR함수를 사용하여 SALES_DATE 컬럼의 형식을 가공한 후

년과 월이 202201에 해당하는 값만 추출하는 방법이다.

 

 ▶   TO_CHAR([컬럼명], '변경할 데이터 형태')
   위의 함수를 사용해서 날짜형 데이터 형식을 → 문자형 데이터 형식으로 변환한다.

   * 표시한 형태 해석(오라클의 경우 대소문자 구분 없음)
   - RRRR/YYYY : Year 연도 4자리로 표기(ex. 2023, 2024)
   - MM : Month 월 2자리로 표기 (ex. 05, 07)
   - DD : Day 일 2자리로 표기 (ex. 01, 31)

 

# 4. GROUP BY절

카테고리 별 판매량을 구하는 것이므로 

BOOK 테이블의 카테고리 컬럼을 GROUP으로 묶어줘야한다.


MySQL  정답 1 : BETWEEN .. AND 와 STR_TO_DATE() 함수 사용

select b.category, sum(s.sales) total_sales
    from book b, book_sales s
    where b.book_id = s.book_id
    and s.sales_date between str_to_date('20220101','%Y%m%d') and str_to_date('20220131','%Y%m%d')
    group by b.category
    order by b.category asc;

 

MySQL 정답 2 : DATE_FROMAT() 함수 사용

select b.category, sum(s.sales) total_sales
    from book b, book_sales s
    where b.book_id = s.book_id
    and date_format (s.sales_date,'%Y%m%d') = '202201'
    group by b.category
    order by b.category asc;

 


MySQL 해설

EQUI JOIN 사용

두 테이블에 동일한 컬럼(BOOK_ID)이 존재하기 때문에

EQUI JOIN을 사용해서 JOIN을 할 수 있다.


# 1. SELECT절

출력해줘야 하는 컬럼명을 나열해주는데,

각 컬럼명 앞에 해당 컬럼명이 속하는 테이블 명과 온점(.)으로 연결해준다.

(두 테이블 간 동일 컬럼명을 사용하는게 아니라면 작성해주지 않아도 된다)

 

이때 total_sales는 카테고리 별 도서 판매량을 합산하여 구하는 것이기 때문에

BOOK_SALES 테이블에 있는 판매량 컬럼인 SALES를 SUM으로 합산해서 구해준다.

 

 

# 2. FROM절

조인할 두 테이블을 작성해주는데, 

컬럼명 앞에 넣어주기 편하게 별칭을 설정해준다.

 

 

# 3. WHERE절

 

--연결조건

두 테이블의 동일한 컬럼(BOOK_ID)을 EQUI 조인 연결 조건으로 사용해준다.

 

--일반조건

SALES_DATE가 2022년 1월인 데이터에 대해서만 출력해야한다.

이때 조건을 작성하는 방법이 2가지가 존재하는데, 

 

1번 : BETWEEN .. AND

1번은 BETWEEN .. AND 조건을 사용하여,

2022년 1월 1일 ~ 2022년 1월 31일의 데이터만 추출한다.

이때 날짜 조건을 주기 위해서 STR_TO_DATE()를 이용하여

문자형 데이터를 날짜형 데이터로 바꿔줘야 한다.

 

STR_TO_DATE( [컬럼명],[사용할 형식] )
DATA TYPE을 날짜나 시간으로 변경하고자 할 때 사용하는 함수이다.

 

여기서 주의할 점은 DATE TYPE의 기본 구조는

년월일 시간:분:초 인데, 시간:분:초가 00:00:00으로 되어있다.

따라서 2022년 1월 31일 00:00:00초까지의 값만 조건으로 걸러지는 것이기 때문에

+ 1을 해주어야 한다. 

왜냐하면 2022년 1월 31일 12:30:31초에 판매된 데이터도 포함되게 해야 하기 때문이다.

 

하지만, 제공된 데이터에 따르면, 아래와 같이 SALES_DATE의 모든 날짜가 

00:00:00 시간인 것만 존재하기 때문에 다른 1월 31일의 값은 신경 쓸 필요가 없다.

오히려 +1을 해주면, 2022년 2월 1일 00:00:00의 데이터도 

조건에 충족되기 때문에 +1을 해주면 오히려 틀린 정답이 된다.

 

2번 : DATE_FROMAT 함수 사용

2번은 DATE_FORMAT 함수를 사용하여 SALES_DATE 컬럼의 형식을 가공한 후

년과 월이 202201에 해당하는 값만 추출하는 방법이다.

 

    DATE_FORMATE([컬럼명], '변경할 데이터 형태' ) 함수

   * 표시한 형태 해석(대소문자 구분 있음)
   - %Y : Year 연도를 4자리로 표기 (ex. 2023, 2024)
   - %m : Month 월을 2자리로 표기(ex. 05, 12)
   - %d : Day 일을 두 자리로 표기(ex. 04, 28)

* 참고
   - %c :Month 월을 한 자리로 표기(ex. 5, 12) 
   - %e :Day 일을 한자리로 표기(ex. 4, 28)

 

# 4. GROUP BY절

카테고리 별 판매량을 구하는 것이므로 

BOOK 테이블의 카테고리 컬럼을 GROUP으로 묶어줘야한다.

 


 

 

 

 

 

 

출처 : 프로그래머스 코딩 테스트 연습, https://school.programmers.co.kr/learn/challenges

반응형