프로그래머스에서 제공하는 SQL문제 매일 풀기 챌린지
문제 설명
다음은 어느 한 서점에서 판매중인 도서들의 도서 정보(BOOK), 판매 정보(BOOK_SALES) 테이블입니다.
BOOK 테이블은 각 도서의 정보를 담은 테이블로 아래와 같은 구조로 되어있습니다.
Column name | Type | Nullable | Description |
BOOK_ID | INTEGER | FALSE | 도서 ID |
CATEGORY | VARCHAR(N) | FALSE | 카테고리 (경제, 인문, 소설, 생활, 기술) |
AUTHOR_ID | INTEGER | FALSE | 저자 ID |
PRICE | INTEGER | FALSE | 판매가 (원) |
PUBLISHED_DATE | DATE | FALSE | 출판일 |
BOOK_SALES 테이블은 각 도서의 날짜 별 판매량 정보를 담은 테이블로 아래와 같은 구조로 되어있습니다.
Column name | Type | Nullable | Description |
BOOK_ID | INTEGER | FALSE | 도서 ID |
SALES_DATE | DATE | FALSE | 판매일 |
SALES | INTEGER | FALSE | 판매량 |
문제
2022년 1월의 카테고리 별 도서 판매량을 합산하고, 카테고리(CATEGORY), 총 판매량(TOTAL_SALES) 리스트를 출력하는 SQL문을 작성해주세요.
결과는 카테고리명을 기준으로 오름차순 정렬해주세요
예시
예를 들어 BOOK 테이블과 BOOK_SALES 테이블이 다음과 같다면
BOOK_ID | CATEGORY | AUTHOR_ID | PRICE | PUBLISHED_DATE |
1 | 인문 | 1 | 10000 | 2020-01-01 |
2 | 경제 | 1 | 9000 | 2021-02-05 |
3 | 경제 | 2 | 9000 | 2021-03-11 |
BOOK_ID | SALES_DATE | SALES |
1 | 2022-01-01 | 2 |
2 | 2022-01-02 | 3 |
1 | 2022-01-05 | 1 |
2 | 2022-01-20 | 5 |
2 | 2022-01-21 | 6 |
3 | 2022-01-22 | 2 |
2 | 2022-02-11 | 3 |
2022년 1월의 도서 별 총 판매량은 도서 ID 가 1 인 도서가 총 3권, 도서 ID 가 2 인 도서가 총 14권 이고, 도서 ID 가 3 인 도서가 총 2권 입니다.
카테고리 별로 판매량을 집계한 결과는 다음과 같습니다.
CATEGORY | TOTAL_SALES |
인문 | 3 |
경제 | 16 |
카테고리명을 오름차순으로 정렬하면 다음과 같이 나와야 합니다.
CATEGORY | TOTAL_SALES |
경제 | 16 |
인문 | 3 |
오라클 정답 1 : BETWEEN .. AND 와 TO_DATE() 사용
select b.category, sum(s.sales) total_sales
from book b, book_sales s
where b.book_id = s.book_id
and s.sales_date between to_date('20220101','rrrrmmdd') and to_date('20220131','rrrrmmdd')
group by b.category
order by b.category asc;
오라클 정답 2 : TO_CHAR() 사용
select b.category, sum(s.sales) total_sales
from book b, book_sales s
where b.book_id = s.book_id
and to_char(s.sales_date, 'rrrrmm') = '202201'
group by b.category
order by b.category asc;
오라클 해설
EQUI JOIN 사용
두 테이블에 동일한 컬럼(BOOK_ID)이 존재하기 때문에
EQUI JOIN을 사용해서 JOIN을 할 수 있다.
# 1. SELECT절
출력해줘야 하는 컬럼명을 나열해주는데,
각 컬럼명 앞에 해당 컬럼명이 속하는 테이블 명과 온점(.)으로 연결해준다.
(두 테이블 간 동일 컬럼명을 사용하는게 아니라면 작성해주지 않아도 된다)
이때 total_sales는 카테고리 별 도서 판매량을 합산하여 구하는 것이기 때문에
BOOK_SALES 테이블에 있는 판매량 컬럼인 SALES를 SUM으로 합산해서 구해준다.
# 2. FROM절
조인할 두 테이블을 작성해주는데,
컬럼명 앞에 넣어주기 편하게 별칭을 설정해준다.
# 3. WHERE절
--연결조건
두 테이블의 동일한 컬럼(BOOK_ID)을 EQUI 조인 연결 조건으로 사용해준다.
--일반조건
SALES_DATE가 2022년 1월인 데이터에 대해서만 출력해야한다.
이때 조건을 작성하는 방법이 2가지가 존재하는데,
1번 : BETWEEN .. AND
1번은 BETWEEN .. AND 조건을 사용하여,
2022년 1월 1일 ~ 2022년 1월 31일의 데이터만 추출한다.
날짜를 조건으로 넣을 때
문자형 데이터를 TO_DATE()함수를 사용하여 날짜 데이터를 추출한다.
여기서 주의할 것은 DATE TYPE의 기본 구조는
년월일 시간:분:초 인데, 시간:분:초가 00:00:00으로 되어있다는 것이다.
따라서 2022년 1월 31일 00:00:00초까지의 값만 조건으로 걸러지는 것이기 때문에
+ 1을 해주어야 한다.
왜냐하면 2022년 1월 31일 12:30:31초에 판매된 데이터도 포함되게 해야 하기 때문이다.
하지만, 제공된 데이터에 따르면, 아래와 같이 SALES_DATE의 모든 날짜가
00:00:00 시간인 것만 존재하기 때문에 다른 1월 31일의 값은 신경 쓸 필요가 없다.
오히려 +1을 해주면, 2022년 2월 1일 00:00:00의 데이터도
조건에 충족되기 때문에 +1을 해주면 오히려 틀린 정답이 된다.
2번 : TO_CHAR 함수 사용
2번은 TO_CHAR함수를 사용하여 SALES_DATE 컬럼의 형식을 가공한 후
년과 월이 202201에 해당하는 값만 추출하는 방법이다.
▶ TO_CHAR([컬럼명], '변경할 데이터 형태')
위의 함수를 사용해서 날짜형 데이터 형식을 → 문자형 데이터 형식으로 변환한다.
* 표시한 형태 해석(오라클의 경우 대소문자 구분 없음)
- RRRR/YYYY : Year 연도 4자리로 표기(ex. 2023, 2024)
- MM : Month 월 2자리로 표기 (ex. 05, 07)
- DD : Day 일 2자리로 표기 (ex. 01, 31)
# 4. GROUP BY절
카테고리 별 판매량을 구하는 것이므로
BOOK 테이블의 카테고리 컬럼을 GROUP으로 묶어줘야한다.
MySQL 정답 1 : BETWEEN .. AND 와 STR_TO_DATE() 함수 사용
select b.category, sum(s.sales) total_sales
from book b, book_sales s
where b.book_id = s.book_id
and s.sales_date between str_to_date('20220101','%Y%m%d') and str_to_date('20220131','%Y%m%d')
group by b.category
order by b.category asc;
MySQL 정답 2 : DATE_FROMAT() 함수 사용
select b.category, sum(s.sales) total_sales
from book b, book_sales s
where b.book_id = s.book_id
and date_format (s.sales_date,'%Y%m%d') = '202201'
group by b.category
order by b.category asc;
MySQL 해설
EQUI JOIN 사용
두 테이블에 동일한 컬럼(BOOK_ID)이 존재하기 때문에
EQUI JOIN을 사용해서 JOIN을 할 수 있다.
# 1. SELECT절
출력해줘야 하는 컬럼명을 나열해주는데,
각 컬럼명 앞에 해당 컬럼명이 속하는 테이블 명과 온점(.)으로 연결해준다.
(두 테이블 간 동일 컬럼명을 사용하는게 아니라면 작성해주지 않아도 된다)
이때 total_sales는 카테고리 별 도서 판매량을 합산하여 구하는 것이기 때문에
BOOK_SALES 테이블에 있는 판매량 컬럼인 SALES를 SUM으로 합산해서 구해준다.
# 2. FROM절
조인할 두 테이블을 작성해주는데,
컬럼명 앞에 넣어주기 편하게 별칭을 설정해준다.
# 3. WHERE절
--연결조건
두 테이블의 동일한 컬럼(BOOK_ID)을 EQUI 조인 연결 조건으로 사용해준다.
--일반조건
SALES_DATE가 2022년 1월인 데이터에 대해서만 출력해야한다.
이때 조건을 작성하는 방법이 2가지가 존재하는데,
1번 : BETWEEN .. AND
1번은 BETWEEN .. AND 조건을 사용하여,
2022년 1월 1일 ~ 2022년 1월 31일의 데이터만 추출한다.
이때 날짜 조건을 주기 위해서 STR_TO_DATE()를 이용하여
문자형 데이터를 날짜형 데이터로 바꿔줘야 한다.
● STR_TO_DATE( [컬럼명],[사용할 형식] )
DATA TYPE을 날짜나 시간으로 변경하고자 할 때 사용하는 함수이다.
여기서 주의할 점은 DATE TYPE의 기본 구조는
년월일 시간:분:초 인데, 시간:분:초가 00:00:00으로 되어있다.
따라서 2022년 1월 31일 00:00:00초까지의 값만 조건으로 걸러지는 것이기 때문에
+ 1을 해주어야 한다.
왜냐하면 2022년 1월 31일 12:30:31초에 판매된 데이터도 포함되게 해야 하기 때문이다.
하지만, 제공된 데이터에 따르면, 아래와 같이 SALES_DATE의 모든 날짜가
00:00:00 시간인 것만 존재하기 때문에 다른 1월 31일의 값은 신경 쓸 필요가 없다.
오히려 +1을 해주면, 2022년 2월 1일 00:00:00의 데이터도
조건에 충족되기 때문에 +1을 해주면 오히려 틀린 정답이 된다.
2번 : DATE_FROMAT 함수 사용
2번은 DATE_FORMAT 함수를 사용하여 SALES_DATE 컬럼의 형식을 가공한 후
년과 월이 202201에 해당하는 값만 추출하는 방법이다.
▶ DATE_FORMATE([컬럼명], '변경할 데이터 형태' ) 함수
* 표시한 형태 해석(대소문자 구분 있음)
- %Y : Year 연도를 4자리로 표기 (ex. 2023, 2024)
- %m : Month 월을 2자리로 표기(ex. 05, 12)
- %d : Day 일을 두 자리로 표기(ex. 04, 28)
* 참고
- %c :Month 월을 한 자리로 표기(ex. 5, 12)
- %e :Day 일을 한자리로 표기(ex. 4, 28)
# 4. GROUP BY절
카테고리 별 판매량을 구하는 것이므로
BOOK 테이블의 카테고리 컬럼을 GROUP으로 묶어줘야한다.
출처 : 프로그래머스 코딩 테스트 연습, https://school.programmers.co.kr/learn/challenges
'SQL 문제 풀기 > 1. 프로그래머스 SQL : 2023.12.17~2024.2.29' 카테고리의 다른 글
<프로그래머스 50> 있었는데요 없었습니다.(Lv.3) (0) | 2024.02.04 |
---|---|
<프로그래머스 49> 오랜 기간 보호한 동물(1)(Lv.3) (2) | 2024.02.03 |
<프로그래머스 47> 자동차 평균 대여 기간 구하기(Lv.2) (2) | 2024.02.01 |
<프로그래머스 46> 조건에 부합하는 중고거래 상태 조회하기(Lv.2) (0) | 2024.01.31 |
<프로그래머스 45> 재구매가 일어난 상품과 회원 리스트 구하기(Lv.2) (2) | 2024.01.30 |