본문 바로가기
SQL 문제 풀기/1. 프로그래머스 SQL : 2023.12.17~2024.2.29

<프로그래머스 68> 저자 별 카테고리 별 매출액 집계하기(Lv.4)

by HYEHYE_SON 2024. 2. 22.
728x90

 

프로그래머스에서 제공하는 SQL문제 매일 풀기 챌린지


 

문제 설명

다음은 어느 한 서점에서 판매중인 도서들의 도서 정보(BOOK), 저자 정보(AUTHOR) 테이블입니다
BOOK 테이블은 각 도서의 정보를 담은 테이블로 아래와 같은 구조로 되어있습니다

 

Column name Type Nullable Description
BOOK_ID INTEGER FALSE 도서 ID
CATEGORY VARCHAR(N) FALSE 카테고리 (경제, 인문, 소설, 생활, 기술)
AUTHOR_ID INTEGER FALSE 저자 ID
PRICE INTEGER FALSE 판매가 (원)
PUBLISHED_DATE DATE FALSE 출판일
AUTHOR 테이블은 도서의 저자의 정보를 담은 테이블로 아래와 같은 구조로 되어있습니다
Column name Type Nullable Description
AUTHOR_ID INTEGER FALSE 저자 ID
AUTHOR_NAME VARCHAR(N) FALSE 저자명
BOOK_SALES 테이블은 각 도서의 날짜 별 판매량 정보를 담은 테이블로 아래와 같은 구조로 되어있습니다.
Column name Type Nullable Description
BOOK_ID INTEGER FALSE 도서 ID
SALES_DATE DATE FALSE 판매일
SALES INTEGER FALSE 판매량

문제

2022년 1월의 도서 판매 데이터를 기준으로 저자 별, 카테고리 별 매출액(TOTAL_SALES = 판매량 * 판매가) 을 구하여, 저자 ID(AUTHOR_ID), 저자명(AUTHOR_NAME), 카테고리(CATEGORY), 매출액(SALES) 리스트를 출력하는 SQL문을 작성해주세요.
결과는 저자 ID를 오름차순으로, 저자 ID가 같다면 카테고리를 내림차순 정렬해주세요

예시

예를 들어 BOOK 테이블과 AUTHOR 테이블, BOOK_SALES 테이블이 다음과 같다면

 

[ BOOK ]

BOOK_ID CATEGORY AUTHOR_ID PRICE PUBLISHED_DATE
1 인문 1 10000 2020-01-01
2 경제 1 9000 2021-02-05
3 경제 2 9000 2021-03-11

 

[ AUTHOR ]

AUTHOR_ID AUTHOR_NAME
1 홍길동
2 김영호

 

[ BOOK_SALES ]

BOOK_ID SALES_DATE SALES
1 2022-01-01 2
2 2022-01-02 3
1 2022-01-05 1
2 2022-01-20 5
2 2022-01-21 6
3 2022-01-22 2
2 2022-02-11 3

 

2022년 1월의 도서 별 총 매출액은 도서 ID 가 1 인 도서가 총 3권 * 10,000원 = 30,000원, 도서 ID 가 2 인 도서가 총 14권 * 9,000 = 126,000원 이고, 도서 ID 가 3 인 도서가 총 2권 * 9,000 = 18,000원 입니다

 

저자 별 카테고리 별로 매출액을 집계하면 결과는 다음과 같습니다

AUTHOR_ID AUTHOR_NAME CATEGORY TOTAL_SALES
1 홍길동 인문 30000
1 홍길동 경제 126000
2 김영호 경제 18000

 

그리고 저자 ID, 카테고리 순으로 내림차순 정렬하면 다음과 같이 나와야 합니다.

AUTHOR_ID AUTHOR_NAME CATEGORY TOTAL_SALES
1 홍길동 인문 30000
1 홍길동 경제 126000
2 김영호 경제 18000

 

♥  Oracle 정답

select a.author_id, a.author_name, b.category, sum(b.price * s.sales) total_sales
    from book b, author a, book_sales s
    where b.author_id = a.author_id and b.book_id = s.book_id
    and s.sales_date between to_date('20220101', 'rrrrmmdd') and to_date('20220131', 'rrrrmmdd')
    group by a.author_id, a.author_name, b.category
    order by author_id asc, category desc;

 

♥   MySQL 정답

select a.author_id, a.author_name, b.category, sum(b.price * s.sales) total_sales
    from book b, author a, book_sales s
    where b.author_id = a.author_id and b.book_id = s.book_id
    and s.sales_date between str_to_date('20220101', '%Y%m%d') and str_to_date('20220131', '%Y%m%d')
    group by a.author_id, a.author_name, b.category
    order by author_id asc, category desc;

 

 

 


 

■ EQUI JOIN

조인은 여러 개의 테이블의 컬럼들을 활용하여 한 번에 원하는 것을 출력하고자 할 때 사용하는 문법이다.

 

그 중 EQUI JOIN 이란, 

조인하려는 테이블 사이에 공통된 컬럼이 있을 경우 (컬럼명은 달라도 되고, 데이터가 공통될 때)

EQUAL(=) 조인하는 조인 문법이다.

 

ORACLE과 MySQL의 차이점은

MySQL에서는 IN LINE VIEW에 별칭을 지정해줘야 오류가 발생하지 않는 것이다.

ORACLE은 별칭이 없어도 에러가 발생하지 않았다.

 

■ TO_DATE( [컬럼명/문자열], '변경할 데이터 형태')   =  Oracle
   위의 함수를 사용해서 문자 혹은 숫자 데이터 형식을 → 날짜형 데이터 형식으로 변환한다.

   * 표시한 형태 해석(오라클의 경우 대소문자 구분 없음)
   - RRRR/YYYY : Year 연도 4자리로 표기(ex. 2023, 2024)
   - MM, MON: Month 월 2자리로 표기 (ex. 05, 07)
   - DD : Day 일 2자리로 표기 (ex. 01, 31)

   - DAY : 요일 ( ex. 금요일)

   - DY : 요일 ( ex. 금)

   - D : 요일을 숫자로 표현 ( 1은 일요일을 의미하며, 2는 월요일을 의미한다.)

   - HH : 12시간 형식으로 나타내는 시간을 의미 

   - HH24 : 24시간 형식으로 나타내는 시간을 의미

   - MI : 분

   - SS : 초

   - AM/PM : 오전/오후

 

■ STR_TO_DATE( [컬럼명/문자열], '변경할 데이터 형태')   = MySQL

   위의 함수를 사용해서 문자 혹은 숫자 데이터 형식을 → 날짜형 데이터 형식으로 변환한다.

 

   * 표시한 형태 해석(대소문자 구분 있음)
   - %Y : Year 연도를 4자리로 표기 (ex. 2023, 2024)
   - %m : Month 월을 2자리로 표기(ex. 05, 12)
   - %d : Day 일을 두 자리로 표기(ex. 04, 28)

   - %H : 시간을 24시간 형식으로 표기

   - %h : 시간을 12시간 형식으로 표기

   - %i : 분

   - %s : 초

   - %p : 오전 또는 오후를 나타낸다.



* 참고
   - %c :Month 월을 한 자리로 표기(ex. 5, 12) 
   - %e :Day 일을 한자리로 표기(ex. 4, 28)


정답 해설

위의 내용을 기반으로 해설해보면,

 

# 1. SELECT절

출력해야할 컬럼들을 각 테이블 명의 별칭과 함께 나열해준다. 

여기서 새로 생성해주어야할 컬럼은 total_sale 이다.

 

total_saels = 판매가 * 판매량

 

위와 같이 total_sales 컬럼을 생성할 수 있는데, 추가적으로 조치가 필요하다

sales의 경우 book_sales 컬럼에 존재하는데 아래와 같이 데이터가 입력되어 있다.

 

따라서 book_id 별 price와 sales를 곱한 후에 

여러 행으로 나눠 출력된 값을 book_id 별(author_id별)로 더해주어야 한다.

 

 

# 2. FROM절

join 해줄 테이블 book, author, book_sales를 나열해주는데,

컬럼명 앞에 편하게 명시해주기 위해서 별칭을 넣어준다. 

 

 

# 3. WHERE절  연결조건

book 테이블의 author_id와 author 테이블의 author_id를 equi join으로 연결해주고,

book 테이블의 book_id와 book_sales 테이블의 book_id를 equi join으로 연결해준다.

 

 

# 4. WHERE절  일반조건

2022년 1월에 판매된 데이터만 출력해야하기 때문에 조건을 주어야한다.

이때 TO_CHAR()를 사용할 수 있지만(MySQL의 경우DATE_FORMAT)

BETWEEN .. AND를 사용한다. (성능상 더 좋기 때문)

 

and s.sales_date between to_date('20220101', 'rrrrmmdd') and to_date('20220131', 'rrrrmmdd')

 

 

# 5. GROUP BY 절

저자 별 카테고리 별 매출액을 출력해야하기 때문에

select절 설명과 연결되어 

저자ID, 저자 이름, 카테고리 컬럼을 GROUP BY로 묶어준다.

 

group by a.author_id, a.author_name, b.category

 

 

# 6. ORDER BY 절

author_id를 기준으로 asc하게 정렬하고,

author_id가 같다면 category를 기준으로 desc하게 정렬한다.

 

 

 

 

 

 

 

출처 : 프로그래머스 코딩 테스트 연습, https://school.programmers.co.kr/learn/challenges

반응형