프로그래머스 - 상품을 구매한 회원 비율 구하기(Level 5)
문제 설명
다음은 어느 의류 쇼핑몰에 가입한 회원 정보를 담은 USER_INFO 테이블과 온라인 상품 판매 정보를 담은 ONLINE_SALE 테이블 입니다. USER_INFO 테이블은 아래와 같은 구조로 되어있으며 USER_ID, GENDER, AGE, JOINED는 각각 회원 ID, 성별, 나이, 가입일을 나타냅니다.
Column name | Type | Nullable |
USER_ID | INTEGER | FALSE |
GENDER | TINYINT(1) | TRUE |
AGE | INTEGER | TRUE |
JOINED | DATE | FALSE |
GENDER 컬럼은 비어있거나 0 또는 1의 값을 가지며 0인 경우 남자를, 1인 경우는 여자를 나타냅니다.
ONLINE_SALE 테이블은 아래와 같은 구조로 되어있으며 ONLINE_SALE_ID, USER_ID, PRODUCT_ID, SALES_AMOUNT, SALES_DATE는 각각 온라인 상품 판매 ID, 회원 ID, 상품 ID, 판매량, 판매일을 나타냅니다.
Column name | Type | Nullable |
ONLINE_SALE_ID | INTEGER | FALSE |
USER_ID | INTEGER | FALSE |
PRODUCT_ID | INTEGER | FALSE |
SALES_AMOUNT | INTEGER | FALSE |
SALES_DATE | DATE | FALSE |
동일한 날짜, 회원 ID, 상품 ID 조합에 대해서는 하나의 판매 데이터만 존재합니다.
문제
USER_INFO 테이블과 ONLINE_SALE 테이블에서 2021년에 가입한 전체 회원들 중 상품을 구매한 회원수와 상품을 구매한 회원의 비율(=2021년에 가입한 회원 중 상품을 구매한 회원수 / 2021년에 가입한 전체 회원 수)을 년, 월 별로 출력하는 SQL문을 작성해주세요. 상품을 구매한 회원의 비율은 소수점 두번째자리에서 반올림하고, 전체 결과는 년을 기준으로 오름차순 정렬해주시고 년이 같다면 월을 기준으로 오름차순 정렬해주세요.
예시
예를 들어 USER_INFO 테이블이 다음과 같고
USER_ID | GENDER | AGE | JOINED |
1 | 1 | 26 | 2021-06-01 |
2 | NULL | NULL | 2021-06-25 |
3 | 0 | NULL | 2021-06-30 |
4 | 0 | 31 | 2021-07-03 |
5 | 1 | 25 | 2022-01-09 |
6 | 1 | 33 | 2022-02-14 |
ONLINE_SALE 이 다음과 같다면
ONLINE_SALE_ID | USER_ID | PRODUCT_ID | SALES_AMOUNT | SALES_DATE |
1 | 1 | 54 | 1 | 2022-01-01 |
2 | 1 | 3 | 2 | 2022-01-25 |
3 | 4 | 34 | 1 | 2022-01-30 |
4 | 6 | 253 | 3 | 2022-02-03 |
5 | 2 | 31 | 2 | 2022-02-09 |
6 | 5 | 35 | 1 | 2022-02-14 |
7 | 5 | 57 | 1 | 2022-02-18 |
2021년에 가입한 회원은 USER_ID가 1, 2, 3, 4 인 회원들로 총 4명 입니다. ONLINE_SALE 테이블에서 해당 회원들에 대한 판매 데이터는 다음과 같습니다.
ONLINE_SALE_ID | USER_ID | PRODUCT_ID | SALES_AMOUNT | SALES_DATE |
1 | 1 | 54 | 1 | 2022-01-01 |
2 | 1 | 3 | 2 | 2022-01-25 |
3 | 4 | 34 | 1 | 2022-01-30 |
5 | 2 | 31 | 2 | 2022-02-09 |
그러므로 년, 월 별로 상품을 구매한 회원수와 상품을 구매한 회원의 비율을 구하고 결과를 정렬하면 다음과 같아야 합니다.
YEAR | MONTH | PUCHASED_USERS | PUCHASED_RATIO |
2022 | 1 | 2 | 0.5 |
2022 | 2 | 1 | 0.3 |
문제풀이
두 개의 테이블을 조인하는 문제이다.
PUCHASED_RATIO 부분에서는 '2021년에 가입한 전체 회원 수' 를 구하기 위해 서브쿼리가 필요하다고 생각하였다.
1. 조인을 할 키를 찾는다 (USER_ID)
2. 조인을 한 테이블을 서브 쿼리로 하여 원하는 항목을 SELECT 한다.
의 순서로 코드를 만들었다.
SELECT YEAR(T1.SALES_DATE) as 'YEAR', MONTH(T1.SALES_DATE) as 'MONTH',
COUNT(DISTINCT T1.USER_ID) as PUCHASED_USERS,
ROUND(COUNT(DISTINCT T1.USER_ID) / (SELECT COUNT(USER_ID)
FROM USER_INFO
WHERE JOINED < '2022-01-01' AND JOINED > '2020-12-31'), 1) as PUCHASED_RATIO
FROM
(
SELECT A.USER_ID, A.SALES_DATE
FROM ONLINE_SALE A
INNER JOIN (SELECT USER_ID, GENDER, AGE, JOINED
FROM USER_INFO
WHERE JOINED < '2022-01-01' AND JOINED > '2020-12-31') B ON A.USER_ID = B.USER_ID
) T1
group by YEAR(T1.SALES_DATE), MONTH(T1.SALES_DATE)
ORDER BY YEAR, MONTH
FROM 절 안의 서브쿼리에서 2021년도에 가입한 USER_INFO 의 USER_ID 를 JOIN 해서 서브쿼리를 만들었고
SELECT 절에서 YEAR 와 MONTH 를 GROUP BY 를 통해 집계함수 COUNT 로 집계하는 식으로 만들었다.
문제에 대한 생각
SQL 쪽에서 난이도가 높은 문제는 서브쿼리를 이용한 JOIN 에 대해 물어보는 문제가 많은데
SELECT 로 찾아야 하는 값을 나오게끔
JOIN 을 이용해서 원하는 모양의 테이블을 만드는게 중요하다고 생각한다.
Written by Sheart
'Study☆ > Computer Science' 카테고리의 다른 글
2021년 정보처리기사 1기 실기 가답 (0) | 2021.05.04 |
---|---|
정보처리기사 2020년 실기 2회 기출문제 (0) | 2021.04.20 |
정보처리기사 2020년 실기 1회 기출문제 (0) | 2021.04.13 |
[Python] 코딩 테스트를 위한 파이썬 기본 문법 (자료형, 조건문) (0) | 2021.03.15 |
[네트워크] 전송매체 유형 및 커넥터 (0) | 2021.03.06 |