241218 TIL 데이터 분석과정 - SQL 코드카타(저자 별 카테고리 별 매출액 집계하기, 그룹별 조건에 맞는 식당 목록 출력하기, 대여 횟수가 많은 자동차들의 월별 대여 횟수 구하기, 오프라인/온라인 판매 데이터 통합하기)
·
데이터분석캠프 TIL
241218 TIL  1. SQL 코드카타 정리❤️문제1. 저자 별 카테고리 별 매출액 집계하기 총 세 개의 테이블이 주어졌고, 특정 기간의 카테고리 별 매출액, 저자 ID, 저자명, 카테고리, 매출액을 구해주어야 한다.  BOOK 테이블  BOOK 테이블    AUTHOR 테이블     BOOK_SALES 테이블   ✅문제풀이  #AUTHOR_ID, AUTHOR_NAME, CATEGORY, SALES출력 - 2022년 1월만 추출해야 함.  # 매출액 구하는 식만들기 #GROUP BY로 2022년 1월을 묶어준다.  2022년 1월 매출액만 불러오기 위해서 GROUP BY로 먼저 그룹화해 준 후 HAVING절로 2022년 1월 매출값을 가져왔더니 동작하지 않았다.  그 이유는 HAVING절은 집계 함수..
241216 TIL (SQL 코드카타 - 자동차 평균 대여기간 구하기, 우유와 요거트가 담긴 장바구니)
·
데이터분석캠프 TIL
1. 자동차 평균 대여기간 구하기   ✅문제 풀이SELECT CAR_ID, ROUND(AVG(DATEDIFF(END_DATE, START_DATE) +1), 1) AS AVERAGE_DURATIONFROM CAR_RENTAL_COMPANY_RENTAL_HISTORYGROUP BY CAR_IDHAVING AVG(DATEDIFF(END_DATE, START_DATE) + 1 ) >= 7ORDER BY AVERAGE_DURATION DESC, CAR_ID DESC; # 출력할 값: CAR_ID, AVERAGE_DURATION평균 대여 기간이 7일 이상인 자동차들의 평균 대여 기간을 구하기 위해서는 두 날짜의 차이를 구해주는 함수인 DATEDIFF를 통해서 기간을 출력해야 한다.  DATEDIFF(..
241210 TIL 파이썬 개념 정리(변수, 자료형, 리스트 문법)
·
데이터분석캠프 TIL
1. 출력문코드상의 결과들을 출력시켜서 사람이 직접 결과물을 볼 수 있도록 해주는 문법.  print() 함수가 가장 대표적인 출력문 함수, 화면에 값을 출력할 때 사용한다. 만약, 여러 값을 출력하고자 한다면 쉼표(,)로 구분한다.  - 문자를 파이썬에서 사용할 때는 ""(따옴표) 사이에 문자를 작성해야한다.  2. 변수(Variable)변수는 값을 저장하는 공간으로 상자라고 생각하면 쉽다. 변수는 반드시 사용하기 전에 선언되어야 한다. 선언은 원하는 값들을 변수에 넣어달라는 뜻이다. 변수를 선언하고자 할 때는 변수의 이름을 지어주어야 하는데, 본인이 원하는 이름 아무거나 넣어서 만들면 된다.(=)을 사용하여 값을 할당해준다. 아래의 예시를 보면 age, name이 변수이고, 25와 Alice는 변수를..
241209 TIL 데이터 분석 (SQL 프로그래머스 오답노트 - 조건에 맞는 사용자와 총 거래금액 조회하기, 가격대 별 상품 개수 구하기, 식품분류별 가장 비싼 식품의 정보 조회하기)
·
데이터분석캠프 TIL
1. 조건에 맞는 사용자와 총 거래금액 조회하기   풀이 1  1. 출력할 값: USER_ID, NICKNAME, SUM(PRICE) AS SALES_TOTAL  2. 서로 다른 두 테이블 USED_GOODS_BOARD와 USED_GOODS_USER을 JOIN 함수로 연결해준다.WRITER_ID = USER_ID 컬럼을 기준으로 연결할 수 있다.  3. WHERE 절에서 완료된 중고 거래만을 찾고자 하므로 A.STATUS가 'DONE' 값을 가지고 있는 데이터만을 필터링WHERE B.STATUS = 'DONE'  4. GROUP BY절로 USER_ID를 묶어줌.  5. HAVING 절로 그룹화된 결과에 대한 조건을 지정. 총 매출이 70만원 이상인 사용자만을 필터링HAVING은 그룹화된 결과에 조건을 걸..
241209 TIL 파이썬 (리스트, 튜플, 딕셔너리)
·
데이터분석캠프 TIL
1. 개요딕셔너리: 사전 같은 구조리스트와 튜플은 결과를 변경가능 한지 아닌지의 차이다.   데이터 분석을 할 때 다양하고 많은 데이터들을 다루어야 하는데 이런 데이터들을 구조화하고 조작하기 위해 리스트, 튜플, 딕셔너리는 반드시 필요하다.  ❗이점데이터를 담고, 정리하고, 꺼낼 때 필요하다.  설명딥러닝 모델을 반복 학습하며 결과를 리스트에 추가데이터 불러올때, 경로 처리할때 split 사용데이터를 임의의 범위만큼 선택할때 슬라이싱, 인덱싱 사용 데이터를 변경 불가능하게 사용하고 싶을 때데이터를 담는 하나의 방법 목적주로 맨 처음 데이터를 불러오고 가공할 때 사용결과를 저장할 때 많이 사용 결과물 기대효과데이터를 자유자재로 다룰 수 있고 정리할 수 있다  2. 리스트(List)?리스트는 파이썬에서 가장..
241202_ 데이터 분석 과정(JOIN, UNION, SUBQUERY, 윈도우 함수 )
·
데이터분석캠프 TIL
1. JOIN - 조인은 두 개 이상의 테이블에서 데이터를 결합하여 원하는 정보를 추출하는 SQL 작업- 테이블들이 각각 분리된 정보를 갖고 있을 때, 공통 컬럼을 통해 데이터를 결합할 수 있습니다.- 엑셀 VLOOKUP과 비슷한 기능 테이블들이 각각 분리된 정보를 갖고 있을 때, 공통 컬럼을 통해 데이터를 결합하여 전체적인 통찰을 제공합니다.  1.1 JOIN의 종류(1) INNER JOIN: 두 테이블의 공통된 데이터만 조회 (2) LEFT JOIN: 왼쪽 테이블의 모든 행을 반환하며, 오른쪽에 없는 데이터는 NULL로 표시 1.2 기타 JOIN RIGHT JOIN: LEFT JOIN의 정반대로, 오른쪽 테이블을 기준으로 반환→ 실무에서는 거의 사용 X엑셀의 VLOOKUP처럼 왼쪽을 중심으로 필요한 ..
241129 (TIL_데이터 분석 과정_ WIL)
·
데이터분석캠프 TIL
👉 문자 변경REPLACE : 지정한 문자를 다른 문자로 변경SUBSTRING : 특정 문자만 추출CONCAT : 여러 문자를 합하여 포맷팅👉 조건문IF : if(조건, 조건을 충족할 때, 조건을 충족하지 못할 때) CASE WHEN END : case when 조건1 then 값(수식)1          when 조건2 then 값(수식)2          else 값(수식)3          end  오늘은 1주차가 마무리 되었다. 12시간 씩 매일 공부한 것은 이번이 처음이라서 낯설기도 하고 힘들기도 했다. 이번 과정을 통해 내가 어떤 커리어로 나아가야 하는 지 고민해 보아야 겠다.
241128 TIL_데이터 분석 과정(SQL - 집계함수, GROUP BY, HAVING, LAND, ORDER BY)
·
데이터분석캠프 TIL
1.집계함수: 여러 행에서 단일 결과값을 반환하는 함수-  MIN, MAX는 숫자뿐만 아니라 날짜 데이터에도 사용 - 대부분의 집계함수는 NULL값을 제외하고 작동. / 예외) COUNT(*)는 NULL을 포함한다.  함수컬럼COUNT데이터의 행 수를 반환COUNT(DISTINCT 컬럼)고유한 값을 갖는 데이터의 행 수 반환 SUM열의 값을 모두 더함AVG열 값의 평균 계산MIN열 값 중 최소값 반환MAX열 값 중 최대값 반환 -- 데이터의 행 수 세기SELECT COUNT(*) AS row_countFROM employees;-- NULL 포함여부에 따른 COUNT 차이SELECT COUNT(*) AS total_rows, -- NULL 포함 COUNT(salary) AS non_null_..