250122 TIL 데이터분석과정
·
데이터분석캠프 TIL
1. 회고   머신러닝... 뭔말일까...? 프로젝트를 하려면 일단 대충이라도 이해를 시켜야하는데 그냥 뭔가 딴세상 이야기 같다. 그냥 흘려듣고 넘기면 나름 즐겁게 들을 텐데, 팀프로젝트가 걸려있으니 그것도 안됨..물론 알고 있으면 무조건 득이지만, 취업 그자체로는 마케터에게 머신러닝은 우선순위가 아니다보니, 이걸 지금 시기에 하는게 맞나 하는 조바심이 난다. 하지만 향후의 트렌드를 보면 데이터 기반의 사고와 머신러닝 관련 지식이 점점 더 중요한 역량으로 자리 잡고 있다는 걸 부정할 수 없다. 이번 프로젝트를 통해서는 기본적인 개념만 다지고 입사 후에 좀 더 관심을 가지고 공부하는 걸로 방향을 잡고 있다.  오늘은 통계학을 전체적으로 복습하는 시간을 가졌고, 머신러닝 내용을 훑어보면서 과제풀이 위주로 진..
250117 TIL 데이터분석과정 - 머신러닝...통계학...
·
데이터분석캠프 TIL
1. 회고  드디어 지옥같던 한 주가 지나갔다. 흐아ㅏ아악 머신러닝! 그리고 파이썬 베이직반에서 챌린지반으로 넘어가서 수업을 듣고 있는데, API로 데이터를 긁어올 수 있다는 게 흥미로웠다. 파이썬으로 할 수 있는 일이 이렇게 무궁무진하다니 더 잘 다뤄서 해낼 수 있는 역량을 넓히고 싶다. 문제는 머신러닝이 나에게 굉장히 받아들이기 어려운 신식 개념으로...익숙해지지 않는다. 뭔가 머신러닝이 주는 어감 때문에 무서워서이지 않을까 싶고, 간단하게 프로그램을 학습시켜서 예측할 수 있도록 만들어내는 걸 짠다고 생각하면 좋을 것 같은데 생소한 개념이라서 와닿지 않는 것 같다. 아직 부족한 통계 지식도 마찬가지고..어제 류근관 교수님의 통계학이랑 양승화님께서 쓰신 그로스 해킹 책을 새로이 구입했다. 공부할 게 많..
SQL QCC 오답노트
·
카테고리 없음
문제1. 지역별로 매출이 가장 높은 매장의 매출을 조회하는 SQL 문을 작성해주세요. 단, 해당 지역에 매장이 두 개 이상인 경우만 결과에 포함해주세요. 결과는 지역 이름을 기준으로 오름차순으로 정렬해주세요.select REGION_NAME as region_name, MAX(SALES) as highest_sales from storesgroup by region_nameHAVING count(distinct STORE_ID) >= 2 order by region_name; 문제2. 최근 특정 사용자들이 결제를 하지 않고 상품을 주문하거나, 결제를 하지 않은 시점에 이미 상품을 주문하는 버그가 발견되었습니다. 🐞 해당 버그를 악용한 사용자를 파악하기 위해 SQL 문을 작성해주세요. 다음 조건에..
데이터 전처리를 위한 판다스(Pandas) - 데이터 조회
·
PYTHON
1. 데이터 확인1-1 데이터 조회head () 앞 부분 tail () 뒷 부분 조회 해당 함수들로 가장 앞과 뒤의 데이터를 원하는 갯수만큼 확인할 수 있음. 갯수를 지정하지 않을 경우 default옵션으로 5개부터 조회된다. df.head(3) #앞의 3개의 행 조회df.tail(3) #뒤의 3개의 행 조회1-2 컬럼 정보 확인info ()컬럼별로 정보를 확인하고자 할 때 사용(인덱스, 컬럼명, 컬럼의 데이터 개수, 데이터 타입, null값 확인)   value_counts() column 별 값의 분포를 확인할 때 사용df['column'].value_counts() 1-3 데이터프레임 속성 확인 - Index: 데이터프레임 또는 시리즈의 각 행 또는 각 요소에 대한 식별자  - dtypes: 컬럼별..
241219 TIL 데이터 분석 과정
·
데이터분석캠프 TIL
회고일간 목표 데이터 시각화 4주차 강의SQL 코드카타 72 ~ 74번아티클라이브 세션팀 데이터 분석 자료점프투 파이썬 2장 읽는 중목요일이 되어서 그런지 오늘은 어제보다는 지친 하루인 것 같다.어제는 컨디션이 꽤나 좋았는데, 오늘은 오후쯤 되니 눈이 뻑뻑해서, 눈을 자주 감고 있었다.   그래도 좋은 점은 판다스는 오류가 많이 뜨지 않고, 내가 보고 싶은 결과들을 바로 시각화해서 볼 수 있어서 비교적 재밌게 수업을 진행하고 있다. 오늘은 어제보다 실시간 세션 시간에 다룬 내용들이 많았는데,데이터 필터, 정렬하기, 변경하는 법, 결측값을 처리하는 방법에 대해 배울 수 있었다.  제공된 강의로 데이터 시각화 4주차까지 완강해서 matplotlib으로 그래프 그리는 법까지 실습을 진행했는데, 이 내용을 가지..
데이터 전처리를 위한 - 판다스(Pandas) 기초
·
PYTHON
판다스 기초1. 판다스는 무엇인가? 관계형 또는 레이블이 된 데이터, 아래와 같은 형식의 데이터를 분석하는데 적합한 PYTHON 패키지이다. SQL 테이블 또는 Excel 스프레드 시트에서와 같은 열과 행으로 이루어진 테이블 형식 데이터정렬되고 정렬되지 않은 시계열 데이터다른 형태의 관찰 / 통계 데이터 세트 ✅판다스 설치방법이전에 Visual Studio와 Python이 컴퓨터에 설치되어 있어야 하며, Visual Studio에서 Jupyter와 Python도 설치해주어야 한다.  1) 터미널이나 코드창에 아래의 코드를 입력하면, 밑에 주루룩 무언가 설치되었다는 문구들이 뜬다. pip install pandas 2) 그 다음 아래의 코드를 입력한다.import pandas as pd # pandas 라..
241216 TIL (SQL 코드카타 - 자동차 평균 대여기간 구하기, 우유와 요거트가 담긴 장바구니)
·
데이터분석캠프 TIL
1. 자동차 평균 대여기간 구하기   ✅문제 풀이SELECT CAR_ID, ROUND(AVG(DATEDIFF(END_DATE, START_DATE) +1), 1) AS AVERAGE_DURATIONFROM CAR_RENTAL_COMPANY_RENTAL_HISTORYGROUP BY CAR_IDHAVING AVG(DATEDIFF(END_DATE, START_DATE) + 1 ) >= 7ORDER BY AVERAGE_DURATION DESC, CAR_ID DESC; # 출력할 값: CAR_ID, AVERAGE_DURATION평균 대여 기간이 7일 이상인 자동차들의 평균 대여 기간을 구하기 위해서는 두 날짜의 차이를 구해주는 함수인 DATEDIFF를 통해서 기간을 출력해야 한다.  DATEDIFF(..
GA4 : GTM에 태그 연결하기
·
DATA/GA4
이번 포스팅에서는 데이터 트래킹을 위해 GTM에 태그를 연결하는 방법을 설명하려고 한다.  ✅태그 연결 방법(1) 가장 먼저 태그 관리자의 작업공간에 들어가서 태그로 이동한다.   (2) 상단에 태그 이름을 지정해주고, 태그 구성 클릭 → Google 애널리틱스를 선택  (3) Google 태그를 선택한 후 측정 ID를 입력해준다. (만약, 측정 ID를 까먹었다면 구글애널리틱스로 들어가서 (관리 → 데이터 스트림)에서 확인 가능)  (4) 트리거는 태그가 언제 실행될 지를 결정하는 것Google 태그는 다른 태그들보다 가장 먼저 실행되어야 하고 모든 웹사이트에서 실행되어야 하기 때문에Initialization - All Pages를 클릭한 후 저장한다.   (5) Google 태그의 변경 사항을 반영하기..