250116 데이터분석과정 TIL
·
데이터분석캠프 TIL
회고 오늘은 통계학 마지막 세션과 QCC가 있어서 세웠던 계획을 다 달성하지 못했다. QCC는 지난번 보다 어렵지 않아서 풀만 했던 것 같다. 마침 어제 리트코드에서 풀었던 셀프조인 문제가 나와서 접근하는데까지는 성공했는데, 뒤에 조건을 덜 넣어서 틀렸다. 그래도 배웠던 내용을 다시 복습할 수 있어서 아주 좋았던 문제였다. 오늘로써 통계학 기초 강의도 끝났는데, 머리에 들어온 게 없어서 아무래도 강의를 다시 들어야 할 것 같다^^ 통계학 기본서도 함께 구입하고...하하 공부할 게 끝이 나지 않는다.
250115 TIL 데이터분석 과정
·
데이터분석캠프 TIL
1. 회고 이번주는 계속...위기를 맞고 있다. 해야 할 분량들은 다 끝나면서 하고 있지만 몸이 너무 힘들어서 머리에 들어오는 게 없다. 출석률 100%를 놓치기 싫어서 일단 엉덩이를 책상앞에 열심히 붙이고 있다. 죽겠다....이번 고비만 넘어가면 나아질 것 같은데, 공부량이 너무 많아서 하루 빠지는 게 뭔가 크다는 생각이 든다. 머신러닝이 흥미롭지 않고, 당장 나에게 있어 우선순위가 아니라서 그런지 더욱 집중이 잘 안되는 기분이다. 이야기 나누던 사람들도 하나둘 떠나가서 그런 것 같기도. 2. 아티클 정리 A/B 테스트 제대로 이해하기: ④ A/B 테스트 표본 크기와 유의미한 결과의 관계 | 요즘IT이전 글에서 기초 통계 지식을 바탕으로 A/B 테스트 계산기의 세팅 방법과 해석에 관한 내용을 살펴보았다..
250113 TIL 데이터분석과정 TIL(머신러닝 주차 시작)
·
데이터분석캠프 TIL
1. 회고 오늘은 뭔가 체력적으로 엄청 지친다. 새로 머신러닝 강의를 듣기 시작했는데, 뭔가 집중도 이해도 잘 안되었다. 심지어 강의페이지에서 잘못보고 기초강의가 아니라 심화강의부터 듣기 시작했다...낮에 난 무엇을 한 것인가? 남는 시간에는 파이썬 베이직반 강의 올라온 것들을 복습해주었다. 머신러닝이 너무 재미없다보니, 파이썬이 더 재미있게 느껴지는 기현상이 일어난다.  이제 본격적으로 포트폴리오에 넣을 내용들을 만들어주어야 하는지라, 내가 해왔던 내용들을 놓치지 말고 잘 적어주어야 겠다. 대략 아래의 내용을 중심적으로 담으려고 한다. 그동안 잠시 내려놓았던 공고 찾기도 이제 다시 시작해야 하는데, 체력적으로 잘 뒷받침해줄 수 있기를...흐물흐물해지는 기분이다..ㅎ 무슨 데이터를 가지고 어떤 분석을 했..
250110 TIL 데이터 분석과정 (QCC만 하다가 하루가 끝난...)
·
데이터분석캠프 TIL
1. 오늘의 목표🎯 이제 슬슬 포트폴리오에 자료들을 붙여넣으려고 하는데, 할 게 많아서 정신이 없다. 아직 모르는 게 너무 많은 느낌이다. 그래도 통계학 기초 강의는 어제부로 완강하였고, 이제 실습을 다시 한 번 풀어보면서 파이썬에 적용하는 방법을 연습하려고 한다. 남는 시간은 틈틈히 파이썬이랑 sql복습하기! 2. 회고📝오늘 하루는 QCC문제만 풀다가 하루가 다 간 것 같다.문제를 푸는데 concat 함수 적용하는 방법이 생각이 안나는 것이다..코드를 돌려봐도 계속 first name과 last name만 결과에 출력되어서 진심 당황했다. 그래서 한 문제 겨우 제출하고 도망갔더니 매니저님이 따라오심ㅋㅋㅋ 왜 출력이 안되었나 하니 컬럼에 따옴표을 씌워서 출력했기 때문.. 그냥 문자열만 붙이려면 따옴표..
TIL 241231 데이터분석과정: 스타벅스 마케팅 분석, 우수 TIL 선정된 날
·
데이터분석캠프 TIL
Starbucks Customer DataStarbucks customer datasetwww.kaggle.com스타벅스 프로모션 데이터를 분석하여, 고객 세그멘테이션을 하고 이에 맞는 마케팅 인사이트를 도출하는 것이 이번 분석의 목표였다.  주어진 데이터셋은 총 3개이다. portfolio.csv - 고객에게 프로모션 오퍼를 보낸 기록이 있는 데이터 (10 offers x 6 columns)profile.csv - 고객들의 인구통계학적 자료가 담긴 데이터 (17,000 customers x 5 columns)transcript.csv -   (306,648 events x 4 columns)1. ERD분석하기 앞서 ERD를 만들어보았다.  관계도에서 발견할 수 있는 주요사항은 아래와 같았다. profi..
241220 TIL 데이터분석과정
·
데이터분석캠프 TIL
1. SQL 코드카타문제1. 상품을 구매한 회원 비율 구하기SELECT DATE_FORMAT(O.SALES_DATE, '%Y') AS YEAR, DATE_FORMAT(O.SALES_DATE, '%m') AS MONTH, COUNT(DISTINCT U.USER_ID) AS PUCHASED_USERS, ROUND(COUNT(DISTINCT U.USER_ID)/(SELECT COUNT(*) FROM USER_INFO WHERE joined LIKE '2021%'), 1) AS PUCHASED_RATIOFROM USER_INFO UJOIN ONLINE_SALE OON U.USER_ID = O.USER_IDWHERE U.JOINED LIKE '2021%'GROUP BY YEA..
241224 TIL 데이터분석과정
·
데이터분석캠프 TIL
1. 판다스 퀴즈(1) iris 데이터 활용하여 산점도 만들기 요구사항1) species별 sepal length, sepal width, petal length, petal width의 평균과 표준편차를 구하세요.2) sepal length, sepal_width, petal_length, petal_width 4가지 변수 중 가장 상관관계가 높은 두 변수를 찾으세요.3) 위에서 구한 두 변수를 x, y축으로 두고 species에 따라 분류하는 산점도를 생성하세요.#평균과 표준편차df = iris.groupby("species").agg(['mean', 'std'])print(df)#상관계수iris[['sepal_length', 'sepal_width','petal_length','petal_width..
241219 TIL 데이터 분석 과정
·
데이터분석캠프 TIL
회고일간 목표 데이터 시각화 4주차 강의SQL 코드카타 72 ~ 74번아티클라이브 세션팀 데이터 분석 자료점프투 파이썬 2장 읽는 중목요일이 되어서 그런지 오늘은 어제보다는 지친 하루인 것 같다.어제는 컨디션이 꽤나 좋았는데, 오늘은 오후쯤 되니 눈이 뻑뻑해서, 눈을 자주 감고 있었다.   그래도 좋은 점은 판다스는 오류가 많이 뜨지 않고, 내가 보고 싶은 결과들을 바로 시각화해서 볼 수 있어서 비교적 재밌게 수업을 진행하고 있다. 오늘은 어제보다 실시간 세션 시간에 다룬 내용들이 많았는데,데이터 필터, 정렬하기, 변경하는 법, 결측값을 처리하는 방법에 대해 배울 수 있었다.  제공된 강의로 데이터 시각화 4주차까지 완강해서 matplotlib으로 그래프 그리는 법까지 실습을 진행했는데, 이 내용을 가지..