데이터분석캠프 TIL (39) 썸네일형 리스트형 250405 데이터 분석 캠프 최종프로젝트 지난 4월 5일 최종 프로젝트 결과물을 제출했다. 원래는 목요일에 제출하는 걸 목표로 세웠지만 결과적으로는 당일에 딱 맞춰서 제출하게 되었다. 그래도 미리 제출하겠다는 좋은 팀원들을 만났기에 끝까지 마칠 수 있었다. 팀 프로젝트 회고 Keep: 1. 자유롭게 의견 조율을 할 수 있는 분위기.2. 일정 조율 3. 한 사람이 다양한 역할을 체험할 수 있었음4. 진행사항에 대한 공유가 잘 되었음 Problem + 향후 진행해보고 싶은 방향1. 가설검정을 철저하게 할 것2. 인사이트에 제안한 모델링을 작업해보고 싶음 TRY 1. 인사이트와 EDA를 통해서 탄탄하게 이야기 구조를 만들고 싶음2. 가설설정을 탄탄히 하고 싶음3. 엑스퍼트 판매자가 판매하는 상품을 강조할 수 있으면 좋겠다4. 구매자의 입장에.. 250401 데이터분석과정: 최종 프로젝트 TIL(태블로 대시보드) 오늘은 대시보드의 완성도를 높이는 작업을 진행했다. 지난 번 태블로 프로젝트 때 구현하지 못했던 기능들에 익숙해졌고, 만질 수록 태블로의 기능들을 빠르게 파악하게 되었다. 가장 구현하기 어려웠던 것은 '클러스터별 인원 수' 도넛 차트와 '정품 인증 통과 비율'이었다. '정품 인증 통과 비율'의 경우 KPI로 나타내는 것이 어려워서 아직도 구현을 하지 못했다. 위와 같은 방식으로 구현해야 하는데, 아직 아래에 머물러 있다. 그리고 Key Value 값에 들어가는 그래프를 하나하나 부동 처리로 만들어내는 게 보통 일이 아니다. 겉보기에는 금방 만들어낸 그래프같았지만, 실제로 만들어보니 시간이 많이 걸린다. 또한, 가상의 월을 만들어서 시계열 예측 그래프를 만들었다. 비록 우리의 데이터에는 시계열 자료.. 250319 TIL 데이터분석캠프(K-means 군집, 엘보우 기법, 실루엣 지표) 1. 회고월요일 부터 모델링 구현에 힘쓰는 중이다. 그런데 생각보다 잘 안굴러가서 머리가 아프다. 월요일에는 우수 셀러 선정을 위해 파생변수를 만들어냈고, 화요일에는 그 파생변수를 기반으로 우수 셀러를 선정하기 위한 군집을 시행했다. 우리가 선정한 기준은 '인기도', '신뢰도', '회사 이윤' 측면에서 도움을 주는 셀러들이다. 튜터님께서 올려주신 군집 강의를 보면서 코드 진행 방식에 대해서 복습했다. 2. 모델링(1) K-means 클러스터링의 정의: 데이터 포인트를 k개의 클러스터로 나누는 알고리즘클러스터의 개수 K를 설정초기 클러스터 중심을 무작위로 선택각 데이터 포인트를 가장 가까운 클러스터 중심으로 할당각 클러스터에 대해 중심을 재계산클러스터 중심이 수렴하거나 최대 반복 횟수에 도달하면 종료.. 250313 TIL 데이터분석과정(최종 프로젝트 EDA 시각화) 1. 회고오늘은 하루 종일 데이터셋의 EDA를 진행했다. 지난주에는 SQLD 시험이 있어서 준비할 시간이 많지 않았었는데, 이번주에는 온전히 데이터 분석에 집중할 수 있는 시간이 있었다. Keep- 현업에 들어가서도 EDA를 꼼꼼하게 할 것- EDA를 통해서 데이터 자체에 대한 해석을 꼼곰하게 하고, 처음부터 다시 데이터프레임을 다시 짜는 시행착오를 줄일 수 있어야 함 Problem- 시각화 코드를 자유롭게 짤 수 있도록 코드 연습을 많이 해볼 것 Try- 변수 간 상관관계에 대한 가설을 많이 세워볼 것 2. EDA 내용 정리(1) 이상치 정리 이상치 파악을 위해 박스플롯 부터 그려보았다. (2) 수치형 변수 기술통계 (3) 히트맵 (4) Scatter plot - 가격과 .. 250311 TIL 데이터분석과정(EDA, 전처리) 1. 회고오늘의 회고는 이 한 마디로 끝난다. 오늘 오랜만에 운동을 갔더니 힘이 나는 것 같다. 크로스핏 맨처음에 갈 땐 그저 무서웠는데, 이젠 이거라도 안하면 엔돌핀이 돌지 않는다.. 2. 프로젝트 정리Vestiarie Collective 데이터셋의 EDA를 진행하면서, 서브 카테고리가 제대로 분류되어 있지 않다는 것을 깨달았다. 그래서 공홈의 기준과 비교해서 서브 카테고리 컬럼 생성 후 값을 채워주었다. # Men clothing: 193549개len(df[df['product_category'] == 'Men Clothing'])cond_category_men_clothing = (df['product_category']=='Men Clothing')men_clothing = df1[cond_ca.. 250307 TIL 데이터분석과정 (SQLD 공부, 최종프로젝트, 퍼널분석) 1. 회고정말 정신없던 한 주가 흘러갔다. 내일 SQLD 시험봐야 하는데 최종 프로젝트 팀장에, 포트폴리오에 아주 정신이 없다.그래도 다행인 점은 팀 원들 모두 열심히 참여해주셔서 아주 힘들지는 않다. 오늘 데이터 EDA를 진행하면서 문득 지난 조에서 들었던 스텝 밟는 오리가 그리워졌다. 유튜브에 춤추는 오리라고 검색해봤는데 안떠서 전 팀원 분에게 여쭤보았다. 이제 내 프로젝트의 보법이 달라지겠구만. EDA에는 역시 쿵짝쿵짝 노래지.이번주 중으로 포트폴리오, SQLD 마무리 하고 이제 최종 프로젝트를 하면서 지원에 힘써야겠다. 4월 중 늦어도 5월까지는 나의 출근지가 정해질 수 있기를! 2. 배운 내용 - 개방형 퍼널: 사용자가 어떤 단계에서든지 퍼널 진입 가능- 폐쇄형 퍼널: 시작이 정해져 있.. 250306 TIL 데이터분석과정 1. 회고최종 프로젝트, SQLD 공부를 병행하는 중이다. 나는 멀티가 안되는 사람인데,, 멀티를 하려니 머리가 아프다ㅎ날이 좋아지니, 빨리 취업해서 출근하고 싶다. 요새는 정말 정신이 하나도 없다. 2. 프로젝트 정리 우리 조가 정한 주제는 럭셔리 제품을 파는 리셀링 플랫폼으로 이 플랫폼의 인지도를 활성화하는 전략을 세우고자 한다. 36개의 컬럼, 90만개의 행으로 이루어진 방대한 데이터셋이라 분석할 내용들이 많을 것 같아서 기대된다. 중고시장은 신뢰도와 안정성이 가장 중요한 요소인데, 이 부분에 대해 초점을 맞추어 개선방향을 잡아가려고 한다. 소비자가 찾는 중고거래 플랫폼이 되기 위한 3가지 조건검수 과정 강화 방법들은 소비자에게 신뢰도 높은 플랫폼으로 어필할 수 있는 매우 효과적인 전략입니.. 250304 데이터분석캠프 TIL 오늘 하루종일 포트폴리오를 만지느라 하루가 갔다. 휴일 내내 포트폴리오를 수정하고 있었는데, 여전히 건들일 내용이 많아서 걱정이다. 이제 공고가 많이 올라고 있는 상황이라 상반기 내로 꼭 취업을 하고 싶은데, 최종프로젝트, 방송대 수업을 병행하면서 취업준비 잘 할 수 있으려나 모르겠다. 오늘 개강했다는 문자보고 진짜 도망가고 싶었다. 오늘 입학했는데 휴학 신청 가능한지 찾아보고 있는 나...실화인가요? 오늘 SQL 복습했어야 하는데, 포폴 초안 만들어내느라 전혀 시간 없었구요..이제 SQLD가 곧 찾아오고 있는데, 이건 또 언제 하는 거죠?ㅋㅋㅋ이론 강의가 끝나도 낮에 시간이 없는 게 매 한가지..아아 진심으로 몸을 나누어서 내가 3명으로 분리되었으면 좋겠다. 내일은 좀 더 밀도있는 하루를 보내길 바라며.. 이전 1 2 3 4 5 다음