사용자 로그 행동 데이터의 이해
·
MARKETING/이론 정리
📌 유저(User)우리 웹 사이트의 고객 📌 이벤트(Event)가장 중요한 개념은 이벤트입니다. 웹 사이트에서 발생하는 유저의 모든 행동예) 첫 화면 페이지를 볼 때(page_view), 쇼핑몰 사이트의 스크롤을 내릴 때(scroll), 상품 클릭하기 버튼을 누를 때(view_item) 📌 퍼스트 파티 데이터(1st Party)웹사이트에서 유저에게 동의를 구하고 수집하는 데이터. 유튜브 시청 기록, 이메일, 전화번호, UID로 장바구니, 사용자 검색 기록, 찜한 상품 등. 📌 세컨 파티 데이터(2nd Party)다른 기업이 수집한 퍼스트 파티 데이터를 공유하는 것협력사 또는 파트너사 간에 데이터를 제공받거나 공유하는 방식퍼스트 파티 데이터를 믿을 수 있는 기업과 거래하여 얻음 📌 서드 파티 데이..
250210 데이터분석과정 - 태블로(Tableau) 활용 데이터 시각화 실습
·
데이터분석캠프 TIL
1. 회고 드디어 부트캠프의 마지막 이론 과정인 태블로 학습에 들어섰다. 이전 과정들보다 난이도가 낮아 훨씬 수월하게 진행할 수 있었고, 마지막 이론이라는 점에서 이제 짐을 한시름 놓은 것 같다. 더불어 제일 배우고 싶어했던 파트이기도 했다. 현업에 있을 때 내 의견을 간단하게 시각화해서 표현하는 게 프레젠테이션 할 때 가장 필요했기 때문이다. 머신러닝과 통계학할 때는 매일 도망가고 싶었다..분명 한국어로 써있는데 무슨 말이지.. 부캠을 하면서 실내에만 있으니 체력이 떨어질 수가 있어서, 크로스핏을 하며 체력보전을 하고 있다. 크로스핏의 장점이 나자신과 기록 싸움을 할 수 있다는 점이라, 나의 마음의 근육, 인내심이 함께 길러지는 운동인 것 같다. 회사에 들어가면 힘겨운 일들을 또다시 마주할텐데 이런 점..
250203 TIL 데이터 분석 과정(머신러닝 프로젝트)
·
데이터분석캠프 TIL
1. 회고 오늘 하루도 머신러닝 프로젝트만 하다가 끝이났다. 진짜 피곤하다. 팀장을 맡아서 역할들을 조율하고, 스케줄이 밀리지 않도록 조정하고 있는데, 간단한 것 같으면서도 어렵다. 누군가는 불편한 마음이 들 수도 있기 때문이다. 그래도 끝날 것 같지 않던 머신러닝 프로젝트도 곧 끝을 향해 달려가고 있다. 이제 이틀만 더 하면 마무리고, PPT도 거의 완성되어 가는 중이다.   2. 현대차 테이블 EDA  현대 차가 영국의 중고차 시장에서 서비스를 확장한다고 가정하는 프로젝트 목표를 세웠다. 영국 현지에서는 현대차가 어느 정도의 위치에 자리잡고 있고, 경쟁 브랜드는 무엇이 있을지 파악하기 위해 관련 조사를 했다.  (1) 수치형 데이터 주행거리10,000~60,000 miles 구간에서 대부분의 차량이 ..
250127 TIL 데이터분석과정
·
데이터분석캠프 TIL
1. 회고오늘은 하루종일 데이터 전처리를 진행했다. 이전 프로젝트보다는 훨씬 판다스를 자유롭게 사용할 수 있게된 것 같아서 좋다. 팀원들과도 많이 친해져서 편하게 대화를 나눌 수 있는 사이가 된 것 같다. 처음에는 너무 어색해서 걱정을 정말 많이 했는데, 의견도 적극적으로 내주시고 내가 알지 못했던 지식들도 서로 공유할 수 있어서 좋은데, 내가 개념이 많이 부족한 것 같아서 슬프다...우리조는 중고차 가격을 예측하는 머신러닝 모델을 만드는 중인데, 테이블 개수도 많고 그만큼 변수가 많아서 발표 라인 전개에 어려움을 겪는 중이다. 그리고 예상치 못한 이상치들이 많이 등장하고 있어서, 회의 시간에 하나하나 결정을 내리고 있다. 내가 모든 걸 아는 척척박사였다면 좋았겠다만...아쉽게도 나는 배움이 느린 편이라..
SQL: Leet code 문제풀이(570, 1934, 620)
·
DATA/SQL
570. Managers with at least 5 direct reports https://leetcode.com/problems/managers-with-at-least-5-direct-reports/description/ #구할 값: name # 조건절에서 managerId가 5번 이상 언급되는 값을 찾아서 집계해준다.select namefrom Employeewhere id in (select managerId from Employee group by managerId having count(*) >= 5)  1934. Confirmation Ratehttps://leetcode.com/problems/confirmation-rate/description/ 각 사용자의 확..
[아티클 스터디] 알라미의 A/B 테스팅 일지
·
데이터분석캠프 TIL
✅읽은 아티클 알라미의 A/B 테스팅 일지 #1A/B 테스팅을 하면서 다른 팀들은 어떤 가설을 기반으로 어떠한 결과를 냈는지 궁금한 적이 많았는데, 이번 기회에 알라미에서 진행했던 A/B 테스팅 중 몇몇 경험들을 공유해보려고 한다.medium.com  1. 진행한 테스트테스트1. 앱 등록정보 A/B 테스팅(Store listing experiments)(1) 그래픽 이미지: 슬로건을 현지화한 경우는 결과가 좋지 않았음. (2) 간단한 설명: 대상 고객 정의를 적어두면 “이건 바로 나” 라고 생각하고 다운로드율이 증가할 것이다.→ ‘기존 알람으로 잘 일어나지 못하는 사람’이다. (3) 자세한 설명: 사진으로 알람해제 모드를 첫 줄에 소개하면(신기해서) 다운로드율이 증가할 것이다.→ 생각보다 많은 개선이 일..
기초통계학(1) : 중심경향치, 산포도
·
기초통계
1. 중심경향치- 평균을 포함하는 고급스러운 용어- 범주형의 요약은 최빈값을 이용할 수 있음. 가장 많이 등장하는 값. - 수치형의 경우 평균, 중앙값이 사용됨평균평균은 이상치에 민감하기 때문에, 데이터가 커지면 전체 데이터를 왜곡하는 현상이 일어난다. 중앙값: 일련의 숫자를 값 순서대로 줄 세웠을 때, 백분위 50%에 해당하는 값 2. 산포도데이터의 퍼짐 정도를 나타내는 방법1. 분산(Variance) : 평균에 데이터가 퍼진 정도- 1차원의 데이터는 넘파이로 사용하는 게 훨씬 유용하다.  2. 표준편차(Standard Deviation): 분산을 계산할 때 숫자를 제곱하면, 단위까지 제곱되는데 이를 막기 위해  3. 변동계수(Coeffient of Variation): 서로 값의 스케일이 다르다면 분..
250122 TIL 데이터분석과정
·
데이터분석캠프 TIL
1. 회고   머신러닝... 뭔말일까...? 프로젝트를 하려면 일단 대충이라도 이해를 시켜야하는데 그냥 뭔가 딴세상 이야기 같다. 그냥 흘려듣고 넘기면 나름 즐겁게 들을 텐데, 팀프로젝트가 걸려있으니 그것도 안됨..물론 알고 있으면 무조건 득이지만, 취업 그자체로는 마케터에게 머신러닝은 우선순위가 아니다보니, 이걸 지금 시기에 하는게 맞나 하는 조바심이 난다. 하지만 향후의 트렌드를 보면 데이터 기반의 사고와 머신러닝 관련 지식이 점점 더 중요한 역량으로 자리 잡고 있다는 걸 부정할 수 없다. 이번 프로젝트를 통해서는 기본적인 개념만 다지고 입사 후에 좀 더 관심을 가지고 공부하는 걸로 방향을 잡고 있다.  오늘은 통계학을 전체적으로 복습하는 시간을 가졌고, 머신러닝 내용을 훑어보면서 과제풀이 위주로 진..