GA4: UTM 파라미터 의미와 사용 방법
·
DATA/GA4
1. UTM의 의미 Urchin Tracking Module의 약자. 마케팅 캠페인의 성과를 추적하기 위해 URL에 추가하는 추적 파라미터 2. UTM 파라미터 구성utm_source 필수 : 유입 채널 (e.g. youtube)utm_medium 필수 : 유입된 매체 (e.g. social, cpc, email)utm_campaign 필수 : 유입된 캠페인 (e.g. sql_package)utm_term 옵션 : 검색 유입의 경우 검색하고 들어온 키워드 / 유료 광고의 경우 타겟utm_content 옵션 : 콘텐츠파라미터 명 = 파라미터 값을 한 세트로 입력. 사용하고 싶은 파라미터가 여러 개인 경우 '&'을 써서 연결한다. UTM은 팀 내에서 알아볼 수 있는 값으로 입력해주면된다. GA4에서는 UTM..
250110 TIL 데이터 분석과정 (QCC만 하다가 하루가 끝난...)
·
데이터분석캠프 TIL
1. 오늘의 목표🎯 이제 슬슬 포트폴리오에 자료들을 붙여넣으려고 하는데, 할 게 많아서 정신이 없다. 아직 모르는 게 너무 많은 느낌이다. 그래도 통계학 기초 강의는 어제부로 완강하였고, 이제 실습을 다시 한 번 풀어보면서 파이썬에 적용하는 방법을 연습하려고 한다. 남는 시간은 틈틈히 파이썬이랑 sql복습하기! 2. 회고📝오늘 하루는 QCC문제만 풀다가 하루가 다 간 것 같다.문제를 푸는데 concat 함수 적용하는 방법이 생각이 안나는 것이다..코드를 돌려봐도 계속 first name과 last name만 결과에 출력되어서 진심 당황했다. 그래서 한 문제 겨우 제출하고 도망갔더니 매니저님이 따라오심ㅋㅋㅋ 왜 출력이 안되었나 하니 컬럼에 따옴표을 씌워서 출력했기 때문.. 그냥 문자열만 붙이려면 따옴표..
SQL: LAG 함수 활용하여 현재 데이터와 이전 데이터를 비교
·
DATA/SQL
LAG 함수 정의 SELECT LAG([대상 컬럼], [이전 offset], [기본값]) OVER (PARTITION BY [..] ORDER BY [..]) LAG함수를 이용하면, 이전 행 값과 다음 행의 값을 비교할 수 있다.   예시 문제: 이전 일과 비교했을 때, 온도가 더 높았던 날짜를 집계하기with tmp as (select id ,RecordDate,Temperature,LAG (Temperature,1) OVER (ORDER BY RecordDate) AS prev_Temperature,LAG (RecordDate,1) OVER (ORDER BY RecordDate) AS prev_RecordDatefrom Weather)select id from tmp where Temperature>..
통계학 기초 정리 (6) : 가설검정(재현가능성, p-해킹, 선택적보고)
·
기초통계
1. 재현가능성 동일한 연구나 실험을 했을 때 우연한 결과가 계속 나오는 것이 아니라, 언제 어떤 상황에서도 일관된 결과값이 나와야 의미가 있다. 연구의 신뢰성을 높이기 위함. - 재현 가능성이 없다면 아무런 의미가 없는 것이다. 최근 p값에 대한 논쟁이 두드러지고 있음 p값을 사용하지 않는 것이 좋다. 유의수준을 0.05에서 변경하는 것이 좋다. 가설검정의 원리상의 문제나 가설검정의 잘못된 사용이 낮은 재현성으로 이어진다는 문제 발생p-값이 우리가 원하는 수치가 나왔음에도 잘못된 결과가 나올 수 있기 때문에, 너무 맹신해서는 안된다. ✅재현성 위기의 원인- 실험 조건을 동일하게 조성하기 어려움- 완전 동일하게 다시 똑같은 실험을 수행하는 것이 쉽지 않음 - 가설검정 ..
통계학 기초 정리 (5) : 상관계수(피어슨 상관계수, 스피어만 상관계수, 켄달타우 상관계수, 상호정보 상관계수)
·
기초통계
1. 피어슨 상관계수(Pearson Coefficient Correlation) 전형적인 선형 관계를 볼 수 있다. (비선형관계에서는 사용할 수 없다.) 어떤 숫자형태의 변수여야 한다. 숫자 형태의 값들은 연속적인 값을 가진다. 연속적인 값을 가지지 않으면 피어슨 상관계수를 쓸 수 없다.  -1에서 1의 값을 가지고, 1은 완전한 양의 상관관계 / -1 은 완전한 음의 상관관계 / 0은 상관관계가 없음  ✅파이썬에서 활용방법#피어슨 상관계수 계산pearson_corr, _ = pearsonr(df['Study Hours'], df['Exam Scores'])print(f"피어슨 상관계수: {pearson_corr}") 2. 비모수 상관계수(Nonparametric Correlation Coefficien..
통계학 기초 정리 (4) : 회귀분석(선형회귀, 다항회귀, 스플라인회귀)
·
기초통계
1. 회귀회귀(Regression): 경향선을 파악하고자 하는 것이다. ‼️회귀분석의 유래 회귀분석(Regression analysis)이라는 용어는 약 80여년 전 영국의 통계학자 갈톤(Galton)이 수행한 연구에서 유래되었다. 부모와 자식들 간의 키의 상관관계를 분석해 본 갈톤은 다음과 같은 재미있는 관계를 찾아내었다. 즉, 특이하게 큰 부모의 자식들은 대게 크긴 하되 부모들보다는 대부분 작았고, 특이하게 작은 부모들의 자식들은 대게 작긴 하되 부모들보다는 대부분 크다는 사실이다. 이러한 경향은 사람들의 키가 평균키로 회귀하려는 경향이 있음을 말하는 것인데, 바로 이 연구에서부터 회귀분석이라는 용어가 사용되게 되었다.(현대통계학, 김세헌) https://blog.naver.com/definitice..
통계학 기초 정리 (3) : 각종 검정 방법 (t검정, 다중 검정, 카이제곱 오류), 제 1종 오류와 제 2종 오류
·
기초통계
1. t검정두 집단 간의 평균 차이가 통계적으로 유의미한지 확인하는 검정 방법독립표본 t검정(Independent T - test) : 두 독립된 그룹의 평균을 비교대응표본 t검정(Paired T-test) : 동일한 그룹의 사전/사후 평균을 비교독립표본 t 검정은 두 집단이 서로 독립적인 경우에 사용 / 대응표본 t 검정은 두 집단이 서로 관련성이 있는 경우에 사용 ✅참고 자료  [Python / Study] 독립표본, 대응표본 t-test 공부하기1. 대응표본 대응표본이란 같은 대상에 대해 두 번의 측정을 한 후 두 측정치의 평균이 차이가 있는지 비교하는 통계적 방법입니다. 예를 들면 처치나 중재, 약물, 교육, 치료 등의 효과를 알아보jangcoding77.tistory.com  2. 다중 검정(m..
통계학 기초 정리 (2) : 모집단과 표본, 분포의 종류
·
기초통계
1. 모집단과 표본 (1) 모집단: 대상의 전체 집단(2) 표본: 모집단의 특성을 반영하여 선별한 일부전체 모집단을 조사하는 것은 비용과 시간이 많이 들고, 물리적으로 불가능한 경우가 많기 때문에 표본을 수집한다. 표본 데이터를 사용하는 것이 처리와 분석에 훨씬 용이함. 작은 표본에서는 데이터 품질을 더 쉽게 관리함표본 데이터를 사용해서 통계적 모델을 검증할 수 있음 전수조사표본조사모집단 전체를 조사. 시간과 비용이 많이 든다. 표본만 선별하여 조사. 표본이 대표성을 가져야 함 import numpy as np #Numpy 불러오기import matplotlib.pyplot as plt #시각화 도구#모집단 생성population = np.random.normal(170, 10, 1000) #표본 추출..