250117 TIL 데이터분석과정 - 머신러닝...통계학...
·
데이터분석캠프 TIL
1. 회고  드디어 지옥같던 한 주가 지나갔다. 흐아ㅏ아악 머신러닝! 그리고 파이썬 베이직반에서 챌린지반으로 넘어가서 수업을 듣고 있는데, API로 데이터를 긁어올 수 있다는 게 흥미로웠다. 파이썬으로 할 수 있는 일이 이렇게 무궁무진하다니 더 잘 다뤄서 해낼 수 있는 역량을 넓히고 싶다. 문제는 머신러닝이 나에게 굉장히 받아들이기 어려운 신식 개념으로...익숙해지지 않는다. 뭔가 머신러닝이 주는 어감 때문에 무서워서이지 않을까 싶고, 간단하게 프로그램을 학습시켜서 예측할 수 있도록 만들어내는 걸 짠다고 생각하면 좋을 것 같은데 생소한 개념이라서 와닿지 않는 것 같다. 아직 부족한 통계 지식도 마찬가지고..어제 류근관 교수님의 통계학이랑 양승화님께서 쓰신 그로스 해킹 책을 새로이 구입했다. 공부할 게 많..
250110 TIL 데이터 분석과정 (QCC만 하다가 하루가 끝난...)
·
데이터분석캠프 TIL
1. 오늘의 목표🎯 이제 슬슬 포트폴리오에 자료들을 붙여넣으려고 하는데, 할 게 많아서 정신이 없다. 아직 모르는 게 너무 많은 느낌이다. 그래도 통계학 기초 강의는 어제부로 완강하였고, 이제 실습을 다시 한 번 풀어보면서 파이썬에 적용하는 방법을 연습하려고 한다. 남는 시간은 틈틈히 파이썬이랑 sql복습하기! 2. 회고📝오늘 하루는 QCC문제만 풀다가 하루가 다 간 것 같다.문제를 푸는데 concat 함수 적용하는 방법이 생각이 안나는 것이다..코드를 돌려봐도 계속 first name과 last name만 결과에 출력되어서 진심 당황했다. 그래서 한 문제 겨우 제출하고 도망갔더니 매니저님이 따라오심ㅋㅋㅋ 왜 출력이 안되었나 하니 컬럼에 따옴표을 씌워서 출력했기 때문.. 그냥 문자열만 붙이려면 따옴표..
통계학 기초 정리 (2) : 모집단과 표본, 분포의 종류
·
기초통계
1. 모집단과 표본 (1) 모집단: 대상의 전체 집단(2) 표본: 모집단의 특성을 반영하여 선별한 일부전체 모집단을 조사하는 것은 비용과 시간이 많이 들고, 물리적으로 불가능한 경우가 많기 때문에 표본을 수집한다. 표본 데이터를 사용하는 것이 처리와 분석에 훨씬 용이함. 작은 표본에서는 데이터 품질을 더 쉽게 관리함표본 데이터를 사용해서 통계적 모델을 검증할 수 있음 전수조사표본조사모집단 전체를 조사. 시간과 비용이 많이 든다. 표본만 선별하여 조사. 표본이 대표성을 가져야 함 import numpy as np #Numpy 불러오기import matplotlib.pyplot as plt #시각화 도구#모집단 생성population = np.random.normal(170, 10, 1000) #표본 추출..
241202_ 데이터 분석 과정(JOIN, UNION, SUBQUERY, 윈도우 함수 )
·
데이터분석캠프 TIL
1. JOIN - 조인은 두 개 이상의 테이블에서 데이터를 결합하여 원하는 정보를 추출하는 SQL 작업- 테이블들이 각각 분리된 정보를 갖고 있을 때, 공통 컬럼을 통해 데이터를 결합할 수 있습니다.- 엑셀 VLOOKUP과 비슷한 기능 테이블들이 각각 분리된 정보를 갖고 있을 때, 공통 컬럼을 통해 데이터를 결합하여 전체적인 통찰을 제공합니다.  1.1 JOIN의 종류(1) INNER JOIN: 두 테이블의 공통된 데이터만 조회 (2) LEFT JOIN: 왼쪽 테이블의 모든 행을 반환하며, 오른쪽에 없는 데이터는 NULL로 표시 1.2 기타 JOIN RIGHT JOIN: LEFT JOIN의 정반대로, 오른쪽 테이블을 기준으로 반환→ 실무에서는 거의 사용 X엑셀의 VLOOKUP처럼 왼쪽을 중심으로 필요한 ..
241128 TIL_데이터 분석 과정(SQL - 집계함수, GROUP BY, HAVING, LAND, ORDER BY)
·
데이터분석캠프 TIL
1.집계함수: 여러 행에서 단일 결과값을 반환하는 함수-  MIN, MAX는 숫자뿐만 아니라 날짜 데이터에도 사용 - 대부분의 집계함수는 NULL값을 제외하고 작동. / 예외) COUNT(*)는 NULL을 포함한다.  함수컬럼COUNT데이터의 행 수를 반환COUNT(DISTINCT 컬럼)고유한 값을 갖는 데이터의 행 수 반환 SUM열의 값을 모두 더함AVG열 값의 평균 계산MIN열 값 중 최소값 반환MAX열 값 중 최대값 반환 -- 데이터의 행 수 세기SELECT COUNT(*) AS row_countFROM employees;-- NULL 포함여부에 따른 COUNT 차이SELECT COUNT(*) AS total_rows, -- NULL 포함 COUNT(salary) AS non_null_..
241127 TIL_ 데이터 분석 과정(SQL 강의 2주차 WHERE, NULL, ORDER BY, GROUP BY, DISTINCT, LIMIT)
·
데이터분석캠프 TIL
1. 명명 규칙 - 좋은 명명 규칙> 간결하게 의미를 담아서 테이블명은 데이터의 내용을 나타내야 한다. 컬럼명은 각 데이터의 성격을 명확히 표현해야 한다.  > 일관된 형식 유지 소문자 사용: 일관성을 위해 모두 소문자를 사용한다. 스네이크 케이스: 단어 사이를 밑줄(_)로 구분한다.   2. 주석 처리? 주석의 역할코드의 목적 설명: 특정 데이터를 조회하는 이유나 필터링 조건의 의도실행 방지: 테스트중인 쿼리의 실행을 막기 위해 주석 처리 가독성 증가: 복잡한 쿼리는 섹션별로 주석을 추가해 가독성 증가 (1) /**/ 를 통한 주석: Ctrl + Shift + / 전체적으로 주석을 달고자 할 때 사용함 /* 특정 사용자 데이터를 조회SELECT user_name, emailFROM usersWHERE ..
241126 TIL - 데이터 분석 과정(SQL 강의 1주차, 직무 세션)
·
데이터분석캠프 TIL
오늘은 SQL은 강의를 처음으로 진행한 날이다. 더불어 직무 세션 4회를 연달아 진행한 날이었다.  오늘의 일과코드카타 1일차아티클 1개 읽기SQL 라이브 세션 2회SQL 제공되는 강의 수강 발표 자료 준비 오늘 배운 내용의 대부분은 SQL의 기본적인 정의에 대한 내용이었다.  가장 먼저 SQL이 필요한 이유부터 정리해 보자면, SQL 은 데이터베이스와 대화를 하기 위한 언어이다. 옆의 사람에게 필요한 것을 요청할 때 ‘A 를 주시겠어요?’ 와 하는 것과 같이 데이터베이스에게도 ‘A를 주겠니?’ 라고 이야기할 때 사용하는 언어로 - 내가 찾고자 하는 내용을 코드를 넣어 찾아내는 것이다. 데이터베이스를 찾기 위해 Query를 입력하는데,  데이터베이스(DB)에 있는 정보를 요청하고 필요한 결과를 얻기 위해..
241125 TIL - 데이터 분석 과정(OT, 데이터분석 직무 설명회, CRM 마케팅 직무 분석)
·
데이터분석캠프 TIL
오늘 내일배움캠프 데이터 분석 과정 개강일이었다. 첫 날이다보니 주로 향후 운영방식에 대해 설명해주는 OT와 팀원 소개, 팀 내 향후 계획 수립 등 앞으로 어떤 방식으로 진행할 지에 대한 내용들을 주로 나누었다. 그리고 각자 취업하고자 하는 직무의 조사를 하는 시간을 가졌다.  일정표 09:00 ~ 12:00 온보딩 OT 12:00 ~ 13:00 팀원 확인 & 멤버카드 작성 / 향후 계획 수립 14:00 ~ 15:00 데이터 분석 직무 라이브 세션 15:00 ~ 18:00 직무 조사 - 개인18:00 ~ 21:00 직무 조사 발표, 발표 방향성 계획 / 향후 일정 수립  온보딩은 오전 시간 내내 진행되었는데, 생각보다 내용이 정말 많았다. 세 시간 가까이 설명해주신 매니저님이 대단하다는 생각이 들었다. ..