본문 바로가기

데이터분석캠프 TIL

(39)
241209 TIL 파이썬 (리스트, 튜플, 딕셔너리) 1. 개요딕셔너리: 사전 같은 구조리스트와 튜플은 결과를 변경가능 한지 아닌지의 차이다.   데이터 분석을 할 때 다양하고 많은 데이터들을 다루어야 하는데 이런 데이터들을 구조화하고 조작하기 위해 리스트, 튜플, 딕셔너리는 반드시 필요하다.  ❗이점데이터를 담고, 정리하고, 꺼낼 때 필요하다.  설명딥러닝 모델을 반복 학습하며 결과를 리스트에 추가데이터 불러올때, 경로 처리할때 split 사용데이터를 임의의 범위만큼 선택할때 슬라이싱, 인덱싱 사용 데이터를 변경 불가능하게 사용하고 싶을 때데이터를 담는 하나의 방법 목적주로 맨 처음 데이터를 불러오고 가공할 때 사용결과를 저장할 때 많이 사용 결과물 기대효과데이터를 자유자재로 다룰 수 있고 정리할 수 있다  2. 리스트(List)?리스트는 파이썬에서 가장..
241202_ 데이터 분석 과정(JOIN, UNION, SUBQUERY, 윈도우 함수 ) 1. JOIN - 조인은 두 개 이상의 테이블에서 데이터를 결합하여 원하는 정보를 추출하는 SQL 작업- 테이블들이 각각 분리된 정보를 갖고 있을 때, 공통 컬럼을 통해 데이터를 결합할 수 있습니다.- 엑셀 VLOOKUP과 비슷한 기능 테이블들이 각각 분리된 정보를 갖고 있을 때, 공통 컬럼을 통해 데이터를 결합하여 전체적인 통찰을 제공합니다.  1.1 JOIN의 종류(1) INNER JOIN: 두 테이블의 공통된 데이터만 조회 (2) LEFT JOIN: 왼쪽 테이블의 모든 행을 반환하며, 오른쪽에 없는 데이터는 NULL로 표시 1.2 기타 JOIN RIGHT JOIN: LEFT JOIN의 정반대로, 오른쪽 테이블을 기준으로 반환→ 실무에서는 거의 사용 X엑셀의 VLOOKUP처럼 왼쪽을 중심으로 필요한 ..
241129 (TIL_데이터 분석 과정_ WIL) 👉 문자 변경REPLACE : 지정한 문자를 다른 문자로 변경SUBSTRING : 특정 문자만 추출CONCAT : 여러 문자를 합하여 포맷팅👉 조건문IF : if(조건, 조건을 충족할 때, 조건을 충족하지 못할 때) CASE WHEN END : case when 조건1 then 값(수식)1          when 조건2 then 값(수식)2          else 값(수식)3          end  오늘은 1주차가 마무리 되었다. 12시간 씩 매일 공부한 것은 이번이 처음이라서 낯설기도 하고 힘들기도 했다. 이번 과정을 통해 내가 어떤 커리어로 나아가야 하는 지 고민해 보아야 겠다.
241128 TIL_데이터 분석 과정(SQL - 집계함수, GROUP BY, HAVING, LAND, ORDER BY) 1.집계함수: 여러 행에서 단일 결과값을 반환하는 함수-  MIN, MAX는 숫자뿐만 아니라 날짜 데이터에도 사용 - 대부분의 집계함수는 NULL값을 제외하고 작동. / 예외) COUNT(*)는 NULL을 포함한다.  함수컬럼COUNT데이터의 행 수를 반환COUNT(DISTINCT 컬럼)고유한 값을 갖는 데이터의 행 수 반환 SUM열의 값을 모두 더함AVG열 값의 평균 계산MIN열 값 중 최소값 반환MAX열 값 중 최대값 반환 -- 데이터의 행 수 세기SELECT COUNT(*) AS row_countFROM employees;-- NULL 포함여부에 따른 COUNT 차이SELECT COUNT(*) AS total_rows, -- NULL 포함 COUNT(salary) AS non_null_..
241127 TIL_ 데이터 분석 과정(SQL 강의 2주차 WHERE, NULL, ORDER BY, GROUP BY, DISTINCT, LIMIT) 1. 명명 규칙 - 좋은 명명 규칙> 간결하게 의미를 담아서 테이블명은 데이터의 내용을 나타내야 한다. 컬럼명은 각 데이터의 성격을 명확히 표현해야 한다.  > 일관된 형식 유지 소문자 사용: 일관성을 위해 모두 소문자를 사용한다. 스네이크 케이스: 단어 사이를 밑줄(_)로 구분한다.   2. 주석 처리? 주석의 역할코드의 목적 설명: 특정 데이터를 조회하는 이유나 필터링 조건의 의도실행 방지: 테스트중인 쿼리의 실행을 막기 위해 주석 처리 가독성 증가: 복잡한 쿼리는 섹션별로 주석을 추가해 가독성 증가 (1) /**/ 를 통한 주석: Ctrl + Shift + / 전체적으로 주석을 달고자 할 때 사용함 /* 특정 사용자 데이터를 조회SELECT user_name, emailFROM usersWHERE ..
241126 TIL - 데이터 분석 과정(SQL 강의 1주차, 직무 세션) 오늘은 SQL은 강의를 처음으로 진행한 날이다. 더불어 직무 세션 4회를 연달아 진행한 날이었다.  오늘의 일과코드카타 1일차아티클 1개 읽기SQL 라이브 세션 2회SQL 제공되는 강의 수강 발표 자료 준비 오늘 배운 내용의 대부분은 SQL의 기본적인 정의에 대한 내용이었다.  가장 먼저 SQL이 필요한 이유부터 정리해 보자면, SQL 은 데이터베이스와 대화를 하기 위한 언어이다. 옆의 사람에게 필요한 것을 요청할 때 ‘A 를 주시겠어요?’ 와 하는 것과 같이 데이터베이스에게도 ‘A를 주겠니?’ 라고 이야기할 때 사용하는 언어로 - 내가 찾고자 하는 내용을 코드를 넣어 찾아내는 것이다. 데이터베이스를 찾기 위해 Query를 입력하는데,  데이터베이스(DB)에 있는 정보를 요청하고 필요한 결과를 얻기 위해..
241125 TIL - 데이터 분석 과정(OT, 데이터분석 직무 설명회, CRM 마케팅 직무 분석) 오늘 내일배움캠프 데이터 분석 과정 개강일이었다. 첫 날이다보니 주로 향후 운영방식에 대해 설명해주는 OT와 팀원 소개, 팀 내 향후 계획 수립 등 앞으로 어떤 방식으로 진행할 지에 대한 내용들을 주로 나누었다. 그리고 각자 취업하고자 하는 직무의 조사를 하는 시간을 가졌다.  일정표 09:00 ~ 12:00 온보딩 OT 12:00 ~ 13:00 팀원 확인 & 멤버카드 작성 / 향후 계획 수립 14:00 ~ 15:00 데이터 분석 직무 라이브 세션 15:00 ~ 18:00 직무 조사 - 개인18:00 ~ 21:00 직무 조사 발표, 발표 방향성 계획 / 향후 일정 수립  온보딩은 오전 시간 내내 진행되었는데, 생각보다 내용이 정말 많았다. 세 시간 가까이 설명해주신 매니저님이 대단하다는 생각이 들었다. ..