통계학 기초 정리 (2) : 모집단과 표본, 분포의 종류
·
기초통계
1. 모집단과 표본 (1) 모집단: 대상의 전체 집단(2) 표본: 모집단의 특성을 반영하여 선별한 일부전체 모집단을 조사하는 것은 비용과 시간이 많이 들고, 물리적으로 불가능한 경우가 많기 때문에 표본을 수집한다. 표본 데이터를 사용하는 것이 처리와 분석에 훨씬 용이함. 작은 표본에서는 데이터 품질을 더 쉽게 관리함표본 데이터를 사용해서 통계적 모델을 검증할 수 있음 전수조사표본조사모집단 전체를 조사. 시간과 비용이 많이 든다. 표본만 선별하여 조사. 표본이 대표성을 가져야 함 import numpy as np #Numpy 불러오기import matplotlib.pyplot as plt #시각화 도구#모집단 생성population = np.random.normal(170, 10, 1000) #표본 추출..
통계학 기초 정리 (1) : 기술통계와 추론통계, 상관관계와 인과관계, 자료형의 종류
·
기초통계
1. 통계가 데이터 분석에 중요한 이유→ 데이터를 분석하고 이를 바탕으로 의사결정을 내릴 수 있음 2. 통계학의 분류: 기술통계와 추론통계기술통계: 회사의 매출 데이터를 요약하고 설명하는 통계 방법 / 계산하는 것데이터를 특정 대표값으로 요약하는 것평균, 중앙값, 분산, 표준편차1. 평균(Mean): 데이터의 중앙값, 모든 데이터를 더한 후 데이터의 개수로 나누는 것- 데이터의 일반적인 경향을 파악할 때 유용함2. 중앙값(Median): 데이터셋을 크기 순서대로 정렬했을 때 중앙에 위치한 값- 이상치에 영향을 덜 받기 때문에 데이터의 중심 경향을 나타내는 또 다른 방법 3. 분산(Variance): 분산은 데이터 값들이 평균으로부터 얼마나 떨어져 있는 지를 나타내는 척도, 데이터의 흩어짐 정도- 각 데이..