데이터 전처리를 위한 판다스(Pandas) - 데이터 조회
·
PYTHON
1. 데이터 확인1-1 데이터 조회head () 앞 부분 tail () 뒷 부분 조회 해당 함수들로 가장 앞과 뒤의 데이터를 원하는 갯수만큼 확인할 수 있음. 갯수를 지정하지 않을 경우 default옵션으로 5개부터 조회된다. df.head(3) #앞의 3개의 행 조회df.tail(3) #뒤의 3개의 행 조회1-2 컬럼 정보 확인info ()컬럼별로 정보를 확인하고자 할 때 사용(인덱스, 컬럼명, 컬럼의 데이터 개수, 데이터 타입, null값 확인)   value_counts() column 별 값의 분포를 확인할 때 사용df['column'].value_counts() 1-3 데이터프레임 속성 확인 - Index: 데이터프레임 또는 시리즈의 각 행 또는 각 요소에 대한 식별자  - dtypes: 컬럼별..
데이터 전처리를 위한 - 판다스(Pandas) 기초
·
PYTHON
판다스 기초1. 판다스는 무엇인가? 관계형 또는 레이블이 된 데이터, 아래와 같은 형식의 데이터를 분석하는데 적합한 PYTHON 패키지이다. SQL 테이블 또는 Excel 스프레드 시트에서와 같은 열과 행으로 이루어진 테이블 형식 데이터정렬되고 정렬되지 않은 시계열 데이터다른 형태의 관찰 / 통계 데이터 세트 ✅판다스 설치방법이전에 Visual Studio와 Python이 컴퓨터에 설치되어 있어야 하며, Visual Studio에서 Jupyter와 Python도 설치해주어야 한다.  1) 터미널이나 코드창에 아래의 코드를 입력하면, 밑에 주루룩 무언가 설치되었다는 문구들이 뜬다. pip install pandas 2) 그 다음 아래의 코드를 입력한다.import pandas as pd # pandas 라..