머신러닝 심화 (1) : 인코딩, 스케일링
·
머신러닝
1. 인코딩 어떤 정보를 정해진 규칙에 따라 변환하는 것을 의미한다. (1) 레이블 인코딩모델이 처리하기 쉬운 수치형으로 데이터 변환 실제로는 그렇지 않은데, 순서 간 크기에 의미가 부여되어 모델이 잘못 해석 할 수 있음. sklearn.preprocessing.LableEncoder - 메소드- fit: 데이터 학습- transform: 정수형 데이터로 변환 - fit_transform: fit과 transform을 연결하여 한번에 실행 - inverse_transform: 인코딩된 데이터를 원래 문자열로 반환 (2) 원-핫 인코딩(One-Hot Encoding) 각 범주를 이진 형식으로 표현하는 기법 장점: 각 범주가 독립적으로 표현되어, 순서가 중요도를 잘못 학습하는 것을 방지. 명목형 데이터에..