![](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FcRJonP%2FbtsLS9WTRLF%2FscjZO9GMg6Xrb9IRkjWXbK%2Fimg.png)
머신러닝 심화 (2) : 데이터 분리
·
머신러닝
1. 데이터 분리 과대적합(Overfitting): 데이터를 너무 과도하게 학습한 나머지 해당 문제만 잘 맞추고 새로운 현상은 잘 맞추지 못하는 경우과소 적합: 모형이 지나치게 단순할 때 과대 적합: 모형이 지나치게 복잡할 때학습 데이터(Train Data): 모델을 학습(fit)하기 위한 데이터테스트 데이터(Test Data): 모델을 평가 하기 위한 데이터함수 및 파라미터 설명 sklearn.model_selection.train_test_split파라미터test_size: 테스트 데이터 세트 크기train_size: 학습 데이터 세트 크기shuffle: 데이터 분리 시 섞기random_state: 호출할 때마다 동일한 학습/테스트 데이터를 생성하기 위한 난수 값. 수행할 때 마다 동일한 데이터 세트..