K-fold 교차검증 방법들
본 포스팅은 아래 블로그를 참고했습니다.
- https://continuous-development.tistory.com/166
Python cross validation 방법
- sklearn의 kfold : 일정한 간격으로 잘라서 사용
from sklearn.model_selection import KFold
kfold = KFold(n_splits=5)
for train_idx, test_idx in kfold.split(features):
X_train, X_test = features[train_idx], features[test_idx]
y_train, y_test = label[train_idx], label[test_idx]
- sklearn의 StratifiedKFold : 속성값의 개수를 동일하게 가져감으로 데이터가 한곳에 몰리는것을 방지
from sklearn.model_selection import KFold
kfold = StratifiedKFold(n_splits=5)
for train_idx, test_idx in kfold.split(features,label):
X_train, X_test = features[train_idx], features[test_idx]
y_train, y_test = label[train_idx], label[test_idx]