Note

학습 / 테스트 데이터 본문

Machine Learning

학습 / 테스트 데이터

알 수 없는 사용자 2021. 5. 6. 17:26
728x90

학습 데이터로 잘못된 예측 케이스

필요한 라이브러리를 임포트 하고 학습 데이터를 세팅한다.

디시전트리 객체를 생성하고 학습 데이터로 학습한 후 그 데이터를 기반으로 예측을 수행했다.

그 결과는 예측 정확도 100%이다. 그 이유는 학습한 데이터를 그대로 가지고 예측을 하기 때문에 정확도가 높을 수밖에 없다.

테스트 데이터로 실행하기 위해 데이터 준비를 하고 학습과 테스트 데이터를 분리한다.

모델 학습 한 후 테스트 데이터로 예측을 한 결과 95.56%가 나왔다. 이전보다 정확도가 떨어진 건 사실이지만 그래도 높은 정확도 수치이다.

위 코드와 같이 pandas를 통해서도 데이터 분할이 가능하다.

피처와 타겟을 정의하고 데이터를 나눈 모습이다.

머신러닝 모델을 정의하고 학습한 후 테스트 데이터로 예측한 결과인데 정확도가 똑같은 것을 알 수 있다.

'Machine Learning' 카테고리의 다른 글

데이터 전처리  (0) 2021.05.10
교차 검증  (0) 2021.05.07
Numpy (넘파이)  (0) 2021.05.06
파이썬과 머신 러닝  (0) 2021.05.05
pandas다루기_보스톤마라톤(캐글 데이터)  (0) 2021.04.28
Comments