Note
학습 / 테스트 데이터 본문
728x90
학습 데이터로 잘못된 예측 케이스
필요한 라이브러리를 임포트 하고 학습 데이터를 세팅한다.
디시전트리 객체를 생성하고 학습 데이터로 학습한 후 그 데이터를 기반으로 예측을 수행했다.
그 결과는 예측 정확도 100%이다. 그 이유는 학습한 데이터를 그대로 가지고 예측을 하기 때문에 정확도가 높을 수밖에 없다.
테스트 데이터로 실행하기 위해 데이터 준비를 하고 학습과 테스트 데이터를 분리한다.
모델 학습 한 후 테스트 데이터로 예측을 한 결과 95.56%가 나왔다. 이전보다 정확도가 떨어진 건 사실이지만 그래도 높은 정확도 수치이다.
위 코드와 같이 pandas를 통해서도 데이터 분할이 가능하다.
피처와 타겟을 정의하고 데이터를 나눈 모습이다.
머신러닝 모델을 정의하고 학습한 후 테스트 데이터로 예측한 결과인데 정확도가 똑같은 것을 알 수 있다.
'Machine Learning' 카테고리의 다른 글
데이터 전처리 (0) | 2021.05.10 |
---|---|
교차 검증 (0) | 2021.05.07 |
Numpy (넘파이) (0) | 2021.05.06 |
파이썬과 머신 러닝 (0) | 2021.05.05 |
pandas다루기_보스톤마라톤(캐글 데이터) (0) | 2021.04.28 |
Comments