Note

빅데이터 분석기사 실기 예제 2 본문

Project/자격증

빅데이터 분석기사 실기 예제 2

알 수 없는 사용자 2021. 6. 4. 16:33
728x90

구글링과 알고 있는 지식을 토대로 작성한 것이기에 틀릴 수도 있으니 참고만 부탁드립니다.

주피터 노트북에서 작성한 것으로 실제 시험 환경과는 다를 수 있습니다.

 

주어진 데이터를 로드하고 테스트 데이터끼리 merge를 사용해서 합쳐준다. id 변수와 성별 변수는 당장 필요 없기 때문에 따로 저장해준다.

따로 저장한 변수들을 원래 데이터에서 빼고 다시 저장한다.

한글로 있는 데이터를 레이블 인코딩을 통해서 변환해준다.

환불금액에 존재하는 결측치에 대해서는 환불하지 않은 것으로 판단해서 금액 0으로 채워준다.

로지스틱 회귀분석을 사용해서 학습하고 예측한다.

예측 결과를 보면 0과 1이 존재하는데 0은 여자일 확률, 1은 남자일 확률이다.

예측 확률을 데이터 프레임 형태로 변환해주고 남자일 확률만 가져온다.

평가 기준인 roc_auc 스코어 적용을 해본모습이다. 예측 결과가 좋은 편은 아니다.

답안과 같이 출력하기 위해 테스트 아이디와 예측 확률을 하나로 합쳐준다. 칼럼명을 변경해주고 출력하면 아래와 같은 모습으로 출력된다.

출력 결과를 본인의 수험번호와 함께 저장해주면 끝이난다.

이를 통해 다른 분류 분석 방법을 사용해서 응용 후 결과가 좋은 분석을 제출하면 될 듯싶다.

자세한 답은 아니지만 다른 경우도 연습 중이다. 작업형 1 유형에 비해 어려운 듯하다. 백지상태에서 모든 것을 적어야 하니 많이 사용해보는 것이 좋을 듯하다.

Comments