목록Project (9)
Note

구글링과 알고 있는 지식을 토대로 작성한 것이기에 틀릴 수도 있으니 참고만 부탁드립니다. 주피터 노트북에서 작성한 것으로 실제 시험 환경과는 다를 수 있습니다. 주어진 데이터를 로드하고 테스트 데이터끼리 merge를 사용해서 합쳐준다. id 변수와 성별 변수는 당장 필요 없기 때문에 따로 저장해준다. 따로 저장한 변수들을 원래 데이터에서 빼고 다시 저장한다. 한글로 있는 데이터를 레이블 인코딩을 통해서 변환해준다. 환불금액에 존재하는 결측치에 대해서는 환불하지 않은 것으로 판단해서 금액 0으로 채워준다. 로지스틱 회귀분석을 사용해서 학습하고 예측한다. 예측 결과를 보면 0과 1이 존재하는데 0은 여자일 확률, 1은 남자일 확률이다. 예측 확률을 데이터 프레임 형태로 변환해주고 남자일 확률만 가져온다. 평..

구글링과 알고 있는 지식을 토대로 작성한 것이기에 틀릴 수도 있으니 참고만 부탁드립니다. Q. mtcars 데이터셋의 qsec 칼럼을 최소 최대 척도로 변환한 후 0.5보다 큰 값을 가지는 레코드 수를 구하시오. 필요한 라이브러리를 로딩하고 데이터를 불러와 데이터 프레임 형태로 저장을 한다. head()를 통해 데이터가 잘 불러와진 모습을 확인할 수 있다. iloc를 이용해서 필요한 칼럼만을 가져온다. head()로 확인해보니 qsec를 잘 가져온 것을 알 수 있다. sklearn 내장 함수를 사용해서 min-max 스케일을 한 모습이다. min-max 스케일은 값에 따라 0에서 1사이의 값으로 표현하는 것이다. 값들 중에 0.5보다 큰 값을 answer에 저장하고 출력해보면 조건에 맞는 값들은 True..
작년 12월 빅데이터 분석기사를 준비하고 있던 와중에 시험 4일 전 취소 통보를 받았습니다. 2회 시험으로 넘어간다는 이야기를 듣고 허무했지만 내년에 다시 준비를 해보자라고 생각했습니다. 그래도 어느 정도 데이터 분야에 관심이 생겨서 3월에 ADsP 시험을 보고 4월 빅데이터 분석기사는 모의고사 느낌으로 보고 오자라는 생각을 많이 했습니다. 첫 시행하는 시험이라 정보가 부족했고 출간되는 책마다 중점적으로 다루는 내용도 달라서 의욕도 크게 없었습니다. 한 가지 다행이라고 생각했던건 ADsP와 같은 기관에서 주관하는 시험이라는 것뿐이었습니다. 시험 당일 가서 문제를 받았는데 통계와 관련된 문제가 많이 나와서 당황을 했으나 3월에 ADsP를 준비했던 게 도움이 되었고 작년에 kmooc에서 들었던 빅데이터 관련..
www.dataedu.kr/product/adsp-%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B6%84%EC%84%9D-%EC%A4%80%EC%A0%84%EB%AC%B8%EA%B0%80-2021-%EC%99%84%EC%A0%84%EA%B0%9C%EC%A0%95%ED%8C%90-2/ ADsP 데이터분석 준전문가 2021 완전개정판 – 데이터에듀(dataedu) 저자 정보 동국대학교 산업공학과에서 데이터마이닝으로 박사 학위를 취득 후, 나이스디앤비에서 기업평가 모형 컨설팅실 실장으로 근무하며 외환은행과 신한은행 등의 국내/해외기업 신용평 www.dataedu.kr 자격증 준비를 할 때 고민을 가장 많이 했던 것이 바로 교재이다. 여기저기 후기도 찾아보고 주변 사람들에게 정보를 구해서 결정한 책이..