목록Machine Learning (45)
Note

8. Reshaping (1) stack - 데이터 쌓기 tuples와 index 생성 zip은 묶어서 재배열해주는 함수, 특수한 경우에 사용한다. 랜덤한 수를 이용해 df라는 데이터 프레임 생성 데이터 프레임 df를 4행까지 분리해서 df2에 지정해준다. 그다음 stack()을 사용하면 밑으로 데이터가 쌓인 형태를 볼 수 있다. unstack()을 사용하면 원래의 데이터 형태로 되돌릴 수 있다. 여기서, unstack(0)이나 unstack(1)을 사용하면 다양한 옵션으로 바꿀 수 있다. unstack(0)과 unstack(1)을 사용한 모습인데 원래 데이터 형태와 다른 것을 알아볼 수 있다. (2) Pivot tables(*중요!) 데이터 프레임 df 생성 pivot=기준, 기준을 잡아서 재배치한다...

3. Selection (2) Selection by label : loc[] 데이터를 여러 개를 선택할 때는 리스트 형태로 입력해야 한다. 범위와 부분, 범위와 범위로 선택할 수 있다. (3) Selection by position : iloc[] (위치 기반) 데이터 프레임을 생성하고 위치 번호를 통해 특정 데이터를 가져올 수 있다. 특정 위치만 원할 경우 리스트로 작성을 하고 , 뒤에 :를 사용할 경우 모든 범위를 지정한다는 뜻이다. (4) Boolean indexing(조건에 맞는 값 가져오기) df['A']와 df 전체에서 0보다 큰 값을 찾아내는 방법이다. 0보다 작은 값을 가지는 경우는 NaN으로 표현한다. df를 df2에 복사해서 저장하고 df2에 새로운 변수 E를 추가한다. 데이터 프레임..

1. Object creation (1) Series 데이터 생성 (2) s에서 0번 데이터 (3) date 변수 생성 20130101부터 6일 동안의 날짜 생성. 디폴트는 freq='D' 값이며 여기서 'D'는 Day를 의미한다. (4) 데이터프레임 생성 여기서 데이터프레임은 두 가지 이상의 데이터가 결합한 형태를 말한다. 6행 4열로 랜덤한 수를 생성하고 df라는 데이터 프레임에 저장한다. index는 기준을 뜻하며, dates로 위에서 생성한 날짜 변수이다. columns는 컬럼의 이름으로 ABCD를 지정했다. 새로운 df2라는 데이터프레임 생성. 각각의 컬럼에 데이터를 지정해서 생성 후 데이터 프레임을 출력한 모습이다. 2. Viewing data (1) df.head() & df.tail() 데..
1. 주피터 노트북 (1) 파일 위치 보기 - pwd 실행 (2) 간단한 단축키 셀 모드 변환 단축키 markdown : M - 제목 code : y - 코드 raw : r - 메모장 단축키를 위한 밖 누르기 - esc 커서입력 - enter 셀 지우기 - dd 셀 복원 - z (3) 데이터의 종류 - 숫자형, 문자열 2. 숫자형 데이터(int, float) - 간단한 사칙연산 1+2 더하기 4-2 빼기 20/2 나누기 40//3 나누기의 몫 40%3 나누기 나머지 3. 문자열 데이터(string) (1) 문자열 데이터끼리 더하기, 곱하기가 가능하다. (2) 문자열안에 작은따옴표 넣기 (3) 문자열로 바꿔주는 함수 : str() 4. 여러 줄을 출력할 때는 print함수 사용 5. 주로 리스트와 딕셔너리..