728x90
반응형
1. 라이브러리 패키지 import 시키기
- 기본 패키지
- numpy
- pandas
- os
- gc
- warnings
- 통계 분석 패키지
- statsmodels.api
- skitlearn
- 시각화 패키지
- matplotlib.pyplot
- seaborn
- plotly.express
- 기타 세부 설정
- 열 이름 표시
- 과학적 표기법 사용 안 함
- 경고메시지 비활성화 등
2. Google Drive 연결 및 데이터 불러오기
- Google Drive 연결
- 데이터 불러오기
- object타입을 DateTime으로 설정 및 Date Types 변환
- 불러온 Data 확인
3. 탐색적 자료 분석 ( EDA )
- 데이터 전처리 : 임시 데이터 생성
- 결측값 처리
- 시각화를 통한 데이터 이해
- 상관분석을 통한 변수 간의 관계 파악
- 그룹핑
- 중간마다. shape를 사용하여 데이터의 변화 확인
- 추출 및 제거
4. ML
- 변수 선택
- 모델 생성
- 모델 학습
- 모델 검증
5. Sumission 파일 생성
728x90
반응형