728x90
반응형
1. 데이터 다운로드
(1) 링크 접속
https://www.kaggle.com/competitions/store-sales-time-series-forecasting/
Store Sales - Time Series Forecasting | Kaggle
www.kaggle.com
위 링크를 타고 들어가면 Kaggle의 해당 Competition 페이지가 나온다.
(2) Data 다운로드
Data 탭에 들어가 보면 데이터에 대한 설명과 다운로드할 수 있는 창이 나온다.
Download All 버튼을 누르면 모든 데이터가 다운로드하여진다.
(3) 데이터 설명 : kaggle 추출
- train.csv 학습 데이터
- ID, 날짜, 매장 번호, 품목, 총 판매량, 프로모션 중인 제품군의 총 품목 수
- test.csv 테스트 데이터
- 위와 같은 컬럼
- 학습 데이터의 마지막 날짜 이후 15일의 목표 매출 예측
- stores.csv 매장 데이터
- 도시, 주, 타입, 클러스터(비슷한 매장끼리 그룹핑한 것)
- oil.csv 유가 데이터
- 일일 유가. 훈련 및 테스트 데이터 기간 동안의 값을 모두 포함(에콰도르는 석유 의존도가 높은 국가로 유가 충격에 경제가 매우 취약)
- holidays_events.csv 공휴일 데이터
- 공휴일
- Additional Notes 추가 참고 사항
- 공공 부문의 임금은 2주에 한 번씩 15일과 매월 말일에 지급. 이로 인해 슈퍼마켓 매출이 영향을 받을 수 있음
- 2016년 4월 16일 에콰도르에서 규모 7.8의 지진이 발생. 지진 발생 후 몇 주 동안 슈퍼마켓 매출에 큰 영향을 미쳤던 생수 및 기타 생필품을 기부하는 이벤트가 있었음
- 54개의 매장, 33개의 품목
- 2013-01-01 ~ 2017-08-31의 데이터
- 유가에 따라 영향받는 품목
- 계절, 이벤트에 따라 매출 추세 차이 비교
- 판매 패턴 분석
2. Google Drive의 Colab에 데이터 연동
Google Drive에 새로운 폴더를 만들어 데이터 파일을 업로드하자.
이제 다음 단계에서는 데이터 정의서를 만들어 보자.
728x90
반응형