Project/Kaggle

[Python Project (Store Sales - Time Series Forecasting)] 2. 데이터 다운로드 및 google drive 업로드

CocoJamjam 2023. 4. 20. 17:20
728x90
반응형

1. 데이터 다운로드

 (1) 링크 접속

https://www.kaggle.com/competitions/store-sales-time-series-forecasting/

 

Store Sales - Time Series Forecasting | Kaggle

 

www.kaggle.com

위 링크를 타고 들어가면 Kaggle의 해당 Competition 페이지가 나온다.

 (2) Data 다운로드

 Data 탭에 들어가 보면 데이터에 대한 설명과 다운로드할 수 있는 창이 나온다.

Download All 버튼을 누르면 모든 데이터가 다운로드하여진다.

 

(3) 데이터 설명 : kaggle 추출

  • train.csv 학습 데이터
  • ID, 날짜, 매장 번호, 품목, 총 판매량, 프로모션 중인 제품군의 총 품목 수
  • test.csv 테스트 데이터
  • 위와 같은 컬럼
  • 학습 데이터의 마지막 날짜 이후 15일의 목표 매출 예측
  • stores.csv 매장 데이터
  • 도시, 주, 타입, 클러스터(비슷한 매장끼리 그룹핑한 것)
  • oil.csv 유가 데이터
  • 일일 유가. 훈련 및 테스트 데이터 기간 동안의 값을 모두 포함(에콰도르는 석유 의존도가 높은 국가로 유가 충격에 경제가 매우 취약)
  • holidays_events.csv 공휴일 데이터
  • 공휴일
  • Additional Notes 추가 참고 사항
  • 공공 부문의 임금은 2주에 한 번씩 15일과 매월 말일에 지급. 이로 인해 슈퍼마켓 매출이 영향을 받을 수 있음
  • 2016년 4월 16일 에콰도르에서 규모 7.8의 지진이 발생. 지진 발생 후 몇 주 동안 슈퍼마켓 매출에 큰 영향을 미쳤던 생수 및 기타 생필품을 기부하는 이벤트가 있었음
  • 54개의 매장, 33개의 품목
  • 2013-01-01 ~ 2017-08-31의 데이터
  • 유가에 따라 영향받는 품목
  • 계절, 이벤트에 따라 매출 추세 차이 비교
  • 판매 패턴 분석

2. Google Drive의 Colab에 데이터 연동

Google Drive에 새로운 폴더를 만들어 데이터 파일을 업로드하자.

이제 다음 단계에서는 데이터 정의서를 만들어 보자.

 

728x90
반응형