728x90
반응형

Project/Kaggle 11

[Python Project (Store Sales - Time Series Forecasting )] 10. Resume

Kaggle_Competition Store Sales - Time Series Forecasting Streamlit 링크 데모 시연 포트 폴리오 1.프로젝트의 시작 (2023.04.20 ~ 2023.05.17) Kaggle Competition : Store Sales - Time Series Forecasting ( Use machine learning to predict grocery sales ) 링크 : Kaggle page 2. 대회 목표 : 식료품 소매업체의 데이터로 매장 매출을 예측 ( 시계열 예측) 여러 매장에서 판매되는 수천 가지 품목의 판매 단가를 더 정확하게 예측하는 모델을 구축 날짜, 매장 및 품목 정보, 프로모션, 판매 단가로 구성된 접근하기 쉬운 학습 데이터 세트를 통해 머신..

Project/Kaggle 2023.05.19

[Python Project (Store Sales - Time Series Forecasting )] 9. Streamlit 배포 및 GitHub 업로드

프로젝트가.. 어찌어찌 완료되었다. 중간 과정은 정리 후에 차후 업로드 예정이다. GitHub https://github.com/ChoiJMS2/Kaggle_StoreSales Streamlit https://choijms2-kaggle-storesales-app-a383bo.streamlit.app/ 데모 시연 영상 무언가 많은 부족함을 느꼈다. 도메인 지식부터 코딩에 대한 지식, 머신러닝까지.. 기초부터 차근차근 공부해 나가 보자.

Project/Kaggle 2023.05.19

[Python Project (Store Sales - Time Series Forecasting )] 8. 기본 대쉬보드 생성

목차 Streamlit & GitHub 이용하기 app.py description.py data.py eda.py stat.py ml.py 1. Streamlit & GitHub 이용하기 이번 프로젝트의 배포를 위해 Streamlit과 GitHub를 이용하였다. Streamlit & GitHub 배포 방법 [Streamlit] 설치 및 시작하기 / GitHub로 배포하기 Streamlit 기본 API 사용법 [Python Streamlit] IRIS 데이터를 활용한 머신러닝 대시보드 개발 [Streamlit] 기본 API reference (기본 기능) Streamlit 공식 홈페이지 API reference 2. app.py Streamlit 배포 페이지의 main 프로젝트 소개 데이터 출처 작업 툴,..

Project/Kaggle 2023.05.03

[Python Project (Store Sales - Time Series Forecasting )] 7. 데이터 탐색 시각화 시나리오

1. Total sales(총매출) : Hope to see an overall trend or the some spike in sales 전반적인 추세 또는 매출 급증한 부분 찾기 (perhaps the earthquake would have a big effect. 지진의 영향 클 수 있음) 2. Daily sales by each stores(각 매장별 일별 매출) : Hope to see the trend and pattern in sales throughout the timeframe. 해당 기간 동안의 매출 추세와 패턴을 확인 3. Sales by product family, by time(제품군별, 시간대별 판매량) : Hope to see the trend and pattern in sal..

Project/Kaggle 2023.05.02

[Python Project (Store Sales - Time Series Forecasting)] 참고. 시계열 분석 순서

1. 비정상 과정에서 정상 과정 추출 : 결정론적 추세나 확률적 추세가 있는지 확인 결정론적 추세는 회귀분석, 다항식 등으로 모형화 후 이를 분리 확률적 추세인 경우, 즉 ARIMA 모형인 경우에는 ADF(Augmented Dickey Fuller) 검정을 사용하여 적분차수(Order of Integration)를 알아내서 차분 2. 정규성 확인 : 정규성 검정을 통해 자료의 분포가 정규 분포인지 확인 일반 선형 확률 과정인 경우에는 전체 시계열이 가우시안 백색 잡음의 선형 조합으로 이루어지기 때문에 시계열 자체도 가우시안 정규 분포 ARIMA 모형 등의 일반 선형 확률 과정으로 모형화하려면 우선 정규성 검정(Normality Test)을 사용하여 분포가 정규 분포인지 확인 : 로그, Box-Cox 변환..

Project/Kaggle 2023.04.27

[Python Project (Store Sales - Time Series Forecasting )] 6. Dash Bord 작성 순서

1. 라이브러리 패키지 import 시키기 기본 패키지 numpy pandas os gc warnings 통계 분석 패키지 statsmodels.api skitlearn 시각화 패키지 matplotlib.pyplot seaborn plotly.express 기타 세부 설정 열 이름 표시 과학적 표기법 사용 안 함 경고메시지 비활성화 등 2. Google Drive 연결 및 데이터 불러오기 Google Drive 연결 데이터 불러오기 object타입을 DateTime으로 설정 및 Date Types 변환 불러온 Data 확인 3. 탐색적 자료 분석 ( EDA ) 데이터 전처리 : 임시 데이터 생성 결측값 처리 시각화를 통한 데이터 이해 상관분석을 통한 변수 간의 관계 파악 그룹핑 중간마다. shape를 사..

Project/Kaggle 2023.04.25

[Python Project (Store Sales - Time Series Forecasting)] 5. 참고 코드 필사 및 해석

출처 : https://www.kaggle.com/code/ekrembayar/store-sales-ts-forecasting-a-comprehensive-guide/notebook Kaggle Competition Store Sales - Time Series Forecasting ( Use machine learning to predict grocery sales )의 Code 탭에서 Most Votes 순으로 정렬 제일 위에 있는 Code를 필사하면서 주석도 달아보고 해석하여 이해와 공부 # Packages # BASE # ------------------------------------------------------ import numpy as np import pandas as pd impor..

Project/Kaggle 2023.04.25

[Python Project (Store Sales - Time Series Forecasting )] 4. 도메인 지식 참고 사이트

1. 프로젝트 관련 도메인 지식 공부 논문 : 수요예측을 활용한 실시간 재고관리시스템 설계 및 구현에 관한 연구 기사 : 수요 예측, 재고-배송 관리 데이터 기반 '물류 플랫폼' 블로그 : 수요 예측/ 주문 - 재고관리 Amazon Forecast 자동화 기계 학습 유튜브 : 핵심 미래 분석 기술! 시계열 분석을 활용한 수요예측과 재고관리 최적화 사례 유튜브 슬라이드 : 위 글 동일 깃허브 글 : 유튜브 내용 공부 해석 2. Kaggle 대회 code 탭에서 Most Votes 순으로 시각화 차트 참고 (데이터 해석 / 결과에 따른 다양한 시각화 파악) https://www.kaggle.com/competitions/store-sales-time-series-forecasting/code?competit..

Project/Kaggle 2023.04.24

[Python Project (Store Sales - Time Series Forecasting)] 3. 데이터 정의서 작성하기

Code Book(데이터 정의서) 1. 데이터 정의서란? 코딩 작업을 할 때의 안내서 데이터를 파악할 때 도움을 주는 안내서 누가 봐도 데이터를 이해할 수 있도록 도와주는 것 2. 데이터 정의서에 포함되어야 하는 내용 테이블 이름 Column 변수명 / 내용 설명 데이터 타입 Null 값 유무 데이터 범위 or 범주 설명 비고 그 외 추가 사항 이번 프로젝트의 데이터는 에콰도르의 데이터이기 때문에 대부분 영어, 스페인어로 되어있었다. 따라서 데이터 정의서를 쓰면서 데이터에 대한 파악과 이해가 필수였다. 3. 작성한 데이터 정의서의 일부

Project/Kaggle 2023.04.24

[Python Project (Store Sales - Time Series Forecasting)] 2. 데이터 다운로드 및 google drive 업로드

1. 데이터 다운로드 (1) 링크 접속 https://www.kaggle.com/competitions/store-sales-time-series-forecasting/ Store Sales - Time Series Forecasting | Kaggle www.kaggle.com 위 링크를 타고 들어가면 Kaggle의 해당 Competition 페이지가 나온다. (2) Data 다운로드 Data 탭에 들어가 보면 데이터에 대한 설명과 다운로드할 수 있는 창이 나온다. Download All 버튼을 누르면 모든 데이터가 다운로드하여진다. (3) 데이터 설명 : kaggle 추출 train.csv 학습 데이터 ID, 날짜, 매장 번호, 품목, 총 판매량, 프로모션 중인 제품군의 총 품목 수 test.csv ..

Project/Kaggle 2023.04.20
728x90
반응형
LIST