728x90
반응형

전체 글 52

[Python Project (Store Sales - Time Series Forecasting)] 7. 시각화 코드 필사 1st step

출처 : https://www.kaggle.com/code/kashishrastogi/store-sales-analysis-time-serie 📝Store Sales Analysis⏳ Time Serie Explore and run machine learning code with Kaggle Notebooks | Using data from Store Sales - Time Series Forecasting www.kaggle.com Kaggle Competition Store Sales - Time Series Forecasting ( Use machine learning to predict grocery sales )의 Code 탭에서 Most Votes 순으로 정렬 두 번째에 있는 Code를 필사하..

카테고리 없음 2023.04.27

[Python을 공부하며] 첫 번째 일기

파이썬을 공부하다 보니 어느새 첫 번째 슬럼프가 왔다. 기초 이론은 배웠다 생각하고 Kaggle의 Competiton을 진행해 보려는데 이게 무슨 일? 아~예 하나도 감이 안 온다... 대체 나는 무엇을 배운 것이었나? 그러던 중 하나의 글을 보게 되었다. https://kaggle-kr.tistory.com/32 [이유한님] 캐글 코리아 캐글 스터디 커널 커리큘럼 유한님이 이전에 공유해주신 캐글 커널 커리큘럼 정리본입니다. 다들 Keep Going 합시다!! 커리큘럼 참여 방법 필사적으로 필사하세요 커널의 A 부터 Z 까지 다 똑같이 따라 적기! 똑같이 3번적고 다 kaggle-kr.tistory.com 나에게 있어 지금 가장 큰 적은 조급함 인 것 같다. 위의 글에서 핵심은 필사적으로 필사하세요 커널..

Python 2023.04.27

[T-test] 독립표본과 대응표본의 평균 검정

목차 T-test 독립표본에서 T-검정 대응표본에서 T-검정 독립표본과 대응표본의 차이 T-test 알고리즘 추가 지식 공부해 보기 실습 예제 코드 링크 1. T-test ( t-검정 ) 2개의 집단 간 평균 차이를 검증하는 분석 1) t-검정의 용도 측정하고자 하는 종속변수가 2개의 집단 간에 평균치의 차이가 있는지를 확인하기 위해 사용하는 분석방법 예) 1) 성별(남자와 여자)에 따라 학업 능력이 차이가 있을까? 2) 고졸과 대졸의 수입이 차이가 있을까? 종속변수( 학업능력, 수입)가 두 집단(남/여, 고졸/대졸) 간에 차이가 있는지 비교 모집단의 분산이나 표준편차를 알 수 없을 때, 표본으로부터 추정치(표본분산, 표본표준편차)를 가지고 검정 2) t-검정의 기본 가정 t-검정은 t-분포를 활용하기 ..

통계 분석 2023.04.27

[Python Project (Store Sales - Time Series Forecasting)] 참고. 시계열 분석 순서

1. 비정상 과정에서 정상 과정 추출 : 결정론적 추세나 확률적 추세가 있는지 확인 결정론적 추세는 회귀분석, 다항식 등으로 모형화 후 이를 분리 확률적 추세인 경우, 즉 ARIMA 모형인 경우에는 ADF(Augmented Dickey Fuller) 검정을 사용하여 적분차수(Order of Integration)를 알아내서 차분 2. 정규성 확인 : 정규성 검정을 통해 자료의 분포가 정규 분포인지 확인 일반 선형 확률 과정인 경우에는 전체 시계열이 가우시안 백색 잡음의 선형 조합으로 이루어지기 때문에 시계열 자체도 가우시안 정규 분포 ARIMA 모형 등의 일반 선형 확률 과정으로 모형화하려면 우선 정규성 검정(Normality Test)을 사용하여 분포가 정규 분포인지 확인 : 로그, Box-Cox 변환..

Project/Kaggle 2023.04.27

[Python Project (Store Sales - Time Series Forecasting )] 6. Dash Bord 작성 순서

1. 라이브러리 패키지 import 시키기 기본 패키지 numpy pandas os gc warnings 통계 분석 패키지 statsmodels.api skitlearn 시각화 패키지 matplotlib.pyplot seaborn plotly.express 기타 세부 설정 열 이름 표시 과학적 표기법 사용 안 함 경고메시지 비활성화 등 2. Google Drive 연결 및 데이터 불러오기 Google Drive 연결 데이터 불러오기 object타입을 DateTime으로 설정 및 Date Types 변환 불러온 Data 확인 3. 탐색적 자료 분석 ( EDA ) 데이터 전처리 : 임시 데이터 생성 결측값 처리 시각화를 통한 데이터 이해 상관분석을 통한 변수 간의 관계 파악 그룹핑 중간마다. shape를 사..

Project/Kaggle 2023.04.25

[Python Project (Store Sales - Time Series Forecasting)] 5. 참고 코드 필사 및 해석

출처 : https://www.kaggle.com/code/ekrembayar/store-sales-ts-forecasting-a-comprehensive-guide/notebook Kaggle Competition Store Sales - Time Series Forecasting ( Use machine learning to predict grocery sales )의 Code 탭에서 Most Votes 순으로 정렬 제일 위에 있는 Code를 필사하면서 주석도 달아보고 해석하여 이해와 공부 # Packages # BASE # ------------------------------------------------------ import numpy as np import pandas as pd impor..

Project/Kaggle 2023.04.25

[Python Streamlit] IRIS 데이터를 활용한 머신러닝 대시보드 개발

Python을 공부하면서 배운 것들을 활용하여 머신러닝 대시보드를 개발해 보는 실습을 해보자. 이번 실습은 Pycharm (Python 3.9)에서 진행하였다. 목차 1. 사용한 모듈 2. 구상하기 3. Main 페이지가 될 app.py 파일 생성 4. Main 페이지에 들어갈 내용 만들기 5. EDA (탐색적 자료분석) 메뉴 6. ML(머신러닝) 학습 모델 생성 7. ML(머신러닝) 메뉴 8. 모든 페이지를 Main 페이지에 적용하기 9. 실습을 마치며 1. 사용한 모듈 Matplotlib과 Seaborn, Plotly를 이용하여 시각화 Streamlit을 활용한 웹 배포 Scikit-Learn을 활용한 머신러닝 모델 생성 그 외 pandas, joblib, os, numpy 활용 2. 구상하기 Str..

Python/실습 2023.04.25

[Python Project (Store Sales - Time Series Forecasting )] 4. 도메인 지식 참고 사이트

1. 프로젝트 관련 도메인 지식 공부 논문 : 수요예측을 활용한 실시간 재고관리시스템 설계 및 구현에 관한 연구 기사 : 수요 예측, 재고-배송 관리 데이터 기반 '물류 플랫폼' 블로그 : 수요 예측/ 주문 - 재고관리 Amazon Forecast 자동화 기계 학습 유튜브 : 핵심 미래 분석 기술! 시계열 분석을 활용한 수요예측과 재고관리 최적화 사례 유튜브 슬라이드 : 위 글 동일 깃허브 글 : 유튜브 내용 공부 해석 2. Kaggle 대회 code 탭에서 Most Votes 순으로 시각화 차트 참고 (데이터 해석 / 결과에 따른 다양한 시각화 파악) https://www.kaggle.com/competitions/store-sales-time-series-forecasting/code?competit..

Project/Kaggle 2023.04.24

[Python Project (Store Sales - Time Series Forecasting)] 3. 데이터 정의서 작성하기

Code Book(데이터 정의서) 1. 데이터 정의서란? 코딩 작업을 할 때의 안내서 데이터를 파악할 때 도움을 주는 안내서 누가 봐도 데이터를 이해할 수 있도록 도와주는 것 2. 데이터 정의서에 포함되어야 하는 내용 테이블 이름 Column 변수명 / 내용 설명 데이터 타입 Null 값 유무 데이터 범위 or 범주 설명 비고 그 외 추가 사항 이번 프로젝트의 데이터는 에콰도르의 데이터이기 때문에 대부분 영어, 스페인어로 되어있었다. 따라서 데이터 정의서를 쓰면서 데이터에 대한 파악과 이해가 필수였다. 3. 작성한 데이터 정의서의 일부

Project/Kaggle 2023.04.24

[Streamlit] 기본 API reference (기본 기능)

이번 글에서는 Streamlit의 기본적인 기능에 대해 알아보도록 하자. 각 명령어들의 자세한 옵션 및 설명은 Streamlit 홈페이지 (링크)에서 확인 가능하니 참고하도록 하자. 목차 강조 문구 제목 넣기 텍스트 넣기 Header SubHeader Markdown 색상이 들어간 텍스트 Feature ( Progress, Status 메시지 ) 텍스트 넣기 st.write( ) 도움말 확인 위젯 만들기 버튼 만들기 체크 박스 만들기 라디오 버튼 만들기 선택 박스 만들기 다중 선택 박스 만들기 슬라이더 만들기 데이터 불러오기 데이터 출력 각종 콘텐츠 출력 (이미지, 비디오, 오디오) 차트 출력 사이드바, 레이아웃 # -*- coding:UTF-8 -*- import streamlit as st impor..

Python/Streamlit 2023.04.24
728x90
반응형
LIST