728x90
반응형

통계 2

[T-test] 독립표본과 대응표본의 평균 검정

목차 T-test 독립표본에서 T-검정 대응표본에서 T-검정 독립표본과 대응표본의 차이 T-test 알고리즘 추가 지식 공부해 보기 실습 예제 코드 링크 1. T-test ( t-검정 ) 2개의 집단 간 평균 차이를 검증하는 분석 1) t-검정의 용도 측정하고자 하는 종속변수가 2개의 집단 간에 평균치의 차이가 있는지를 확인하기 위해 사용하는 분석방법 예) 1) 성별(남자와 여자)에 따라 학업 능력이 차이가 있을까? 2) 고졸과 대졸의 수입이 차이가 있을까? 종속변수( 학업능력, 수입)가 두 집단(남/여, 고졸/대졸) 간에 차이가 있는지 비교 모집단의 분산이나 표준편차를 알 수 없을 때, 표본으로부터 추정치(표본분산, 표본표준편차)를 가지고 검정 2) t-검정의 기본 가정 t-검정은 t-분포를 활용하기 ..

통계 분석 2023.04.27

Normalization (정규화) & Standardization (표준화) & Regularization (정규화?)

머신러닝을 공부하다 보면 Feature Engineering의 Scaling에서 Normalization와 Standardization에 대한 지식이 필요하다. 일반적으로 Normalization과 Standardization 모두 정규화라고 해석되기도 하지만 정규화와 표준화로 구분 지었다. 1. Normalization (정규화)란? 통계분석이나 머신러닝의 알고리즘에 있어 가장 기본적인 가정은 [ 데이터가 정규성을 띤다(정규분포를 따른다) ]이다. 정규화란 데이터의 값을 공통 척도 또는 비슷한 값 분포에 맞추는 데이터 변환 프로세스이다. 즉, 정규화의 목적은 Dataset의 Numberical Value 범위의 차이를 왜곡하지 않고 비슷한 정도의 Scale로 반영되도록 변경하는 것이다. 예를 들어 키와..

통계 분석 2023.04.18
728x90
반응형
LIST