머신러닝을 수행하는 데 있어 가장 오랜 시간이 필요한 부분은 데이터 준비이다. 데이터를 EDA(탐색적 자료분석)하면서 중요한 Feature를 Selection 하여 학습하게 되는데 단순히 그것만으로는 부족하다. 왜냐하면 데이터가 한쪽으로 치우쳤거나 Missing Value(결측치)가 많을 수 있기 때문이다. 이를 어느 정도 바로 잡아주는 것을 [ Feature Engineering ]이라고 한다. Feature Engineering 이란? 머신러닝 알고리즘이 잘 작동할 수 있도록 데이터 테이블의 컬럼(특징)을 생성하거나 선택하는 작업 Target 변수를 가장 잘 표현할 수 있도록 데이터를 가공해야 하고, 해당 도메인에 대한 지식이 필요하다. 모델 성능에 미치는 영향이 크기 때문에 머신러닝 응용에 있어 가..