위의 데이터 프레임으로 모델을 훈련시켜서 허위매물을 색출해보려고 한다. 해당 데이터셋은 불균형 데이터로 타겟 데이터가 전체서 12% 밖에 되지 않는다. 불균형 데이터를 해결하는 방법에는 1. 오버샘플링 : 소수 클래스 데이터를 복제하거나 생성하여 클래스 균형을 맞춤Random OversamplingSMOTEADASYN2. 언더샘플링 : 다수 클래스 데이터를 제거하여 클래스 균형을 맞춤Random UndersamplingNearMissTomek3. 혼합 기법 : 위의 두 방법들을 혼합해서 사용 추가로 모델 수준에서는 알고리즘 별로 가중치를 조정하거나(그러한 옵션이 있다면) 특화된 알고리즘 (XGBoost, LightGBM) 등을 사용한다. 또 평가지표는 정확도보다 F1 점수(또는 ROC-AUC)를 사용한..