목록학습/머신러닝 (2)
susinlee 님의 블로그
목차 1. 분류 그것이 알고 싶다!분류 알고리즘의 종류이진 분류와 다항 분류의 차이데이터 불균형 처리 방법차원이 많을 경우 차원 축소정규분포를 가정하는 모델모델별 하이퍼파라미터 튜닝 방법모델 평가 지표와 방법베이스라인 모델 수립모델 성능 향상 팁모델의 시간 복잡도 비교2. 머신러닝 프로젝트 분석 이렇게!데이터 분석(EDA)에 충분한 시간 투자적절한 전처리와 피처 엔지니어링여러 모델 시도 및 앙상블파라미터 튜닝은 체계적으로교차 검증 & 올바른 평가 지표1. 분류 그것이 알고싶다 1-1) 분류 알고리즘의 종류분류 알고리즘이란, 주어진 데이터에서 특정 카테고리(클래스)로 분류하는 모델을 말합니다. 보통 지도학습에서 많이 다루며, 입력 데이터(X)와 정답(y)이 주어져 있고, 새로운 입력이 들어왔을 때 이 입..
목차요약클러스터링이란?K-Means 클러스터링PCA실습1. 요약1) K-Means 란?데이터를 k개의 그룹(클러스터)으로 자동 분류하는 비지도 학습 알고리즘클러스터 중심(centroid)을 반복적으로 업데이트하여 최적의 군집을 찾음2) K-Means의 주요 과정초기 중심(centroid) 설정각 데이터 포인트를 가장 가까운 중심에 할당새롭게 할당된 데이터 기준으로 중심 재계산중심이 더 이상 변하지 않을 때까지 반복3) K 값 선택 방법엘보우 기법 (Elbow Method): WCSS(클러스터 내 거리 제곱합) 감소율이 꺾이는 지점 선택실루엣 점수 (Silhouette Score): 클러스터 내부 응집력과 외부 분리도를 평가하여 최적의 k 선택4) K-Means의 장점 & 단점장점빠르고 효율적 O(n)해석..