목록2025/02/09 (4)
susinlee 님의 블로그
1. k-NN 알고리즘 (k-Nearest Neighbors)k-NN 알고리즘은 지도 학습 알고리즘으로, 주어진 데이터 포인트의 주변 k개의 가장 가까운 이웃을 기준으로 예측하는 방식. 분류와 회귀 문제 모두에서 사용됨.k-NN 분류 (k-NN Classification)새로운 데이터 포인트가 주어졌을 때, 가장 가까운 k개의 데이터 포인트를 찾고, 다수결 방식으로 클래스 예측거리 기반 알고리즘이므로, 데이터의 분포에 따라 성능이 결정k-NN 회귀 (k-NN Regression)새로운 데이터 포인트가 주어졌을 때, 가장 가까운 k개의 데이터 포인트의 평균을 사용하여 값 예측평균 또는 가중 평균을 사용하여 예측값을 계산# ===============================================..
손실 함수(Loss Function)란?손실 함수는 각 개별 샘플(데이터 포인트)에 대한 오차(실제값 - 예측값)를 측정하는 함수모델이 각 샘플에 대해 얼마나 잘못 예측했는지를 나타냄손실 함수의 평균이 비용 함수가 됨비용 함수(Cost Function)란?비용 함수는 머신러닝 모델이 예측한 결과와 실제 값 사이의 전체 데이터에 대한 평균적인 오차를 측정하는 함수손실 함수 값의 평균을 구하는 함수라고 볼 수 있음머신러닝 모델이 비용 함수를 최소화하도록 학습(최적화) 됨목적 함수(Objective Function)란?목적 함수는 머신러닝 모델이 최적화해야 하는 최종적인 목표 함수비용 함수 또는 손실 함수 자체가 목적 함수가 될 수 있음목적 함수는 최소화(Minimization) 또는 최대화(Maximiza..
SQL에서 윈도우 함수는 행(row) 단위로 연산을 수행하면서도 그룹화 없이 전체 데이터에 대한 계산을 수행할 수 있는 기능 기본 구조윈도우_함수() OVER ( PARTITION BY 컬럼 ORDER BY 컬럼 ROWS 또는 RANGE) PARTITION BY → 그룹을 나누는 기준ORDER BY → 정렬 기준ROWS 또는 RANGE → 윈도우(슬라이딩 범위)를 설정하는 옵션기본 예제SELECT customer_id , visited_on , amount , SUM(amount) OVER (ORDER BY visited_on) AS rolling_sumFROM CustomerSUM(amount) OVER (...) → 각 행을 기준으로 이전 행의 값들을 누적해서 ..
[문제]https://leetcode.com/problems/restaurant-growth/ [풀이]1. 날짜순으로 정렬한 뒤, 그룹화하여 더해준다. 2. rolling 함수를 이용해서 윈도우 크기를 7일로 해주고, 이동합계를 구한다.3. 마찬가지로 이동합계에 7을 나눠서 이동평균을 구해준다.4. 최소 날짜에서 6일을 더해 7일 평균이 계산된 행들만 필터링 해준다. Pandasimport pandas as pddef restaurant_growth(customer: pd.DataFrame) -> pd.DataFrame: df = customer.sort_values("visited_on").groupby("visited_on")[["amount"]].sum() df = df.assign( ..