목록전체 글 (280)
susinlee 님의 블로그
[문제]https://school.programmers.co.kr/learn/courses/30/lessons/87946 프로그래머스SW개발자를 위한 평가, 교육, 채용까지 Total Solution을 제공하는 개발자 성장을 위한 베이스캠프programmers.co.kr [풀이]1. 던전을 탐색할 수 있는 모든 조합을 구해주고( O(n!) )2. 최대로 돌 수 있는 던전 개수를 구해준다. from itertools import permutationsdef solution(k, dungeons): max_cnt = 0 if k >= sum(list(zip(*dungeons))[1]): max_cnt = len(dungeons) cnt_list = [] for method..
[문제]https://leetcode.com/problems/movie-rating/description/ [풀이]1. 영화 평점 테이블에서 각 유저별로, 영화별로, 평가수와 평균점수를 구하고 각각 새로운 테이블을 생성2. 평가수 테이블과 유저 테이블을 조인해서 유저의 이름을 구하고3. 평균점수 테이블과 영화 테이블을 조인해서 영화 이름을 구한 뒤4. 두 데이터로 테이블을 만들어서 반환 Pandasimport pandas as pddef movie_rating(movies: pd.DataFrame, users: pd.DataFrame, movie_rating: pd.DataFrame) -> pd.DataFrame: user_rating_counts = ( movie_rating ..
[문제]https://leetcode.com/problems/exchange-seats/description/ [풀이]1번과 2번 자리를 바꾸고, 3번과 4번 자리를 바꾸면서 마지막 좌석이 홀수이면 그대로 유지학생을 한칸씩 뒤로 이동시킨 컬럼(lag)과 한칸씩 앞으로 이동시킨 컬럼(lead)을 생성id가 홀수라면 lead 컬럼을, id가 짝수라면 lag 컬럼을 선택만약, 마지막 좌석이 홀수라면 이동할 필요가 없으므로 원래값을 유지시켜준다 Pandasimport pandas as pddef exchange_seats(seat: pd.DataFrame) -> pd.DataFrame: seat['lag'] = seat['student'].shift(1) seat['lead'] = seat['student..

목차요약클러스터링이란?K-Means 클러스터링PCA실습1. 요약1) K-Means 란?데이터를 k개의 그룹(클러스터)으로 자동 분류하는 비지도 학습 알고리즘클러스터 중심(centroid)을 반복적으로 업데이트하여 최적의 군집을 찾음2) K-Means의 주요 과정초기 중심(centroid) 설정각 데이터 포인트를 가장 가까운 중심에 할당새롭게 할당된 데이터 기준으로 중심 재계산중심이 더 이상 변하지 않을 때까지 반복3) K 값 선택 방법엘보우 기법 (Elbow Method): WCSS(클러스터 내 거리 제곱합) 감소율이 꺾이는 지점 선택실루엣 점수 (Silhouette Score): 클러스터 내부 응집력과 외부 분리도를 평가하여 최적의 k 선택4) K-Means의 장점 & 단점장점빠르고 효율적 O(n)해석..

필사했다. 5장 확률부터 시작해서 15장 범주형 자료분석까지 귀찮을 때마다 건너뛴 부분도 있지만... (읽기만..) 관련 파이썬 함수들도 찾아서 기록해놨다. 사실 필사는 두 번째다. 처음할 때는 정말 뭐가뭔지 안보였었는데 그래서 뭔 내용인지 이해도 못하면서 따라쓰기만 한 것도 있었고.. 이러면 언젠가 이해는 되겠지... '기초' 통계학이라며... 하면서 꾸역꾸역했다. 다행히 그게 어디가진 않았나보다. 안개가 조금 걷힌 느낌이랄까 이번 필사 때는 이해 안가는 부분이 없었다. 어려운 부분도 깊게 파려고 안했고, 아 이런게 있었지 하면서 받아들인거 같다. 예전 같았으면 이게 왜 이렇게 되는거지 하면서 진도는 안나가고 맴돌았을텐데.. 뭐든 처음할 때는 받아들이는게 잘안되나보다.

독립인 두 개의 표본으로부터 두 모집단을 비교하는 통계추론 방법을 배움 예를 들어, 두 지역(A, B)의 가구당 소득을 비교한다면 모집단 1은 A 지역에 있는 가구들의 소득이고, 모집단 2는 B 지역에 있는 가구들의 소득이 됨. 이와 같은 경우에 두 모집단으로부터 적당한 수의 표본을 추출하여 두 개의 독립인 표본을 얻을 수 있음. 여기서 관심사는 두 모집단의 평균 차이임. 즉 모수 (μ1 - μ2) 에 대한 추론임 아래는 정리 요약 1. 표본의 크기가 클 때2. 표본의 크기가 작을 때 2-1) 두 모집단의 표준편차가 같을 때2-2) 두 모집단의 표준편차가 다를 때3. 짝비교4. 모비율 비교1. 표본의 크기가 클 때모평균의 차 ( μ1 - μ2) 에 대한 추론 (표본의 크기가 클 때) 모평균의 차 (μ..
정리 요약 api : 소프트웨어끼리 상호작용하기 위해 사용하는 인터페이스 1. api를 통해 데이터를 요청하고 받을 수 있으며, 이는 주로 HTTP 프로토콜을 사용함→ HTTP 프로토콜 : 웹 브라우저가 서버와 통신하는 규칙 2. 대부분의 api는 사용자를 인증하기 위해 api 키를 요구함 → 서비스를 제공하는 플랫폼에서 api 키를 발급받아야 함 3. api 제공자는 일반적으로 api 문서를 제공하므로 확인할 것→ 엔드포인트 : 데이터를 요청하는 URL // 파라미터 : 요청 시 필요한 변수들 4. 문서를 확인하고 요청→ 엔드포인트와 HTTP 메서드를 사용하여 데이터 요청→ 요청에는 헤더와 파라미터가 포함헤더 : api 키파라미터: 필터 조건, 데이터 범위 등5. 응답→ 서버는 요청에 대한 데이터를 반..
[문제]https://leetcode.com/problems/employees-whose-manager-left-the-company/description/ [풀이]1. employee_id에 포함되지 않은 manager_id를 필터링하고2. salary가 30000미만인 행들만 필터링해준다.3. ~ 연산자를 사용해서 manager_id가 null임에도 필터링된 친구들을 dropna()로 날려버린다.4. 정렬하고 조건에 맞게 열을 선택해서 반환한다. Pandasimport pandas as pddef find_employees(employees: pd.DataFrame) -> pd.DataFrame: cond1 = ~employees.manager_id.isin(employees['employee..