목록전체 글 (297)
susinlee 님의 블로그

인바디 결과 적정 체중은 63.6KG체중 조절 + 4.4KG (지방 +0.8KG, 근육 +3.6KG) 올해 안에 3.6KG 증량해보자~ (28 → 31.6) 프로젝트 이야기 오늘도 열심히 방황하는 스8조 팀장님이 고생이 많으시다...잘 마무리되어서 다들 즐겁게 만났으면!낼은 좀 집중해서 해보자
수면 시간 : 6시간 40분운동 : 40분인바디 : ? (내일 재야지)카페인 : X 골격근이 아마 30kg이 안될텐데, 우선 올해 목표를 30kg으로 잡고 체지방률은 13~14%대로 유지해보자.수면은 최소 7시간은 지키도록 하자. 8시간이 베스트고.. 30분 차이로 하루가 달라진다. 앞으로 매일단위로 따로 엑셀에 기록해서... 한달 단위로 변화율과 일평균을 내봐야겠다. 언제쯤 서류 합격을 보게 되는 건지... 쉽지 않다. 데이터 분석을 배우게 된 이유는 취업도 있지만, 트레이딩에 데이터 분석을 접목하기 위함도 있었다. 목표했던 데이터 분석의 기본도 배웠고, 취업도 어려운 시기인데, 다시금 시장을 팔로업하고 트레이딩 준비를 해야할지도 모르겠다. 그렇게 하면 그 전보다는 더 나은 방향으로 갈 수 있는걸까?..
MySQL 소문자, 대문자 변환 및 문자열 슬라이싱 소문자 / 대문자로 바꾸는 함수LOWER(str)예) SELECT LOWER('HELLO'); → 'hello' UPPER(str) 예) SELECT UPPER('hello'); → 'HELLO' 문자열 슬라이싱 (부분 문자열 추출)SUBSTR(str, pos, len) : pos 위치부터 len 길이만큼 추출 예) SELECT SUBSTR('abcdef', 2, 3) → 'bcd' pos는 1부터 시작함음수를 쓰면 뒤에서부터 위치를 계산문자열 길이를 구하는 함수CHAR_LENGTH(str)예) SELECT CHAR_LENGTH('안녕하세요'); → 5SELECT CHAR_LENGTH('hello'); → 5 바이트 수를 구하는 함수LENGTH(str..

데이터 shape: (31465, 4) 코호트 구현하기고객의 첫 주문 월을 기준으로 Cohort 그룹을 만들고, 각 Cohort 그룹에서 시간이 지남에 따라 활성 사용자 수를 계산하는 SQL 문을 작성하세요.USER_COUNT_1_MONTH_LATER ~ USER_COUNT_12_MONTH_LATER 까지 계산해야 합니다.각 Cohort 그룹에 대해 1개월 후부터 12개월 후까지의 활성 사용자 수를 추적합니다. 1. 고객별 첫 주문 월 구하기 (코호트 구하기)WITH cohort AS ( SELECT customer_id , DATE_FORMAT(MIN(order_date), '%Y-%m-01') AS first_order_mth FROM customer_order..
그룹클릭(1)미클릭(0)총 인원대조군3070100실험군4555100 대조군 클릭률 = 30%실험군 클릭률 = 45%실험군의 클릭률이 더 높다는 걸 검정하고자 함 1. t-검정 (두 집단의 평균 차이 비교)t-검정은 기본적으로 수치형 데이터에 사용하는 방법이지만,0과 1로 이루어진 이진값(예: 클릭=1, 미클릭=0)이라면 평균 = 비율 이므로 사용 가능 귀무가설실험군과 대조군의 평균(=비율)이 같다.대립가설단측검정 (실험군 > 대조군)실험군의 평균(=클릭률)이 더 높다양측검정두 집단 평균이 다르다scipy.stats.ttest_ind()는 기본적으로 양측검정이므로, 단측일 시 p-value를 2로 나눈다.from scipy.stats import ttest_ind# 0 = 미클릭, 1 = 클릭control..

목표시계열의 핵심 모형 AR(자기회귀)와 이동평균(MA)에 대해서 이해시계열의 자기상관성을 측정하는 ACF와 PACF의 정의를 이해하고, AR(q)와 MA(p)의 차수를 찾는 방법을 숙지시계열 모델인 AR, MA, ARMA, ARIMA, SARIMA 모델을 학습시계열 예측평가를 위한 잔차분석과 성능지표를 학습1. 정상시계열 검정방법1. ADF 검정과 단위근(Unit root)시계열 데이터에서 정상성을 확인하는 것은 매우 중요합니다. 정상성은 데이터의 평균과 분산이 시간에 따라 일정한 상태를 의미합니다. 시계열이 정상성을 만족하지 않으면, 예측 모델의 성능이 저하될 수 있습니다.AR 모형을 적용하기 전에, 시계열 데이터가 정상성을 만족하는지 검정 필요ADF(Augmented Dickey Fuller)는 단..

쿼리 작성 가이드현재 보고 싶은 지표는 무엇인가?, 이쿼리를 작성하는 목표는 무엇인가?해당 지표는 어덯게 계산해야 할까? 데이터의 기간은 어떻게 될까해당 지표를 계산하기 위해 어떤 테이블을 확인해야 할까? Join 활용할 Key는 무엇인가?하나의 테이블에서 원하는 정보를 모두 추출할 수 있을까? 혹은 여러 테이블을 사용해야 할까데이터를 파악할 때 주의해야 하는 내용은?위 내용을 주석으로 설정한 후 쿼리 작성하는 습관 가지기회사에서 쿼리 작성하는 흐름쿼리 체크 리스트를 작성한다.보고 싶은 지표를 구체화한다사내에 이미 해당 지표를 구하는 쿼리가 있는지 찾아본다. 있으면 바로 쿼리를 실행하고 쿼리를 분석해보자보고 싶은 지표가 있는 데이터가 있는 테이블 찾기하나의 테이블에서 모든 데이터가 나올 것 같은 경우 -..
1. 어떤 문제가 있었는지 2. 내가 시도해 본 것들 3. 어떻게 해결했는지 4. 뭘 새롭게 알았는지오늘 이력서 피드백을 받았는데 이력서를 쓸 때 너무 하드 스킬 위주로 적은 것 같다. 그보다는 남들과 차별성을 가지는 나의 장점이 무엇인지를 파악하고 이력서에 녹여내는 것이 더 중요하다고 한다. 예를 들어, "저는 데이터를 깊이 파는 것을 잘하고, 그러면서도 속도가 빠릅니다" 처럼 이런 내용을 소개란에 적어야 한다. 그런 말들이야 누구나 쓸 수 있는거 아니야? 라고 생각이 들어 쓰지 않았었지만 그렇지 않다고 한다. 또한 프로젝트를 진행하면서 어려움이 존재했을 텐데 그런 어려움들을 어떻게 해결했는지를 적는 것이 필요하다. 그래야 해당 프로젝트에 관심이 가고, '아 얘가 정말 프로젝트를 했구나' 라는 생각이 ..