목록학습/TIL (50)
susinlee 님의 블로그
독립인 두 개의 표본으로부터 두 모집단을 비교하는 통계추론 방법을 배움 예를 들어, 두 지역(A, B)의 가구당 소득을 비교한다면 모집단 1은 A 지역에 있는 가구들의 소득이고, 모집단 2는 B 지역에 있는 가구들의 소득이 됨. 이와 같은 경우에 두 모집단으로부터 적당한 수의 표본을 추출하여 두 개의 독립인 표본을 얻을 수 있음. 여기서 관심사는 두 모집단의 평균 차이임. 즉 모수 (μ1 - μ2) 에 대한 추론임 아래는 정리 요약 1. 표본의 크기가 클 때2. 표본의 크기가 작을 때 2-1) 두 모집단의 표준편차가 같을 때2-2) 두 모집단의 표준편차가 다를 때3. 짝비교4. 모비율 비교1. 표본의 크기가 클 때모평균의 차 ( μ1 - μ2) 에 대한 추론 (표본의 크기가 클 때) 모평균의 차 (μ..
정리 요약 api : 소프트웨어끼리 상호작용하기 위해 사용하는 인터페이스 1. api를 통해 데이터를 요청하고 받을 수 있으며, 이는 주로 HTTP 프로토콜을 사용함→ HTTP 프로토콜 : 웹 브라우저가 서버와 통신하는 규칙 2. 대부분의 api는 사용자를 인증하기 위해 api 키를 요구함 → 서비스를 제공하는 플랫폼에서 api 키를 발급받아야 함 3. api 제공자는 일반적으로 api 문서를 제공하므로 확인할 것→ 엔드포인트 : 데이터를 요청하는 URL // 파라미터 : 요청 시 필요한 변수들 4. 문서를 확인하고 요청→ 엔드포인트와 HTTP 메서드를 사용하여 데이터 요청→ 요청에는 헤더와 파라미터가 포함헤더 : api 키파라미터: 필터 조건, 데이터 범위 등5. 응답→ 서버는 요청에 대한 데이터를 반..
1. 어떤 문제가 있었는지통계학 책을 쓰고 있는데, 어떻게 써야할지 잘 모르겠다 2. 내가 시도해 본 것들다른 서적들을 읽어보는 중 3. 어떻게 해결했는지아직 해결 못함 4. 뭘 새롭게 알았는지스토리텔링을 잘해야하는구나.. 가진 지식으로 나만의 이야기를 만들어내자
1. 어떤 문제가 있었는지데이콘 대회서 모델 성과가 안나옴. 2. 내가 시도해 본 것들랜덤포레스트 하이퍼파라미터 튜닝을 해봤고,사이킷런의 히스토그램 기반 그레이디언트 부스팅 모델과 lgbm 라이브러리에서 같은 알고리즘 모델을 사용해봄 3. 어떻게 해결했는지해결 안됨 4. 뭘 새롭게 알았는지훈련데이터셋이 적어져도 성과가 높을 수 있다는 점.그리드 서치나 랜덤 서치는 훈련세트를 또 한번 훈련세트와 검증세트로 쪼갤 필요가 없다는 점. 전처리에 좀 더 집중해서 더 건들게 없다 싶을 때쯤 모델링을 해봐야겠다. 뭔가 점수가 안올라가고 할때마다 떨어지니까 조금 아쉽다.
숏츠나 릴스를 너무 많이 봐서 공부에 집중을 잘 못하고 시간을 너무 많이 잡아먹는다. 보고 난 후에 기분도 그리 좋지 않다. 공부 시간이 너무 길어서 슬슬 지쳐가는 걸까 아니면 최근 아프고 컨디션 난조로 인해 집중력이 떨어질걸까. 어느쪽이든 케어를 해야할 때가 온 거 같다는 생각이 든다. 잠을 최소 7시간 30분 자고, 아침마다 운동을 하자. 7시에 나가서 1시간 운동하고 밥먹고 수업 시작하면 몸도 마음도 조금은 회복되지 않을까 싶다.
1. 어떤 문제가 있었는지 프로젝트 관련해서 아이디어가 떠올랐다. 2. 내가 시도해 본 것들관련해서 튜터님들에게 질문했다. 3. 어떻게 해결했는지실제로 찾아가면서 프로젝트를 진행 4. 뭘 새롭게 알았는지비지도 학습은 평가데이터로 평가하는 것이 아닌 다른 평가 방법이 존재한다.3D 그래프를 그리는 법을 배웠다.
문제 : 데이터 분석에 목적이 보이지 않는다. 즉, 알맹이가 없다. 원인 : 문제 정의없이 데이터셋을 만지고 그래프 그리는 것에만 집중하고 그것이 데이터 분석이라고 착각한다. 해결 방안1. 코드치는 시간보다 생각하는 시간이 많아야 한다.2. 문제 정의를 바로 하고, 그에 대한 원인과 해결방안을 제시한다. 데이터 분석가는 코드치는 사람이 아니고, 정답이 없을 수 있는 문제에서 나만의 논리를 바탕으로 누군가를 설득할 수 있어야 하는 직업이다. 끊임없이 생각하고 남들과 논의해서 좋은 의사결정에 이를 수 있도록 노력해보자.