susinlee 님의 블로그

[250424] TIL 본문

학습/TIL

[250424] TIL

susinlee 2025. 4. 25. 00:10

바로인턴 과제할 때 t-test로 두 집단의 평균 차이를 검정한 적이 있었다.

 

이 부분에서 한가지 간과한 것이 있었는데 바로 모집단이 정규성을 만족하는지 여부를 파악하지 않은 것이다.

 

결과적으로는 정규성(모집단이 정규분포)을 만족하지 않기 때문에 비모수 검정을 해야한다.

 

두 집단의 대푯값을 비교하는 비모수 검정으로는 대표적으로 다음 두 가지가 있다.

 

  1. 윌콕슨 순위합 검정
  2. 맨-휘트니 U 검정

사실 둘은 같은 검정이다. 특징은 아래와 같다.

  • 정규성 가정이 필요 없음
  • 두 독립 집단의 위치 차이(중앙값) 비교
  • 분포 모양이 같다는 약한 가정
더보기
from scipy.stats import mannwhitneyu

# 예시: 합격/불합격 그룹 분리
passed = df[df['target'] == 1]['duration_days']
failed = df[df['target'] == 0]['duration_days']

# Mann-Whitney U 검정 (양측 검정)
stat, p = mannwhitneyu(passed, failed, alternative='two-sided')

print(f"U 통계량: {stat}")
print(f"p-value: {p:.4f}")

if p < 0.05:
    print("✅ 유의미한 차이가 있습니다.")
else:
    print("❌ 통계적으로 유의미한 차이는 없습니다.")

출력 통계량은 맨-휘트니의 경우 U값, 윌콕슨의 경우 Rank-sum이며 두 방식 모두 정확히 동일한 방식으로 계산 가능하다. 이름만 다르고 실질적으로 동일하다.

 

 


https://news.hada.io/topic?id=20068

 

주니어 개발자의 역습 | GeekNews

Part 1: 여섯 개의 AI 코딩 물결Vibe 코딩은 LLM에게 코드를 작성하도록 요청하고 결과를 피드백하면서 반복하는, 대화 기반 코딩 방식에 붙여진 유쾌한 별칭임기존 코딩이나 자동완성 중심 코딩과

news.hada.io

https://www.itworld.co.kr/article/3967678

 

개발자가 맞닥뜨린 갈림길…‘바이브 코딩’을 배우거나, 은퇴하거나

게임 개발 경험이 전혀 없는 사람이 GPT로 게임 하나를 뚝딱 만들어서 대통령이 트위터에 올리고, 그걸로 백만장자가 되는 일이 가능하다는 말은 아니다. 생성형 AI 코딩 툴이 훌륭하다는 얘기를

www.itworld.co.kr

 

요즘 바이브 코딩이 아주 뜨겁다. LLM을 적극적으로 활용하면서 바이브 타듯이 코딩을 하는 것을 말한다. 논쟁이 한창이지만 많은 개발자들이 미래 기술로 인식하고 있다. 위 컬럼에서는 AI 기반 코딩의 발전 단계를 총 여섯 개의 물결로 설명하고 있다.

  1. 전통적인 코딩 (2022)
  2. 자동완성 기반 코딩 (2023)
  3. 대화형 코딩 (2024)
  4. 코딩 에이전트 (2025 상반기)
  5. 에이전트 클러스터 (2025 하반기)
  6. 에이전트 플릿 (2026)

이 중 전통적인 코딩과 자동완성 기반 코딩은 점차 쇠퇴하고 있으며, 이후 등장하는 방식은 각기 더 빠른 속도로 확산된다고 한다. 그리고 올해 상반기에 등장한 코딩 에이전트(Aider.chat, Claude Code 등)는 기존의 모든 방식을 압도할 것이라고 보고 있다. 기존과의 차이점은 자주 대화하지 않아도 혼자 작업을 진행한다는 것이다. 복잡한 작업을 스스로 수행(전체 작업의 90~99%)하고 문제가 생기면 사용자에게 연락한다. 또한 기존과 다른게 더 큰 작업 단위를 한 번에 처리할 수 있다. 물론 현재는 여러 문제들이 존재하지만 해결되는 것은 시간 문제라고 한다. 어찌보면 지금이 에이전트와 함께 일하는 방법을 배우기에 최적의 타이밍인듯 하다.

 

 

나는 cursor ai로 시작해보려 한다. 현재 유료버전 체험판을 쓰고 있고, 아직 툴에 익숙치는 않지만 프로젝트 단위로 관리해주는 똑똑한 비서를 끼고 데이터 분석을 진행하는 느낌이다. 아래 이미지에서 내가 친 코드는 없다. 단지 프롬프트만 작성했을 뿐.

 

 

프로젝트 단위로 프롬프트 설정이 가능하다. 이러면 코드가 통일되어서 나오고 매번 같은 요청을 할 필요가 없다.

 

 

 

물론 단순히 질문하고 답변받은 것을 그대로 코딩하게 된다면, 확장성, 유지보수성 등등 많은 문제가 생길 뿐더러, 머리에 남지도 않을테니 AI가 적어주는 코드는 따라쓰면서 리뷰해야한다. 데이터를 해석할 때도 마찬가지로 LLM을 사용하되 토론하듯이 해야한다. 그런 점에서 꿀팁이 하나 있다. 

gpt 웹 오른쪽 상단

 

 

ChatGPT 맞춤 설정에 들어가서 다음과 같이 설정하는 것이다.

 

프롬프트 설정

 

 

저장을 누른 뒤 다음과 같은 질문을 해보았다.

 

"""

RandomForest MSE: 0.0568, R2: 0.0165

XGBoost MSE: 0.0657, R2: -0.1369 다음 결과에 대해서 해석해줘

"""

 

그러면 질문에 대한 이런저런 답변을 하고 마지막에 다음과 같은 질문이 붙는다.

 

 

 

자신이 답변한 것에 대한 질문이다. 이런 식으로도 LLM을 활용할 수가 있다. 쓸만한 프롬프트들을 찾거나 실험해서 저장하고 자산처럼 관리해야 될지도 모르겠다.


오늘은 번아웃이 쎄게 왔다. 가루가 되어버린 내 멘탈... 세상은 빠르게 변화해가는데 그 변화에 지치고 열심히 살아온거같은데 성과는 없고 주저리주저리... 그래서 하염없이 걸었다. 밥 먹구 강아지 산책 끝나구 나가서 5 ~ 6시간 내내 걷기만 했던 것 같다. 오는 길에 헬스장 들려서 하체 조지고... 그랬더니 좀 나아진거같다. 공부는 진득해야한다고 생각한다. 빠르게 하려고 하니까 생긴 부작용이라고 생각하고 다시 천천히 내 페이스대로 달려보자. 안되면 안되는거지 뭐~

 

 

압구정에 마초 스테이크라고 추성훈이 일본에서 먹어서 화제가 되었던 스테이크 집이 생겼다. 실제 본점에서 비법을 전수받고와서 한국식으로 개조했다고 하는데 오늘은 이거 한번 먹으러 가봐야겠다. (같이 드실 분?)

 

'학습 > TIL' 카테고리의 다른 글

[250428] TIL  (0) 2025.04.29
[250427] TIL  (0) 2025.04.28
[250420] TIL  (2) 2025.04.21
[250416] TIL  (0) 2025.04.17
[250414] TIL  (0) 2025.04.15