2024/11 14

1주차 WIL

순식간에 1주차가 끝이났다. SQL 기초부터 직무 관련 라이브 세션, 직무조사 팀별 발표 . . . 등등 아직 어렵고 혼란스러운 부분도 있지만 진행하면서 데이터 분석에는 어떤 직업들이 있는지, 어떤 역량이 필요하고 배워야 하는지에 대해 알게되었고 나 자신은 어디에 위치하고 있는지 평가도 할 수 있었다.또 팀원들에게서도 많은 것들을 배울 수 있었다. 발표 자료 수집부터 PPT, 발표대본 만들기, 발표하는 것까지 너무 멋있었는데 그런 부분을 더 경험하고 배우고 싶다고 느꼈다. 아무튼 다음 주는 이번주보다도 더 계획적으로 참여해야겠다.

TIL 2024.11.29

[241129] TIL

SQL1. SELECT 절에서는 GROUP BY에 포함된 컬럼, 집계 함수로 계산된 값만 사용할 수 있는데.. GROUP BY에 포함된 컬럼과 1:1 관계인 컬럼은 SELECT 절에서 사용 가능함 예를 들어, USER_ID 로 그룹화할 때, 해당 그룹의 NICKNAME 이 고유하다면 SELECT 절에서 이를 사용할 수 있음 2. 조인을 할 때 컬럼명이 같지 않다면 별칭을 생략해도 됨 3. 윈도우함수() OVER(PARTION BY COL1, ORDER BY COL2)  Python1.  코드카타가 계속해서 어려워지고 있다..  알고리즘 효율도 문제지만 문제해결력 역시도 문제다. 고민 또 고민하고 내가 문제를 푸는 프로세스를 코드로는 어떻게 구현할 것인지 노트에 써가면서 풀고 다른 사람은 어떻게 풀었는지도..

TIL 2024.11.29

[241128] TIL

PYTHON코드카타에서 문제를 푸는데 슬슬 어려워지기 시작했다. 시간이 걸리더라도 오늘처럼 노트에 코드프로세스 적어가면서 이해와 해결능력향상을 목적으로 풀어가자. 1. x를 n으로 나눈 나머지는 x를 n진법으로 표시했을 때 가장 오른쪽에 오는 친구다.ex) 125 % 3 = 2.  125 = 11122(3) 몫 41을 또 3으로 나눈 나머지는 2 인데 이는 오른쪽에서 두번째에 위치한다 111'2'2(3)int('11122', 3) = 125 로 3진법으로 표기된 문자열을 10진법으로 변환시킨다. 아래는 3진법으로 표기한 뒤 뒤집어서 다시 10진법으로 표기하는 코드다def solution(n): tmp = '' while n: tmp += str(n % 3) # 3진법으로 표기된 수를 뒤집어서..

TIL 2024.11.28

[241127] TIL

SQL1. DATE 타입 컬럼도 SUBSTR이나 LIKE를 사용할 수 있음ex) WHERE datetime LIKE '2022-05%' → datetime이 2022년 5월인 행들만 필터링 2. REGEXP(=RLIKE) 'A|B|C' → A, B 또는 C라는 문자열이 포함된 행을 검색  PYTHON1. sum() 함수는 값을 순차적으로 처리하기 때문에, 내부에 제너레이터 표현식을 전달해도 됨 ex) sum(absolutes if sign else -absolutes for absolutes, sign in zip(absolutes, signs)) 공통1. 정규표현식에 대해 조금 배웠음 일단 이번 주는 데이터 핸들링만 무진장 파보자!

TIL 2024.11.27

[241126] TIL

SQL- MySQL에서는 실행순서와 참조순서가 달라서 SELECT 문의 별칭을 GROUP BY, HAVING 절에서도 사용할 수 있음  Python- DataFrame 에서 기본이 되는 내용들을 중점적으로 학습했다. 컬럼 삭제, 변경, 생성, 값 수정, 인덱스 설정 등에 대해 배웠고 엑셀에 정리하는 시간을 가짐. 이러한 것들을 배워갈 때마다 이런 테이블을 SQL 코드로는 어떻게 짰었지? 를 생각하면서 하는데 효과가 좋은 것 같음. iloc에서 불리언배열로 필터링하는건 오류뜨고, 리스트로 형변환(불리언 마스크라고 함) 해줘야 함. 그냥 loc로 하자 라이브 세션- 데이터 분석가는 스토리텔러다... 라는 말이 참 공감됨. 이를 위해서는 문제 정의부터 해결까지 쭉 진행하고 그것을 잘 글로 녹여서 작성(프로젝트..

TIL 2024.11.26

[241125] TIL

질문을 할 때 내가 듣고싶은 말이 있다면, 애둘러 말하지 말고 "이러한 생각을 하고 있는데 어떻게 생각하시는 지 궁금합니다" 라고 질문하기 주제를 정하고 자료를 정리해서 발표하는 걸 처음해봤는데 생각보다 쉽지않았음. PPT 작성하는 법부터 대본쓰는 것까지 연습이 필요할 것 같다. 팀원들이 어떻게 발표하는지도 잘 관찰하고 스스로를 피드백해봐야겠음 넘파이나 판다스를 다루는 기초를 배움. 테이블을 조작할 때 SQL과 데이터프레임 두 가지 툴 모두 사용할 수 있도록 연습할 예정. SQL 문제를 파이썬으로도 풀어보기 (튜터쌤이 좋은 방향이라고 말씀해주심)

TIL 2024.11.25

[241120] TIL

1. “Python은 가독성이 높고 문법이 쉽다”라는 문장에 증거가 될 사례를 작성해주세요.  두 코드 모두 구구단을 작성하는 코드이고 위에는 c로 아래는 python으로 작성하였다.딱봐도 파이썬이 직관적이고 가독성이 좋음을 알 수 있다. 2. 가독성이 좋은 언어를 사용했을때 어떤 이점이 있나요?한 눈에 이 코드가 어떠한 코드인지 알 수 있을 가능성이 높고 그 이후에 유지보수에도 유리하다.또한 배우기가 쉽다는 점이 장점이다. 3. 데이터 분석가가 Python을 알아야하는 이유는 무엇인가요?파이썬은 접근성이 좋고 무료이며 커뮤니티가 잘 활성화되어있는데 그래서 데이터분석 관련 라이브러리가 매우 많다. 테이블데이터를 다루거나 데이터를 시각화한다거나, 머신러닝을 돌린다거나 데이터 분석 관련 업무를 파이썬을 통해..

TIL 2024.11.20