목록2024/11 (14)
susinlee 님의 블로그
순식간에 1주차가 끝이났다. SQL 기초부터 직무 관련 라이브 세션, 직무조사 팀별 발표 . . . 등등 아직 어렵고 혼란스러운 부분도 있지만 진행하면서 데이터 분석에는 어떤 직업들이 있는지, 어떤 역량이 필요하고 배워야 하는지에 대해 알게되었고 나 자신은 어디에 위치하고 있는지 평가도 할 수 있었다.또 팀원들에게서도 많은 것들을 배울 수 있었다. 발표 자료 수집부터 PPT, 발표대본 만들기, 발표하는 것까지 너무 멋있었는데 그런 부분을 더 경험하고 배우고 싶다고 느꼈다. 아무튼 다음 주는 이번주보다도 더 계획적으로 참여해야겠다.
SQL1. SELECT 절에서는 GROUP BY에 포함된 컬럼, 집계 함수로 계산된 값만 사용할 수 있는데.. GROUP BY에 포함된 컬럼과 1:1 관계인 컬럼은 SELECT 절에서 사용 가능함 예를 들어, USER_ID 로 그룹화할 때, 해당 그룹의 NICKNAME 이 고유하다면 SELECT 절에서 이를 사용할 수 있음 2. 조인을 할 때 컬럼명이 같지 않다면 별칭을 생략해도 됨 3. 윈도우함수() OVER(PARTION BY COL1, ORDER BY COL2) Python1. 코드카타가 계속해서 어려워지고 있다.. 알고리즘 효율도 문제지만 문제해결력 역시도 문제다. 고민 또 고민하고 내가 문제를 푸는 프로세스를 코드로는 어떻게 구현할 것인지 노트에 써가면서 풀고 다른 사람은 어떻게 풀었는지도..
PYTHON코드카타에서 문제를 푸는데 슬슬 어려워지기 시작했다. 시간이 걸리더라도 오늘처럼 노트에 코드프로세스 적어가면서 이해와 해결능력향상을 목적으로 풀어가자. 1. x를 n으로 나눈 나머지는 x를 n진법으로 표시했을 때 가장 오른쪽에 오는 친구다.ex) 125 % 3 = 2. 125 = 11122(3) 몫 41을 또 3으로 나눈 나머지는 2 인데 이는 오른쪽에서 두번째에 위치한다 111'2'2(3)int('11122', 3) = 125 로 3진법으로 표기된 문자열을 10진법으로 변환시킨다. 아래는 3진법으로 표기한 뒤 뒤집어서 다시 10진법으로 표기하는 코드다def solution(n): tmp = '' while n: tmp += str(n % 3) # 3진법으로 표기된 수를 뒤집어서..
SQL1. DATE 타입 컬럼도 SUBSTR이나 LIKE를 사용할 수 있음ex) WHERE datetime LIKE '2022-05%' → datetime이 2022년 5월인 행들만 필터링 2. REGEXP(=RLIKE) 'A|B|C' → A, B 또는 C라는 문자열이 포함된 행을 검색 PYTHON1. sum() 함수는 값을 순차적으로 처리하기 때문에, 내부에 제너레이터 표현식을 전달해도 됨 ex) sum(absolutes if sign else -absolutes for absolutes, sign in zip(absolutes, signs)) 공통1. 정규표현식에 대해 조금 배웠음 일단 이번 주는 데이터 핸들링만 무진장 파보자!
SQL- MySQL에서는 실행순서와 참조순서가 달라서 SELECT 문의 별칭을 GROUP BY, HAVING 절에서도 사용할 수 있음 Python- DataFrame 에서 기본이 되는 내용들을 중점적으로 학습했다. 컬럼 삭제, 변경, 생성, 값 수정, 인덱스 설정 등에 대해 배웠고 엑셀에 정리하는 시간을 가짐. 이러한 것들을 배워갈 때마다 이런 테이블을 SQL 코드로는 어떻게 짰었지? 를 생각하면서 하는데 효과가 좋은 것 같음. iloc에서 불리언배열로 필터링하는건 오류뜨고, 리스트로 형변환(불리언 마스크라고 함) 해줘야 함. 그냥 loc로 하자 라이브 세션- 데이터 분석가는 스토리텔러다... 라는 말이 참 공감됨. 이를 위해서는 문제 정의부터 해결까지 쭉 진행하고 그것을 잘 글로 녹여서 작성(프로젝트..
질문을 할 때 내가 듣고싶은 말이 있다면, 애둘러 말하지 말고 "이러한 생각을 하고 있는데 어떻게 생각하시는 지 궁금합니다" 라고 질문하기 주제를 정하고 자료를 정리해서 발표하는 걸 처음해봤는데 생각보다 쉽지않았음. PPT 작성하는 법부터 대본쓰는 것까지 연습이 필요할 것 같다. 팀원들이 어떻게 발표하는지도 잘 관찰하고 스스로를 피드백해봐야겠음 넘파이나 판다스를 다루는 기초를 배움. 테이블을 조작할 때 SQL과 데이터프레임 두 가지 툴 모두 사용할 수 있도록 연습할 예정. SQL 문제를 파이썬으로도 풀어보기 (튜터쌤이 좋은 방향이라고 말씀해주심)

1. “Python은 가독성이 높고 문법이 쉽다”라는 문장에 증거가 될 사례를 작성해주세요. 두 코드 모두 구구단을 작성하는 코드이고 위에는 c로 아래는 python으로 작성하였다.딱봐도 파이썬이 직관적이고 가독성이 좋음을 알 수 있다. 2. 가독성이 좋은 언어를 사용했을때 어떤 이점이 있나요?한 눈에 이 코드가 어떠한 코드인지 알 수 있을 가능성이 높고 그 이후에 유지보수에도 유리하다.또한 배우기가 쉽다는 점이 장점이다. 3. 데이터 분석가가 Python을 알아야하는 이유는 무엇인가요?파이썬은 접근성이 좋고 무료이며 커뮤니티가 잘 활성화되어있는데 그래서 데이터분석 관련 라이브러리가 매우 많다. 테이블데이터를 다루거나 데이터를 시각화한다거나, 머신러닝을 돌린다거나 데이터 분석 관련 업무를 파이썬을 통해..
서브쿼리와 조인에 대해서 조금 심화학습을 했는데 확실히 어려웠고 자주 접하고 사용해서 익숙해져야겠다는 생각이 들었다.