본문 바로가기

분류 전체보기96

[스터디 노트] 28번째 개인 프로젝트 (241029), 제로베이스 데이터 분석 스쿨 내용 제로베이스 데이터 분석 스쿨 내용에 대한 기록이다.28번째는 개인 프로젝트 내용이다. 일주일 동안은 강의는 잠시 멈춰두고 개인 프로젝트를 왕창 했다.산업군별 10개의 프로젝트를 진행했고 실전 감각을 익혔다.실전 분석에 사용할 베이스라인을 세우고 감을 익혔다.과정에서 아주 만족스러운 부분 중 하나이다. [분석 코드 baseline][데이터 전처리 4단계]데이터 형태 확인df.shape데이터 타입 확인df.info()숫자로 보이는데 문자인 경우 확인문자로 보이는데 숫자인 경우 확인object 타입(스트링) 확인인트 플롯 확인NULL 값 확인df.isnull().sum()outlier 확인df.describe()특히 min, max에 음수값 있는지 확인도메인 지식 기반으로 처리[EDA baseline]데이터.. 2024. 10. 29.
[스터디 노트] 27번째 SQL 분석 Power BI (241023), 제로베이스 데이터 분석 스쿨 내용 제로베이스 데이터 분석 스쿨 내용에 대한 기록이다.27번째는 SQL 분석 Power BI 강의이다. 맥북이라 아주 당황스럽지만...ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ보편적으로 사용하는 분석 툴이라서 배워두면 쓸모 있을 것 같다.앞에서 했던 루커 스튜디오와 매우 유사한 UI를 가지고 있다. Power BI[파워BI 개요]맥북 설치 불가 (ㅎㅁㅎ?)[작업 환경]루커 스튜디오와 매우 유사하다.시각화 탭데이터 탭좌측상단보고서 보기: 대시보드 보기데이터 보기: 테이블 미리보기ERD 보기: ERD로 보기[데이터 가져오기]csv 가져오기상단 툴바 -> 데이터 가져오기 -> 텍스트.csv 클릭컬럼명이 망가져 있다.상단 툴바 -> 데이터 변환 -> 데이터 변환 클릭상단 툴바 -> 첫 행을 머리글로 사용 클릭닫기 및 적용상단 툴바 .. 2024. 10. 23.
[스터디 노트] 26번째 SQL 분석 디비버 (241021), 제로베이스 데이터 분석 스쿨 내용 제로베이스 데이터 분석 스쿨 내용에 대한 기록이다.26번째는 SQL 분석 디비버 강의이다. 보통 그냥 터미널에서 MySQL을 코딩하는데,디비버는 파이썬-파이참처럼 MySQL을 쉽게 사용할 수 있는 도구이다.터미널에서 자동완성 같이 좀 답답한 부분들이 있었는데 사용성이 아주 좋았다. DBeaver[디비버 개요][디비버 장점]오픈소스 툴다양한 DB 지원직관적 인터페이스쉬운 importERD 그리기 가능[초기 환경설정]Upper case윈도우 탭 -> 환경설정 -> 편집기 -> SQL 편집기 -> SQL 포맷keyword case를 Upper로 고치기행번호 표시윈도우 탭 -> 환경설정 -> 편집기 -> 문서 편집기행번호 표시 체크[자주 쓰는 단축키]CMD + ENTER: 현재 쿼리 실행CMD + : 새탭에서 .. 2024. 10. 21.
[스터디 노트] 25번째 SQL 분석 빅쿼리 태블로 루커 (241020), 제로베이스 데이터 분석 스쿨 내용 제로베이스 데이터 분석 스쿨 내용에 대한 기록이다.25번째도 SQL 분석 빅쿼리 태블로 루커 강의이다. 여기서 부터는 빅쿼리, 태블로, 루커를 왔다갔다 하면서 복합적으로 사용한다.그리고 대부분 실습하는 내용이라 메모가 많지는 않다. 태블로 부분[실전 팁]레이블 추가할 때 선반이랑 통일시키는 방법선반에 있는 측정값 CMD 누르고 드래그 앤 드랍테이블 계산값 어떻게 구하는지 시각화해서 편집마크 카드에 측정값 아래 삼각형 -> 테이블 계산 편집이동평균선 시각화측정값 아래 삼각형 -> 퀵테이블 계산 -> 이동평균선연평균 성장률해당 기간동안 평균적으로 얼마나 성장 했는지에 대한 지표태블로에서는 통합성장률(CAGR) 사용하면 된다.산술평균이 아니라 기하평균으로 계산한다.선반에 있는 측정값 바로 바꾸기원하는 측정값을.. 2024. 10. 21.
[스터디 노트] 24번째 SQL 분석 빅쿼리 태블로 루커 (241019), 제로베이스 데이터 분석 스쿨 내용 제로베이스 데이터 분석 스쿨 내용에 대한 기록이다.24번째도 SQL 분석 빅쿼리 태블로 루커 강의이다. 여기서 부터는 빅쿼리, 태블로, 루커를 왔다갔다 하면서 복합적으로 사용한다.그리고 대부분 실습하는 내용이라 메모가 많지는 않다. 루커 부분[루커 스튜디오 심화][빅쿼리 연계]빅쿼리로 쿼리 작성 해놓고 복사하기루커에서 새 보고서 열기 -> 데이터 추가에서 빅쿼리맞춤 검색어 -> 데이터 베이스 선택 -> 쿼리 입력 -> 쿼리 붙여넣기 -> 추가[대시보드 레이아웃]테마 변경상단 툴바 -> 테마 및 레이아웃 -> 원하는 테마 선택스코어카드 추가데이터 패널에서 데이터 하나 드래그 앤 드랍스타일 -> 모든 가운데 정렬영역 박스 추가상단 툴바 -> 도형 -> 도형 만들고 우클릭, 주문 -> 맨뒤로 보내기[매개변수와.. 2024. 10. 19.
[스터디 노트] 23번째 SQL 분석 빅쿼리 (241016), 제로베이스 데이터 분석 스쿨 내용 제로베이스 데이터 분석 스쿨 내용에 대한 기록이다.23번째도 SQL 분석 빅쿼리 강의이다. 이번까지 빅쿼리 강의를 마무리 짓고다음부터는 빅쿼리로 만든 데이터셋을 태블로로 시각화 한다. 대부분 실습하는 내용이라 메모가 많지는 않다. [날짜별 지표 쿼리]연도별 집계하기2번 셀렉트에 extract(year from ord.order_approved_at) as ord_year, 추가3번 셀렉트에 ord_year 추가3번 맨아래에 group by ord_year와 order by ord_year 적기[실습: 대시보드 데이터 만들기][데이터셋 준비]쿼리 수정1번with tb as ( select item.order_id, sum(item.price) as ord_amt, count(item.order_item_i.. 2024. 10. 16.
[스터디 노트] 22번째 SQL 분석 빅쿼리 (241015), 제로베이스 데이터 분석 스쿨 내용 제로베이스 데이터 분석 스쿨 내용에 대한 기록이다.22번째는 SQL 분석 빅쿼리 강의이다. 빅쿼리도 처음 들었는데 클라우드 기반의 무료 데이터 웨어하우스 툴이다. Big Query[구글 빅쿼리 개요][데이터 웨어하우스]빅쿼리는 GCP의 클라우드 기반 데이터 웨어하우스서비스에 연결된 데이터 베이스에 쿼리를 날리면 문제가 발생할 수 있다.데이터 베이스를 데이터 웨어하우스에 모아서 문제를 방지한다.서비스에 직접적으로 연결되지 않도록 방지한다.SQL 문법을 기반으로 데이터 웨어하우스 조작이 가능하다.[환경 설정]GCP 콘솔 접속왼쪽 위 선 3개 클릭 -> 빅쿼리 클릭크기 순서: 프로젝트 - 데이터셋 - 테이블프로젝트 만들기SQL 쿼리 클릭select 'Hello BigQuery!';쿼리 저장(기존) 클릭 -> .. 2024. 10. 15.
[스터디 노트] 21번째 SQL 분석 루커 스튜디오 (241014), 제로베이스 데이터 분석 스쿨 내용 제로베이스 데이터 분석 스쿨 내용에 대한 기록이다.21번째는 SQL 분석 루커 스튜디오 강의이다. 루커 스튜디오는 처음 들었는데 무료에다가 상당히 유용한거 같다. Looker Studio[루커 스튜디오 개요]연습시장 동향 분석 실습[루커 스튜디오]구글의 데이터 스튜디오 리브랜딩구글 제품과 쉽고 빠른 데이터 소스 연결구글과 동일한 공유 및 공동작업 가능편리하게 리포팅 자동화 가능무료 툴[환경 설정 및 시작]루커 스튜디오 접속시작하기 누르면 바로 사용 가능만들기 버튼으로 대시보드 제작 시작데이터 소스 선택 -> 추가 클릭[루커 스튜디오 인터페이스]왼쪽에 큰 부분이 캔버스캔버스에 표나 차트 표시오른쪽에 있는 요소들이 패널속성 패널설정 영역에서 데이터 필드 수정스타일 영역에서 디자인 수정아래 화살표 버튼 누르면.. 2024. 10. 15.
[스터디 노트] 20번째 SQL 분석 태블로 (241013), 제로베이스 데이터 분석 스쿨 내용 제로베이스 데이터 분석 스쿨 내용에 대한 기록이다.20번째도 SQL 분석 태블로 강의이다. 태블로 강의는 마무리 되었고 과제를 수행하고 다음 프로그램으로 넘어간다. [영역 차트]시간에 따라 비중의 변화를 볼 때 사용하는 그래프선반에서 측정값 -> 퀵테이블 계산 -> 구성 비율마크 카드에서 측정값 -> 퀵테이블 계산 -> 구성 비율선반에서 측정값 -> 다음을 사용하여 계산 -> 테이블 아래로마크 카드에서 측정값 -> 다음을 사용하여 계산 -> 테이블 아래로라인 그래프를 그리고 마크 카드에서 영역으로 변경시간에 따른 비중을 보고싶은 차원을 드래그 해서 색상에 드랍[응용 라인 그래프]측정값 하나 먼저 선택시계열 같은 차원 선택선반에서 커맨드 + 측정값 바로 옆으로 드래그 앤 드랍이중축아래 차트 측정값 -> 퀵.. 2024. 10. 13.
[스터디 노트] 19번째 SQL 분석 태블로 (241010), 제로베이스 데이터 분석 스쿨 내용 제로베이스 데이터 분석 스쿨 내용에 대한 기록이다.19번째도 SQL 분석 태블로 강의이다. 태블로는 개인적으로 듣고싶었던 강의라서 매우 만족한다.확실히 엑셀같은 프로그램보다 너무 편하다. [태블로 기초][태블로 인터페이스]작업 화면태블로 작업 시 메인 화면왼쪽 위 태블로 로고 클릭 -> 데이터 연결 클릭사이드바가장 왼쪽에 위치데이터셋 표시데이터 탭과 분석 탭이 있다.컬럼을 데이터 필드라고 부른다.각 컬럼이 어떤 데이터 타입인지 아이콘으로 표시Abc(스트링), #(숫자), 달력(날짜), 등마크 카드시각화 관련 툴 모음현재 작업중인 데이터 필드를 수정할 수 있다.새 데이터 필드를 여기에 드래그 앤 드랍해서 사용해도 된다.선반가운데 위에 '행' 부분과 '열' 부분사이드바에서 데이터를 올리는 부분뷰선반 바로 아.. 2024. 10. 10.