데이터분석 교육 (제로베이스)33 [스터디 노트] 22번째 SQL 분석 빅쿼리 (241015), 제로베이스 데이터 분석 스쿨 내용 제로베이스 데이터 분석 스쿨 내용에 대한 기록이다.22번째는 SQL 분석 빅쿼리 강의이다. 빅쿼리도 처음 들었는데 클라우드 기반의 무료 데이터 웨어하우스 툴이다. Big Query[구글 빅쿼리 개요][데이터 웨어하우스]빅쿼리는 GCP의 클라우드 기반 데이터 웨어하우스서비스에 연결된 데이터 베이스에 쿼리를 날리면 문제가 발생할 수 있다.데이터 베이스를 데이터 웨어하우스에 모아서 문제를 방지한다.서비스에 직접적으로 연결되지 않도록 방지한다.SQL 문법을 기반으로 데이터 웨어하우스 조작이 가능하다.[환경 설정]GCP 콘솔 접속왼쪽 위 선 3개 클릭 -> 빅쿼리 클릭크기 순서: 프로젝트 - 데이터셋 - 테이블프로젝트 만들기SQL 쿼리 클릭select 'Hello BigQuery!';쿼리 저장(기존) 클릭 -> .. 2024. 10. 15. [스터디 노트] 21번째 SQL 분석 루커 스튜디오 (241014), 제로베이스 데이터 분석 스쿨 내용 제로베이스 데이터 분석 스쿨 내용에 대한 기록이다.21번째는 SQL 분석 루커 스튜디오 강의이다. 루커 스튜디오는 처음 들었는데 무료에다가 상당히 유용한거 같다. Looker Studio[루커 스튜디오 개요]연습시장 동향 분석 실습[루커 스튜디오]구글의 데이터 스튜디오 리브랜딩구글 제품과 쉽고 빠른 데이터 소스 연결구글과 동일한 공유 및 공동작업 가능편리하게 리포팅 자동화 가능무료 툴[환경 설정 및 시작]루커 스튜디오 접속시작하기 누르면 바로 사용 가능만들기 버튼으로 대시보드 제작 시작데이터 소스 선택 -> 추가 클릭[루커 스튜디오 인터페이스]왼쪽에 큰 부분이 캔버스캔버스에 표나 차트 표시오른쪽에 있는 요소들이 패널속성 패널설정 영역에서 데이터 필드 수정스타일 영역에서 디자인 수정아래 화살표 버튼 누르면.. 2024. 10. 15. [스터디 노트] 20번째 SQL 분석 태블로 (241013), 제로베이스 데이터 분석 스쿨 내용 제로베이스 데이터 분석 스쿨 내용에 대한 기록이다.20번째도 SQL 분석 태블로 강의이다. 태블로 강의는 마무리 되었고 과제를 수행하고 다음 프로그램으로 넘어간다. [영역 차트]시간에 따라 비중의 변화를 볼 때 사용하는 그래프선반에서 측정값 -> 퀵테이블 계산 -> 구성 비율마크 카드에서 측정값 -> 퀵테이블 계산 -> 구성 비율선반에서 측정값 -> 다음을 사용하여 계산 -> 테이블 아래로마크 카드에서 측정값 -> 다음을 사용하여 계산 -> 테이블 아래로라인 그래프를 그리고 마크 카드에서 영역으로 변경시간에 따른 비중을 보고싶은 차원을 드래그 해서 색상에 드랍[응용 라인 그래프]측정값 하나 먼저 선택시계열 같은 차원 선택선반에서 커맨드 + 측정값 바로 옆으로 드래그 앤 드랍이중축아래 차트 측정값 -> 퀵.. 2024. 10. 13. [스터디 노트] 19번째 SQL 분석 태블로 (241010), 제로베이스 데이터 분석 스쿨 내용 제로베이스 데이터 분석 스쿨 내용에 대한 기록이다.19번째도 SQL 분석 태블로 강의이다. 태블로는 개인적으로 듣고싶었던 강의라서 매우 만족한다.확실히 엑셀같은 프로그램보다 너무 편하다. [태블로 기초][태블로 인터페이스]작업 화면태블로 작업 시 메인 화면왼쪽 위 태블로 로고 클릭 -> 데이터 연결 클릭사이드바가장 왼쪽에 위치데이터셋 표시데이터 탭과 분석 탭이 있다.컬럼을 데이터 필드라고 부른다.각 컬럼이 어떤 데이터 타입인지 아이콘으로 표시Abc(스트링), #(숫자), 달력(날짜), 등마크 카드시각화 관련 툴 모음현재 작업중인 데이터 필드를 수정할 수 있다.새 데이터 필드를 여기에 드래그 앤 드랍해서 사용해도 된다.선반가운데 위에 '행' 부분과 '열' 부분사이드바에서 데이터를 올리는 부분뷰선반 바로 아.. 2024. 10. 10. [스터디 노트] 18번째 SQL 분석 태블로 (241007), 제로베이스 데이터 분석 스쿨 내용 제로베이스 데이터 분석 스쿨 내용에 대한 기록이다.18번째는 SQL 분석 태블로 강의이다. 태블로는 개인적으로 듣고싶었던 강의이다.패스트 캠퍼스에서 따로 들어야하나 했는데 제로베이스에 포함된 강의였다.매우 만족! Tableau[태블로 개요][데이터 분석가의 주요 업무]경영진 리포팅실시간 모니터링 대시보드분석 과제 수행[BI]Business Intelligence비즈니스 의사결정에 데이터가 사용되는 방식data-driven, 구체적 방향 도출data-informed, 이전 성과에 대한 이해data-inspired, 새로운 방향성데이터가 중요한 것은 맞지만 복잡하고 다루기 힘들다.BI는 데이터가 비즈니스에 사용될 수 있게 지원하는 모든 활동이다.데이터 시각화정보와 데이터를 그래프로 나타내는 것이다.접근하기 .. 2024. 10. 7. [스터디 노트] 17번째 머신러닝 기초 (241004), 제로베이스 데이터 분석 스쿨 내용 제로베이스 데이터 분석 스쿨 내용에 대한 기록이다.17번째는 머신러닝 기초 강의이다. 대부분 알고 있는 내용이라 정리하는 것에 집중했다.기존에 혼공머신으로 작성한 깃허브 노트에 추가로 더해서 작성했다.ADsP에서 배운 내용들에도 추가로 작성했다. [ML]경험을 통해 자동으로 개선하는 컴퓨터 알고리즘.알고리즘을 사용하여 데이터에서 패턴을 찾는다.간단하게 정의하면 머신 랭귀지로 러닝시키는 것.인풋(데이터셋)을 주고, 익명의 함수(람다)를 사용하며, 아웃풋(정답지)를 알려준다.기본 : 회귀(Regression), 분류(Classification)회귀(regression) : 임의의 숫자를 예측. 연속성 결과, 시퀀셜 결과. (ex. 고객 별 연체 확률 예측, 상품 판매량 예측)분류(classification.. 2024. 10. 4. [스터디 노트] 16번째 기초통계 (241003), 제로베이스 데이터 분석 스쿨 내용 제로베이스 데이터 분석 스쿨 내용에 대한 기록이다.16번째는 기초통계 강의이다. 대부분 알고 있는 내용이라 정리하는 것에 집중했다.더 자세한 내용들을 기존 깃허브 노트들을 쭉 읽어봤다. [개념 용어]증감률(%) vs 퍼센티지 포인트(%p)증감률%, 이전 기간 대비 현재 기간의 값 변화(현재 - 이전)/(이전) * 100ex. 매출 성장률퍼센티지 포인트%p, 퍼센트 자체의 증감을 나타내는 단위(현재% - 이전%)마켓 쉐어 퍼센티지 증가증감률은 값을 기준으로 변화가 어떤지 볼 때 사용한다.퍼센티지 포인트는 퍼센트 자체의 변화를 표현하기 위해 사용한다.기술통계량데이터의 전반적인 특성을 이해분석의 방향성을 결정중심의 경향성: 평균, 중앙값, 최빈값평균, (장) 가장 대표, (단) outlier 영향 큼중앙값, .. 2024. 10. 3. [스터디 노트] 15번째 선형대수 (241002), 제로베이스 데이터 분석 스쿨 내용 제로베이스 데이터 분석 스쿨 내용에 대한 기록이다.15번째는 선형대수 강의이다. [LU 분해]분해factorization, decomposition하나의 행렬을 2개 이상의 행렬 곱으로 표현한 식A = BCLU decomposition방정식을 푸는 방법 중 하나행 줄임 (row reduction)으로 A를 LU 분해하여 방정식을 푼다.L: a unit lower triangular matrix, 하삼각행렬U: echelon form, 사다리꼴행렬LU 분해 방법은 역행렬 방법보다 3배 빠르다.LU 디컴포지션으로 해 찾기Ax=bA=LU 이므로, LUx=bUx=y 로 치환하면, Ly=bLUx=Ly=b 이다.Ux에서 값을 구하면 y의 해가 나온다.Ly에서 값을 구하면 x의 해 b를 찾을 수 있다.L과 U는 변수.. 2024. 10. 2. [스터디 노트] 14번째 선형대수 (240930), 제로베이스 데이터 분석 스쿨 내용 제로베이스 데이터 분석 스쿨 내용에 대한 기록이다.14번째는 선형대수 강의이다. [선형 방정식]정의linear equationa_1 x_1 + a_2 x_2 + ... + a_n x_n = bx에 대한 차수가 1차로 이루어진 방정식.x에 대한 차수가 2차이거나 음수면 비선형 방정식이다.선형 방정식 계a system of linear equation, linear system2개 이상의 선형 방정식이 있을 때 집합으로 부를 수 있다.같은 변수들을 포함한 선형 방정식이 1개 또는 그 이상의 집합을 뜻한다.같은 변수가 반드시 1개 이상 있어야 한다.해의 집합solution set선형 시스템에서 모든 가능한 해의 집합2개의 직선은 1개 점의 해를 갖는다.2개의 면은 직선으로 된 해의 집합을 갖는다.같은 솔루션 .. 2024. 9. 30. [스터디 노트] 13번째 선형대수 (240927), 제로베이스 데이터 분석 스쿨 내용 제로베이스 데이터 분석 스쿨 내용에 대한 기록이다.13번째는 선형대수 강의이다. 12번째에서 데이터 분석과 관련된 파이썬을 마무리했다.13번째 부터는 선형대수에 대한 내용이다.옛날에 깃허브에 메모한 자료가 있는데 이어서 작성했다. [벡터 기본]벡터의 정의물건을 운반하는 물체, 캐리어의 라틴어사물의 움직임을 표현하기 위한 가장 기본적인 구성요소크기와 방향을 모두 가지는 양크기만 가지는 것을 스칼라벡터의 성질동등성크기와 방향만을 가진다.출발 지점은 아무 의미가 없다.출발 지점이 달라도 크기와 방향이 같으면 같은 벡터이다.영벡터크기가 0인 벡터를 영벡터라고 한다.음 벡터자신과 더했을 때 결과가 영벡터가 되는 벡터를 음벡터라 한다.a의 음벡터는 -a라고 표시한다.벡터의 성분벡터를 축에 projection하여 성.. 2024. 9. 27. 이전 1 2 3 4 다음