분류 전체보기96 [논문 리뷰] LLaMA v1 요약, 코드, 구현 논문을 상세히 번역하고 한단어씩 해석해주는 포스팅은 많다.나는 논문을 누구나 알아듣도록 쉽고 간결하게 전달하고자 한다. LLaMA v1LLaMA: Open and Efficient Foundation Language ModelsTOUVRON, Hugo, et al. Llama: Open and efficient foundation language models. arXiv preprint arXiv:2302.13971, 2023. 논문 원문 링크 참고로 LLaMA는 Large Language model Meta AI의 줄임말이다. 저자의 의도7B ~ 65B 크기의 foundation language 모델을 만든다.독점적이고 비공개된 데이터가 아니라 오픈 데이터로 SOTA를 달성해보자.저자들은 리서치 커뮤니.. 2025. 3. 31. [취준] 5번째, 데이터 사이언티스트 면접 준비 데이터 사이언티스트.정말로 정보를 찾기가 힘든 직종이다.취업하는 과정이 험난하고 막막하다.나는 다음 세대가 더 편하게 취업을 했으면 하는 생각에 취업 준비 기록을 남긴다.코딩 테스트가 준비가 끝났다면 이제 면접을 준비하면 된다.코딩 테스트 관련 포스팅의 링크는 여기. [DS 취업준비] 4번째, 데이터 사이언티스트 코딩 테스트 준비데이터 사이언티스트.정말로 정보를 찾기가 힘든 직종이다.취업하는 과정이 험난하고 막막하다.나는 다음 세대가 더 편하게 취업을 했으면 하는 생각에 취업 준비 기록을 남긴다.이력서를 다davidlds.tistory.com 그리고 완성된 면접 준비 자료를 보여주자면 링크는 여기. 그리고 사실 코딩 테스트는 안보는 경우가 많다.그러니 코딩 테스트와 면접을 동시에 준비하며 지원까지 하도록.. 2025. 3. 24. [취준] 4번째, 데이터 사이언티스트 코딩 테스트 준비 데이터 사이언티스트.정말로 정보를 찾기가 힘든 직종이다.취업하는 과정이 험난하고 막막하다.나는 다음 세대가 더 편하게 취업을 했으면 하는 생각에 취업 준비 기록을 남긴다.이력서를 다 만들었다면 이제 코딩 테스트를 준비하면 된다.이력서 관련 포스팅의 링크는 여기. [DS 취업준비] 3번째, 데이터 사이언티스트 이력서 작성하기데이터 사이언티스트.정말로 정보를 찾기가 힘든 직종이다.취업하는 과정이 험난하고 막막하다.나는 다음 세대가 더 편하게 취업을 했으면 하는 생각에 취업 준비 기록을 남긴다. 포트폴리오davidlds.tistory.com 그리고 완성된 코딩 테스트 자료를 보여주자면 링크는 여기. 1. 코딩 테스트 종류데이터 사이언티스트는 어떤 코딩 테스트를 주로 볼지가 먼저 궁금할 것이다.정답은 '주로 코.. 2025. 3. 3. [취준] 3번째, 데이터 사이언티스트 이력서 작성하기 데이터 사이언티스트.정말로 정보를 찾기가 힘든 직종이다.취업하는 과정이 험난하고 막막하다.나는 다음 세대가 더 편하게 취업을 했으면 하는 생각에 취업 준비 기록을 남긴다. 포트폴리오를 다 만들었다면 이제 이력서를 작성하면 된다.포트폴리오 관련 포스팅의 링크는 여기. [DS 취업준비] 2번째, 데이터 사이언티스트 포트폴리오 만들기데이터 사이언티스트.정말로 정보를 찾기가 힘든 직종이다.취업하는 과정이 험난하고 막막하다.나는 다음 세대가 더 편하게 취업을 했으면 하는 생각에 취업 준비 기록을 남긴다. 포트폴리오davidlds.tistory.com 그리고 완성된 이력서를 먼저 보여주자면 링크는 여기. 0. 개요이력서는 왜 쓰는가. 그 답은 면접장에 가기 위한 것이다.면접을 한다는 것을 목표로 쓰는 것을 항상 명.. 2025. 2. 28. [취준] 2번째, 데이터 사이언티스트 포트폴리오 만들기 데이터 사이언티스트.정말로 정보를 찾기가 힘든 직종이다.취업하는 과정이 험난하고 막막하다.나는 다음 세대가 더 편하게 취업을 했으면 하는 생각에 취업 준비 기록을 남긴다. 포트폴리오를 위한 프로젝트 진행을 다 했다면 이제 포트폴리오로 합치면 된다.프로젝트 관련 포스팅은 링크는 여기. [DS 취업준비] 1번째, 데이터 사이언티스트 프로젝트 진행하기데이터 사이언티스트.정말로 정보를 찾기가 힘든 직종이다.취업하는 과정이 험난하고 막막하다.나는 다음 세대가 더 편하게 취업을 했으면 하는 생각에 취업 준비 기록을 남긴다. 먼저 연구이davidlds.tistory.com 그리고 완성된 포트폴리오를 먼저 보여주자면 링크는 여기. 1. 포맷포트폴리오를 타겟으로 프로젝트를 착실히 진행했다면 합치는건 아주 수월하다.포맷.. 2025. 1. 28. [취준] 1번째, 데이터 사이언티스트 프로젝트 진행하기 데이터 사이언티스트.정말로 정보를 찾기가 힘든 직종이다.취업하는 과정이 험난하고 막막하다.나는 다음 세대가 더 편하게 취업을 했으면 하는 생각에 취업 준비 기록을 남긴다. 먼저 연구이자 개발자 직군인 데이터 사이언티스트를 하고싶다면 포트폴리오가 있어야 한다.3개 정도의 프로젝트를 진행하고 PPT나 깃허브를 만들면 된다. 그런데 드는 의문.신입이 프로젝트를 어디서 하는데요.....ㅎㅁㅎ 그래서 대부분 포트폴리오 학원을 등록해 팀프로젝트를 진행한다.나도 제로베이스 데이터분석 교육을 수강했다.(왜?)제로베이스에는 '데이터 교육'도 있는데 나는 '데이터 분석 교육'을 수강했다.데이터 사이언티스트는 (분석가 + 모델러 + 백엔드 엔지니어) 의 요상한 직무이다.모든 분야를 다 잘해야 할 수 있는데 특히 모델링에 집.. 2025. 1. 24. [스터디 노트] 32번째 Spark Pyspark (241205), 제로베이스 데이터 분석 스쿨 내용 제로베이스 데이터 분석 스쿨 내용에 대한 기록이다.32번째는 Spark Pyspark 강의이다. 저번에 이어서 spark 내용을 진행했다. [스파크 기본][환경 설정]설치 !apt-get install openjdk-8-jdk-headless!wget -q https://archive.apache.org/dist/spark/spark-3.0.0/spark-3.0.0-bin-hadoop3.2.tgz!tar -xf spark-3.0.0-bin-hadoop3.2.tgz!pip install findspark!pip install kaggle --upgradeimport osimport findsparkos.environ["JAVA_HOME"] = "/usr/lib/jvm/java-8-openjdk-amd64".. 2024. 12. 5. [스터디 노트] 31번째 Spark Pyspark (241128), 제로베이스 데이터 분석 스쿨 내용 제로베이스 데이터 분석 스쿨 내용에 대한 기록이다.31번째는 Spark Pyspark 강의이다. 실무에서는 진짜 큰 대용량 데이터를 사용할 것이기 때문에분산 컴퓨팅을 꼭 배워보고 싶었다.분산 컴퓨팅으로 가장 보편적으로 알고있는 것은 하둡인데,같은 회사의 아파치에서 나온 분산 컴퓨팅 시스템이다. Spark[스파크 개요][APACHE Spark]분산 클러스터링 컴퓨팅 오픈소스 프레임워크.대규모 데이터 처리용으로 설계됐다.계산 부하를 여러 노드에 분담 병렬 처리한다.구조: cluster manager, driver process, executorscluster manager사용 가능한 자원 파악한다.데이터 처리 작업을 관리하고 조율한다.사용자가 스파크 어플리케이션을 제출하는 곳 이다.driver process.. 2024. 11. 28. [스터디 노트] 30번째 SQL 분석 Power BI (241108), 제로베이스 데이터 분석 스쿨 내용 제로베이스 데이터 분석 스쿨 내용에 대한 기록이다.30번째는 SQL 분석 Power BI 강의이다. 반복된 내용이 많아서 새로 배운 내용들만 따로 추가한다. [Matrix 시각화]시각화 탭 -> 행렬열에 있는 컬럼 행으로 다 넣기+/- 없앨 수 있다.계단형을 펼칠 수 있다.부분합 없앨 수 있다.조건부 서식값의 컬럼 아래 삼각형 -> 조건부 서식 -> 배경색엑셀처럼 규칙 작성하면 원하는 경우만 배경색 설정 가능그라데이션도 줄 수 있다.데이터 막대도 그릴 수 있다.테이블이랑 사실상 같은 데이터인데 모양만 다르다.개인적으로는 행렬이 더 보기 좋은 듯 하다.[신규 테이블과 관계 생성]신규 테이블 생성상단 툴바 -> 데이터 입력 -> 테이블 값 입력 -> 로드제일 우측 데이터 탭에 생겼다.관계 설정좌측 -> 모델.. 2024. 11. 8. [스터디 노트] 29번째 SQL 분석 (241106), 제로베이스 데이터 분석 스쿨 내용 제로베이스 데이터 분석 스쿨 내용에 대한 기록이다.27번째는 SQL 분석 강의이다. 요즘은 팀프로젝트에 전념하고 있어서 강의 들을 시간이 없다...ㅎㅁㅎ그래도 틈틈이 들으면서 메모한 내용이다. [도메인 지식 메모]물류 유통 용어재고: 입고량 - 판매량권장 판매가(list price) -> 할인 -> 실 판매가(net price)SKU: stock keeping unit, 재고 관리를 위한 최소 단위 코드Unit Quantity: 상품의 개수물류 유통 지표DOC: day of coverage, 재고로 몇일 판매 가능한지, (재고량) / (하루 판매량)DOC가 낮으면 빨리 소진 되니까 재고 전환율이 높은 것이다. [실전 팁]완성된 쿼리문 서브쿼리로 사용with 절이 조인도 가능하고 더 좋다.하지만 메모리를 .. 2024. 11. 6. 이전 1 2 3 4 5 ··· 10 다음