일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 스타터스부트캠프
- 브라이틱스스튜디오
- 서포터즈
- 데이터사이언티스트
- 데이터드리븐
- 노코드
- 삼성SDS
- Brightics
- Brightics서포터즈3기
- 부트캠프후기
- Brightics_Studio
- 데이터분석
- 데이터사이언스
- 코딩없이
- 유데미코리아
- 브라이틱스
- 유데미큐레이션
- 데이터시각화
- 로우코드
- 유데미부트캠프
- 유데미
- BrighticsStudio
- Brightics studio
- 취업부트캠프
- 대학생서포터즈
- 태블로
- 브라이틱스서포터즈3기
- 데이콘
- 노코드AI오픈소스
- 대학생대외활동
- Today
- Total
목록전체 글 (64)
지수

1. 과제 피드백 🔸 우리 팀 (1조) - 전략을 도출할 수 있는 대시보드이다. - 디자인이 훌륭하다. - 범례 등 세부적인 내용을 정확하게 확인해야 신뢰를 얻는다. - 결론 리스트가 나와야 한다. 그렇지 않으면 보고 대상을 명확하게 하거나 추후에 필요한 부분을 추가하겠다고 하면 좋다. - 서론은 Top-Down으로 목표를 먼저 설정하고 이슈 트리를 만들면 더 관심을 가진다. 🔸 전체적인 피드백 - 컨설팅을 할 때 실무, 전략, 그리고 그 사이의 대시보드 모두 필요하다. - 호스트 정보를 모두 알 수 있고, csv파일로 뽑을 수 있는 대시보드가 좋다. - 대시보드에 적용한 수치, 전반적인 이론 등을 반드시 숙지하고 있어야 한다. - RAW 데이터에 대한 이해가 충분해야 한다. ➡ 특정 지역의 매출, 수익..

1. 과제 피드백 🔸 우리 팀 (1조) 피드백 # 파레토 법칙에 대한 명확한 설명이 필요하다. # Monthly Review 계산 과정 설명이 필요하다. # 지도에 제목을 추가해야 한다. 🔸 다른 팀 피드백 - 같은 그래프에 표현되는 데이터는 양측 동일하게 점수화를 해야 한다. - 글자 대소문자 통일해야 한다. - 눌러야 하는 것이 많으면 사용 방법을 따로 표시해줘야 한다. - 연도 별은 갭이 커서 분기 별, 월 별로 표현하면 좋다. - [TIP] 태블로는 데이터를 자동 집계하기 때문에 COUNTD 계산해서 확인이 필요하다. 2. 태블로 실습 2.1 UNION / UNION ALL - 실전 프로젝트 시 여러개로 나뉘어져 있는 DB에서 데이터를 추출해야 하는 경우가 있다. - UNION은 컬럼이 모두 동일..

1. 과제 피드백 🔸 우리 팀 (1조) # 단위 조정으로 인해 0K로 노출되는 데이터가 있다. # 계산 실수로 정렬이 제대로 표현이 안됐다. # 상위 20% 고객 필터 조정이 필요하다. 🔸 전체적인 피드백 - 차트 제목을 이해할 수 있게 작성해야 한다. - 최근을 기준으로 결과를 나타내야 한다. - SCORE는 100점 만점이어야 한다. - 부연 설명이 필요한 경우 개별 시트를 만들어서 설명하면 되고, 차트 밑에 설명 텍스트를 추가하면 된다. 이때 수식을 사용하면 안되며 알아볼 수 있는 수도코드를 사용하는 것이 좋다. - 만약 데이터가 시계열의 특성을 가지고 있다면, 전 월보다 수익이 크게 늘어난 호스트 / 오래되었지만 수익이 안나거나 리뷰가 떨어진 호스트 / 첫 두 달은 리뷰 카운트에서 제외하기 등을 ..

1. 과제 피드백 1.1 대시보드 타겟 리마인드 ✅ 의사결정권자 - 의사결정권자는 큰 그림을 보고싶어 한다. - 실무에서는 애매한 질문을 던져주고, 그것을 바탕으로 대시보드를 구성해야 한다. ✅ Region Manager - 인센티브와 직결되기 때문에 본인이 얼마나 하고 있는지를 궁금해한다. - 실적 보고에도 사용하기 때문에 이 대시보드가 얼마나 나에게 유리한지에 대해 관심이 있다. (EX. 서울과 지방 지점의 실적을 비교하는 것은 타당하지 않다.) - 의사결정자가 보기 편하지만 그보다 더 상세한 내용이 있어야 한다. 1.2 팀별 과제 피드백 ✅ 의사결정권자 대시보드 - MOM은 1개년을 보는 것이 좋고, 주로 왼쪽에서 오른쪽으로 보는 것을 선호한다. - 빨간색이 안좋은 것이고 파란색이 좋은 것을 의미한..

1. 데이터 분석가의 업무 데이터 추출 (70%) ➡ 데이터 분석 (10%) ➡ 대시보드 시각화 (15%) ➡ 기획 및 제안 (5%) Data Analyst에게 가장 중요한 역량은 '기획 및 제안'이다. 전문 용어를 사용하지 않고 1분 안에 이해시킬 수 있어야 하며, 회사에서 원하는 Data Analyst가 되기 위해서 꼭 가져야만 하는 덕목이다. 2. 대시보드 ✅ 대시보드 시각화에서 중요한 것 - 간단하게 만들기 - 빨리 만들기 - 대시보드 자동화 (DB가 매일 업데이트되기 때문) - 인수인계를 제대로 할 수 있는 대시보드 ➡ 남들이 이해할 수 있는 수식 작성 ➡ 계산된 필드 함수를 트래킹하여 계산된 필드를 작성할 수 있는 능력 필요 ✅ 대시보드 작성 팁 - 타겟의 입장이 되어 대시보드 작성 (본질을 ..

🌻 5주차 4L 회고 🌻 4L 회고형 1) Liked ( 이번주 수업에서 좋았던 점은? ) 2) Learned ( 이번주에 새롭게 배운 점은? ) 3) Lacked ( 배운 것에 관해서 내가 부족했던 부분은? ) 4) Longed ( 앞으로 뭘 더 하면 좋을까? ) 📍 Liked ( 이번주 수업에서 좋았던 점은? ) ✅ 실전 사례에 기반한 태블로 강의 이번 주도 지난주에 이어 유데미 태블로 강의를 수강했다. 유데미 강의의 가장 큰 장점은 실전 사례에 기반하여 프로젝트 형식으로 태블로를 배워나간다는 점인 것 같다. 단순히 따라만 하는 것이 아니라 스토리가 있기에 해석까지 할 수 있어서 흥미롭게 수강할 수 있었다. 👍 특히 테이블 고급 계산 강의에서 유지 보수가 필요한 석탄 회수기를 파악하는 프로젝트가 평소..

오늘 무엇을 배웠나요? ✍️ 유데미 - 시계열 데이터 분석 with 파이썬 ✍️ 일반 예측 모델 Section 6. 일반 예측 모델 6.1 예측 모델 소개 Part 1 ✅ 일반 예측 과정 1) 데이터를 기반으로 모델을 선택한다. 2) 시계열 데이터를 훈련 데이터셋과 테스트 데이터셋으로 나눈다. 3) 모델을 훈련 데이터셋에 피팅한 다음 테스트 데이터셋으로 모델을 평가한다. 4) 모델을 전체 데이터셋에 다시 피팅한다. 5) 실제 미래를 예측한다. ✅ 데이터셋 분리 - 대개 테스트 데이터셋의 크기는 전체 샘플의 20% 정도이다. 이는 샘플의 길이와 예측하려는 기간에 따라 달라진다. - 기억해야 할 내용은 80:20 데이터셋 분리가 아니라 테스트 데이터셋의 크기는 요구되는 최대 예측 수평선보다 커야 한다는 것이..

오늘 무엇을 배웠나요? ✍️ 유데미 - 시계열 데이터 분석 with 파이썬 ✍️ Statsmodels를 이용한 시계열 자료 분석 Section 5. Statsmodels를 이용한 시계열 자료 분석 5.1 Statsmodels 라이브러리 ✅ 시계열 요소 1) 추세 : 시계열 데이터는 어떤 방향으로든 추세를 가짐 2) 계절성 : 모든 계절성은 반복적인 추세 3) 순환 요소 : 특정 기간동안 반복적 추세가 보이지 않음 ✅ Hodrick-Prescott filter - 𝑦_𝑡로 표현되는 시계열 데이터를 추세 요소인 𝜏_𝑡와 순환 요소인 𝑐_𝑡로 구분하여 분해한다. - 두 요소는 2차 손실함수를 최소화할 수 있는 값으로 결정된다. - 람다값은 추세 요소의 증가율 변동폭을 조절한다. - 분기별 데이터는 1600, ..

오늘 무엇을 배웠나요? ✍️ 유데미 - 태블로 고수되기 : Tableau 고급 트레이닝 ✍️ 애니메이션 만들기, 세부 수준 계산(LOD), 고급 매핑 기술 구현 Section 4. 태블로에서 애니메이션 만들기 📌 프로젝트 개요 : 지난 50년 동안 전 세계 국가의 인구가 어떻게 발전해 왔는지 보여주는 애니메이션 대시보드 제공 - 출산율, 기대 수명 및 인구의 전반적인 추세 확인할 수 있게 - 전반적인 트렌드 외에도 개별 국가로 볼 수 있게 4.1 혼합 관계 편집하기 - Country Code와 Year를 혼합 - 해당 국가와 해당 연도의 인구와 출산율을 일치시키려 함 4.2 시각화 구축하기 4.3 애니매이션 추가하기 - 출산율과 기대 수명이 관점에서 세계의 경향이 어떠한지 살펴보기 4.4 혼합 데이터 수..

오늘 무엇을 배웠나요? ✍️ 유데미 - 태블로 고수되기 : Tableau 고급 트레이닝 ✍️ 테이블 고급 계산, 고급 데이터 준비 및 분석 Section 2. 테이블 고급 계산 📌 프로젝트 개요 : 석탄 터미널에서 작동하는 어떤 석탄 회수기 기계가 유지보수가 필요한지, 필요한 시점은 언제인지 파악하고자 함. 회수기는 24/7 운영되며 연간 8,500만 톤의 석탄을 처리함. 1분의 가동 중지 시간은 수백만 달러의 수익 손실과 동일함. - 기준 : 회수기형 기계는 지난달 최소 8시간동안 유휴생산능력이 10% 초과했다면 유지보수가 필요함. - 유휴생산능력 = (실제 톤 수 - 규격 용량) / 규격 용량 * 클 수록 나쁜 기준 - 실제 톤 수는 기계의 사용률이고 이 기계는 약 450만 톤을 처리할 수 있음. 2..