일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 브라이틱스스튜디오
- 유데미큐레이션
- Brightics_Studio
- 로우코드
- 데이터시각화
- Brightics studio
- 브라이틱스서포터즈3기
- 부트캠프후기
- 데이터사이언스
- 브라이틱스
- 대학생대외활동
- 데이터사이언티스트
- 대학생서포터즈
- 태블로
- 취업부트캠프
- 데이터드리븐
- 서포터즈
- 삼성SDS
- 스타터스부트캠프
- 노코드AI오픈소스
- 노코드
- 유데미코리아
- BrighticsStudio
- Brightics서포터즈3기
- Brightics
- 코딩없이
- 유데미
- 데이터분석
- 유데미부트캠프
- 데이콘
- Today
- Total
목록데이터드리븐 (57)
지수

🌻 2주차 4L 회고 🌻 4L 회고형 1) Liked ( 이번주 수업에서 좋았던 점은? ) 2) Learned ( 이번주에 새롭게 배운 점은? ) 3) Lacked ( 배운 것에 관해서 내가 부족했던 부분은? ) 4) Longed ( 앞으로 뭘 더 하면 좋을까? ) 📍 Liked ( 이번주 수업에서 좋았던 점은? ) ✅ 이러닝 교육 이번주 수업에서는 '데이터 시각화'에 대해 심도있게 배울 수 있었다. 데이터 시각화는 스스로 많이 부족한 부분이라 생각하기도 했고 정~말 기본 플롯만 알고 있었기 때문에 이번 이러닝 교육이 아주 만족스러웠다. Matplotlib, Seaborn를 활용한 여러가지 그래프, 그래프 스타일링, 서브플롯을 이론부터 서울시 공공데이터를 활용한 분석까지 응용해보며 저번주에 배운 데이터 ..

오늘 무엇을 배웠나요? ✍️ 기술통계, 순위, 소계, 피벗 / R 특징 1. 기본 통계 ✅ 중심경향성 데이터의 중심이 어디인지를 나타내는 중심 경향성(Central tendency) 지표 ✅ 집계함수 집계 함수 내용 COUNT(입력값) 줄(ROW) 수 SUM(입력값) 컬럼(COLUMN) 간의 합계 AVG(입력값) 컬럼 간의 평균 MAX(입력값) 컬럼 중 최댓값 MIN(입력값) 컬럼 중 최솟값 STDDEV(입력값) 컬럼 간의 표준편차 VARIAN(입력값) 컬럼 간의 분산 수치형 집계함수 내용 ABS(숫자) 절댓값 CEILNG(숫자) 올림 FLOOR(숫자) 내림 ROUND(숫자, 자릿수) 반올림 GREATEST(VAL1, VAL2, ...) 가장 큰 값 LEAST(VAL1, VAL2, ...) 가장 작은 값..

오늘 무엇을 배웠나요? ✍️ 내장함수, 문자/수치 자료형, 날짜 데이터, 서브쿼리, 조인, VIEW 📍 내장함수 내장함수 문법 SUM SUM([ALL | DISTINCT] 속성이름) AVG AVG([ALL | DISTINCT] 속성이름) COUNT COUNT({[[ALL | DISTINCT] 속성이름] | *}) MAX MAX([ALL | DISTINCT] 속성이름) MIN MIN([ALL | DISTINCT] 속성이름) 내장함수 문법 POWER POWER(숫자, 제곱) : 제곱 ROUND ROUND(값, 소수점) : 반올림 MOD MOD(값,값) : 나머지 CEIL CEIL(값, 소수점) : 올림 FLOOR FLOOR(값, 소수점) : 내림 📍 문자열 다루기 ✅ 문자열 결합 내장함수 문법 CONCAT ..

오늘 무엇을 배웠나요? ✍️ 데이터베이스 정의, SQL 활용(DDL, DML, 조건절) 1. 데이터베이스 개요 ✅ 데이터베이스 : 공용으로 활용하기 위해 통합하여 저장한 운영 데이터의 집합 특성 설명 실시간 접근성 요청받은 데이터 처리는 실시간으로 처리되고 결과를 반환해야 함 계속성 변화 저장된 데이터는 입력, 수정, 삭제에 의해 지속적으로 변화함 동시 공용 서로 다른 목적의 응용 SW 및 사용자에 의해 동시 공용 가능 내용에 의한 참조 데이터의 참조는 데이터의 주소가 아닌 저장된 값에 의해 처리됨 ✅ 데이터베이스 관리 시스템 : 다수의 응용소프트웨어 및 사용자가 데이터베이스에 접근하여 원활하게 사용할 수 있도록 중간에서 관리해주는 시스템 기능 설명 동시성 제어 다수의 트랜잭션의 동시 처리로부터 데이터 ..

오늘 무엇을 배웠나요? ✍️ 데이터 시각화 분석 4. 아파트 실거래가 현황 🔎 시도별 아파트 매매가 현황 📍 데이터 전처리 # NaN이 아닌 데이터 삭제 df = df.drop(index = df[df['해제사유발생일'].notnull()].index) # 사용할 컬럼만 추출 df = df[['시군구','전용면적(㎡)' ,'거래금액(만원)']] # 자료형 변환 df['전용면적(㎡)'] = df['전용면적(㎡)'].astype('int64') df['거래금액(만원)'] = df['거래금액(만원)'].str.replace(',','').astype('int64') # 시도 컬럼 추가 df['시도'] = df['시군구'].str.split(' ').str[0] # 서브셋 생성 df_84 = df[df['전용면..

오늘 무엇을 배웠나요? ✍️ 데이터 시각화 분석 1. 서울시 폭염, 열대야 현황 🔎 서울시 폭염일 현황과 최고 폭염일 강조 📍 데이터 전처리 # 1) 서울시 데이터 서브셋 생성 df_seoul = df[df['지점명']=='서울'] # 2) 서울시 폭염 데이터 추출 df_seoul_hotday = df_seoul[df_seoul['최고기온(°C)']>=33] # 3) 폭염이 가장 심했던 날 best10 df_seoul_hotestday = df_seoul_hotday,nlargest(10, '최고기온(°C)') # 4) 폭염이 가장 심했던 날짜, 최고기온 df_seoul_hotestday = df_seoul_hotestday.iloc[[0]] x = df_seoul_hotestday.iloc[0,2].d..

오늘 무엇을 배웠나요? ✍️ 데이터 시각화 (그래프 스타일링 / Seaborn / 기온변화 분석 ) 그래프 스타일링 1. 그래프 강조하기 (수직선과 수평선) ✅ 수평선 plt.axhline(y좌표, x축시작위치, x축끝위치) ▷ 수평선의 길이가 1 plt.hlines(y, x축시작좌표, x축끝좌표) ✅ 수직선 plt.axvline(x좌표, y축시작위치, y축끝위치) plt.vlines(x, y축시작좌표, y축끝좌표) 2. 그래프에 설명적기 ✅ 텍스트 plt.text(x좌표, y좌표, 텍스트) rotation = 회전각도 ha : horizontal alignment / va : vertical alignment bbox = {'boxstyle' : 'round'/'square', 'fc' : faceco..