본문 바로가기

전체 글25

[스파르타 재직자 부트캠프] 1주차 수업(2024.12.21) 오늘은 드디어 대망의 프로젝트 날..! 오늘 진행한 프로젝트는 개인 프로젝트였으며 다음과 같다.  EDA 기초 리포트 작성하기- 매출을 기반으로 다양한 지표 추출 및 차트 그리기- 기간이나 범주에 따라 데이터를 분리하고 비교하기- 비교한 정보를 바탕으로 현황에 대한 팩트 정리  리포트 양식은 엑셀 파일로 주어졌고, 나는 구글 스프레드 시트로 진행하였다.그리고 DBeaver로 데이터베이스에 연결 후 매출 테이블을 사용했다.그리고 해당하는 데이터를 구하기 위해 쿼리문을 짜고 추출해서 스프레드 시트에 기입했다.  전체적인 난이도는 쉬웠다.빨리 태블로와 연결해서 프로젝트를 진행했으면 싶다...! 2024. 12. 21.
[스파르타 재직자 부트캠프] 1주차 수업(2024.12.20) 오늘은 쿼리말고 데이터 분석에 관련된 수업을 진행했다. 1. EDA2. MECE 프레임워크와 로직 트리 이번 수업은 딥하게 들어가지 않고 조금 겉핥기로 진행되었는데, 추후에 직접 더 찾아봐야겠다 내일은 프로젝트 날인데 어떤 프로젝트를 할 지 기대된다..! 2024. 12. 21.
[스파르타 재직자 부트캠프] 1주차 수업(2024.12.19) 오늘 배운 내용은 다음과 같다. 1. IFNULL2. GROUP BY3. LEFT, RIGHT, SUBSTR, SUBSTRING_INDEX, CONCAT, REPLACE4. ROUND, ABS, CELLING, FLOOR5. NOW, SYSDATE, YEAR, MONTH, DAY, DATE_FORMAT 을 배웠다. 오늘은 수업이 전보다 빨리 진행 됐는데, 다행히도 다 알고 있는 내용이라 편안했다. 따로 특이점은 없는 거 같다! 2024. 12. 19.
[스파르타 재직자 부트캠프] 1주차 수업(2024.12.18) 오늘 배운 내용은 다음과 같다. 1. NULL을 표현하는 방식2. LIKE를 사용한 텍스트 필터링3. 논리 연산자 AND, OR, IN, NOT IN4. COUNT, SUM, AVG, MIN, MAX, IFNULL  생각보다 진도가 빨라 너무 좋다. 그리고 오늘은 몰랐던 점이 있었다. 바로 1. 논리 연산자에서 AND가 OR보다 먼저 처리된다. OR 조건을 먼저 처리하기 위해서는 괄호를 사용해야 한다.2. 컬럼명, 조건값 등 대문자, 소문자 구별없이 사용할 수 있다. 지금 보면 왜 몰랐었지 라는 생각이 들긴 하는데, 뭐 이제라도 알았으면 된 거 같다! ㅎㅎ.. 2024. 12. 19.
[스파르타 재직자 부트캠프] 1주차 수업(2024.12.17) 오늘 배운 내용은 다음과 같다. 1. 데이터베이스 선택2. SELECT, DISTINCT를 사용한 조회 방법3. ORDER BY를 사용한 데이터 정렬하기4. WHERE 절을 사용한 간단한 필터링5. 비교 연산자 내용 자체는 어렵지 않고 아주 기초적인거였다.(사실 SQL를 아예 모르는게 아니라서 조금은 지루했다..ㅎㅎ..) 그래도 중간마다 실습 타임이 있어서 재밌었다.흠.. 조금 빨리 시간이 지나 어려운 내용을 진행해보고 싶다..태블로도! 2024. 12. 17.
[스파르타 재직자 부트캠프] 0. OT 솔직히 나는 부트캠프를 사실 할 생각이 없었다..!코딩을 처음 할 때도 부트캠프를 통해서 배우지 않고 독학으로 배웠었었고.. 안들어도 되겠다 라는 생각을 했지만어쩌다 보니 재직자 전용 부트캠프를 알게 되어 신청을 하고 듣게 되었다.  평일 20시 ~ 23시, 토요일 9시 ~ 14시마다 하는 수업이고, 약 8주동안 진행된다.그리고 평일날에 공휴일이 있으면 토요일 수업이 연장된다.수업 내용은 SQL과 Tableau를 사용하여 데이터 분석 및 시각화를 다루고, 다양한 프로젝트를 진행할 예정이다.  내용도 내가 좀 더 스킬업하고 싶었던 부분이였고, 누군가의 피드백을 받으며 공부하는 것도 처음이기 때문에조금은 설레고 떨린다.  파이팅 해보자! 2024. 12. 16.
[solvesql] 2단계 쿼리문제 해결 업로드가 좀 늦은 감이 있는데, 일이 좀 많았어서...ㅎㅎ.. 이번 2단계 문제는 총 11개였고 대부분 JOIN, CASE/IF를 써야하는 문제들이 많았다.   사진에 있는 문제를 세보면 10개인 것을 알 수 있다. 그렇다. 1문제는 못풀었다.. 정답률은 다른 문제들보다 많이 높았는데, SQLite를 안써봐서 그런가 라는 핑계를 대본다. 한번 오답노트를 적어보도록 하겠다.   문제는 아래 링크와 같다.https://solvesql.com/problems/bad-finedust-measure/ https://solvesql.com/problems/bad-finedust-measure/ solvesql.com [문제]서울숲 일별 평균 대기오염도 데이터셋은 2022년 서울숲 대기오염도 측정소에서 매일 기록한 .. 2024. 12. 2.
[혼자 공부하는 머신러닝 + 딥러닝] 주성분 분석 차원과 차원 축소 머신러닝에서는 데이터가 가진 속성을 차원(Dimension)이라고 부릅니다.예로 들어 사진의 픽셀이 10,000개면 현재 이 사진은 10,000개의 차원이라고 할 수 있습니다.더보기여기서 잠깐!1차원 배열, 즉 벡터일 경우에는 원소의 개수가 차원이 됩니다.2차원 배열일 때는 행과 열이 차원이 됩니다.즉, 다차원 배열에서 차원은 배열은 축 개수가 됩니다.만약 이 차원을 줄일 수 있다면, 저장 공간은 크게 절약할 수 있을 것입니다.이를 위해 비지도 학습 작업 중 하나인 차원 축소(Dimensionality Reduction) 알고리즘을 다루어 보겠습니다.차원 축소는 데이터를 가장 잘 나타내는 일부 특성을 선택하여 데이터 크기도 줄이고 지도 학습 모델의 성능도 향상시킵니다.또한 손실을 최대한.. 2024. 12. 2.
[혼자 공부하는 머신러닝 + 딥러닝] k-평균(K-Means) 전 게시글에 이어서 사과, 파인애플, 바나나 사진을 가지고 하겠습니다.만약, 비지도 학습에서 각 과일의 평균을 구하라고 하면 구할 수 있을까요?정답은 "할 수 없습니다" 입니다.왜냐하면 어떤 사진에 어떤 과일이 있을지 모르기 때문입니다.그렇다면 어떻게 평균값을 구할 수 있을까요?   k-평균(K-Means) k-평균(K-Means) 군집 알고리즘은 평균값을 자동으로 찾아줍니다.이 평균값이 클러스터 중심에 위치하기 때문에 클러스터 중심(cluster center) 또는 센트로이드(centroid)라고 부릅니다.  k-평균 알고리즘의 작동 방식은 다음과 같습니다. 1. 무작위로 k개의 클러스터 중심을 정한다.2. 각 샘플에서 가장 가까운 클러스터 중심을 찾아 해당 클러스터의 샘플로 지정한다.3. 클러스터에 .. 2024. 11. 27.