본문 바로가기

전체 글22

[스파르타 재직자 부트캠프] 1주차 수업(2024.12.18) 오늘 배운 내용은 다음과 같다. 1. NULL을 표현하는 방식2. LIKE를 사용한 텍스트 필터링3. 논리 연산자 AND, OR, IN, NOT IN4. COUNT, SUM, AVG, MIN, MAX, IFNULL  생각보다 진도가 빨라 너무 좋다. 그리고 오늘은 몰랐던 점이 있었다. 바로 1. 논리 연산자에서 AND가 OR보다 먼저 처리된다. OR 조건을 먼저 처리하기 위해서는 괄호를 사용해야 한다.2. 컬럼명, 조건값 등 대문자, 소문자 구별없이 사용할 수 있다. 지금 보면 왜 몰랐었지 라는 생각이 들긴 하는데, 뭐 이제라도 알았으면 된 거 같다! ㅎㅎ.. 2024. 12. 19.
[스파르타 재직자 부트캠프] 1주차 수업(2024.12.17) 오늘 배운 내용은 다음과 같다. 1. 데이터베이스 선택2. SELECT, DISTINCT를 사용한 조회 방법3. ORDER BY를 사용한 데이터 정렬하기4. WHERE 절을 사용한 간단한 필터링5. 비교 연산자 내용 자체는 어렵지 않고 아주 기초적인거였다.(사실 SQL를 아예 모르는게 아니라서 조금은 지루했다..ㅎㅎ..) 그래도 중간마다 실습 타임이 있어서 재밌었다.흠.. 조금 빨리 시간이 지나 어려운 내용을 진행해보고 싶다..태블로도! 2024. 12. 17.
[스파르타 재직자 부트캠프] 0. OT 솔직히 나는 부트캠프를 사실 할 생각이 없었다..!코딩을 처음 할 때도 부트캠프를 통해서 배우지 않고 독학으로 배웠었었고.. 안들어도 되겠다 라는 생각을 했지만어쩌다 보니 재직자 전용 부트캠프를 알게 되어 신청을 하고 듣게 되었다.  평일 20시 ~ 23시, 토요일 9시 ~ 14시마다 하는 수업이고, 약 8주동안 진행된다.그리고 평일날에 공휴일이 있으면 토요일 수업이 연장된다.수업 내용은 SQL과 Tableau를 사용하여 데이터 분석 및 시각화를 다루고, 다양한 프로젝트를 진행할 예정이다.  내용도 내가 좀 더 스킬업하고 싶었던 부분이였고, 누군가의 피드백을 받으며 공부하는 것도 처음이기 때문에조금은 설레고 떨린다.  파이팅 해보자! 2024. 12. 16.
[solvesql] 2단계 쿼리문제 해결 업로드가 좀 늦은 감이 있는데, 일이 좀 많았어서...ㅎㅎ.. 이번 2단계 문제는 총 11개였고 대부분 JOIN, CASE/IF를 써야하는 문제들이 많았다.   사진에 있는 문제를 세보면 10개인 것을 알 수 있다. 그렇다. 1문제는 못풀었다.. 정답률은 다른 문제들보다 많이 높았는데, SQLite를 안써봐서 그런가 라는 핑계를 대본다. 한번 오답노트를 적어보도록 하겠다.   문제는 아래 링크와 같다.https://solvesql.com/problems/bad-finedust-measure/ https://solvesql.com/problems/bad-finedust-measure/ solvesql.com [문제]서울숲 일별 평균 대기오염도 데이터셋은 2022년 서울숲 대기오염도 측정소에서 매일 기록한 .. 2024. 12. 2.
[혼자 공부하는 머신러닝 + 딥러닝] 주성분 분석 차원과 차원 축소 머신러닝에서는 데이터가 가진 속성을 차원(Dimension)이라고 부릅니다.예로 들어 사진의 픽셀이 10,000개면 현재 이 사진은 10,000개의 차원이라고 할 수 있습니다.더보기여기서 잠깐!1차원 배열, 즉 벡터일 경우에는 원소의 개수가 차원이 됩니다.2차원 배열일 때는 행과 열이 차원이 됩니다.즉, 다차원 배열에서 차원은 배열은 축 개수가 됩니다.만약 이 차원을 줄일 수 있다면, 저장 공간은 크게 절약할 수 있을 것입니다.이를 위해 비지도 학습 작업 중 하나인 차원 축소(Dimensionality Reduction) 알고리즘을 다루어 보겠습니다.차원 축소는 데이터를 가장 잘 나타내는 일부 특성을 선택하여 데이터 크기도 줄이고 지도 학습 모델의 성능도 향상시킵니다.또한 손실을 최대한.. 2024. 12. 2.
[혼자 공부하는 머신러닝 + 딥러닝] k-평균(K-Means) 전 게시글에 이어서 사과, 파인애플, 바나나 사진을 가지고 하겠습니다.만약, 비지도 학습에서 각 과일의 평균을 구하라고 하면 구할 수 있을까요?정답은 "할 수 없습니다" 입니다.왜냐하면 어떤 사진에 어떤 과일이 있을지 모르기 때문입니다.그렇다면 어떻게 평균값을 구할 수 있을까요?   k-평균(K-Means) k-평균(K-Means) 군집 알고리즘은 평균값을 자동으로 찾아줍니다.이 평균값이 클러스터 중심에 위치하기 때문에 클러스터 중심(cluster center) 또는 센트로이드(centroid)라고 부릅니다.  k-평균 알고리즘의 작동 방식은 다음과 같습니다. 1. 무작위로 k개의 클러스터 중심을 정한다.2. 각 샘플에서 가장 가까운 클러스터 중심을 찾아 해당 클러스터의 샘플로 지정한다.3. 클러스터에 .. 2024. 11. 27.
[수리통계학] 1장. 확률분포 드디어 수리통계학 1장을 끝냈다.  노트에 정리하고 다시 복습하는 겸 노션에 정리하는데 조금 힘들었다.(수식 자체를 쓰기가 너무 어려워서.. GPT에다가 공식을 글로 적은 뒤에 수식을 받아서 복붙하는 방식으로..)  사실 처음에는 블로그에다가 게시를 하려 했지만 저작권이 무서웠기 때문에 따로 노션으로 적는 방식을 선택했다.  1장에서는 학교 수업 때 배운 내용들이 대부분이였다.그래서 내용도 무난무난, 문제도 무난무난했다.내용은 확률, 조건부 확률, 확률분포, 기댓값, 분산, 확률분산, 누적분포함수 내용이 주를 이뤘다. (이정도는 괜찮겠지..?)  이제 2장을 하러..! 2024. 11. 25.
[혼자 공부하는 머신러닝 + 딥러닝] 군집 알고리즘 만약 타깃을 모르는 사진을 종류별로 분류하려 한다면 어떤 머신러닝 알고리즘을 써야 할까요?바로 비지도 학습(Unsupervised learning)입니다.  한번 실습해보면서 알아보겠습니다.  데이터 준비 전과는 다르게 이번에는 과일 데이터를 사용해보겠습니다.과일 데이터는 사과, 바나나, 파인애플을 담고 있는 흑백 사진입니다.   이 배열의 첫 번째 차원(300)은 샘플의 개수, 두 번째 차원(100)은 이미지 높이, 세 번째 차원(100)은 이미지 너비입니다.즉, 이미지 크기는 100 x 100이고 각 픽셀은 넘파이 배열의 원소 하나에 대응합니다.이는 곧, 배열의 크기가 100 x 100이라는 걸 알 수 있습니다.  한번 첫 번째 이미지의 첫 번째 행을 출력해보겠습니다.  이 넘파이 배열은 흑백 사진을.. 2024. 11. 13.
[DuckDB] 0. DuckDB에 대하여 요즘 관심이 생긴 툴이 있다. 바로 DuckDB라는 것이다. 요즘 회사에서 데이터 베이스 설계를 하면서 SQL에 관심이 더 생기게 되었었는데,  마침 인프런(현재 게시글에 있음!)에 있는 강의를 들으면서 DuckDB에 대해서 알게 되었다. 단순히 찾아봤을 때 내가 자주 다루는 csv 파일이라던지 jupyter notebook이랑도 잘 연동된다고 해서 한번 공부를 해보려고 한다! 근데, 아쉬운 점이 한글판으로 나온 도서가 없다는 것이다. (못찾는 것일지도..) 그래서 공식 사이트와 각종 사이트 등을 읽으며 하나하나 공부를 해볼 예정이다!  DuckDB란?임베디드 분석 데이터베이스로, 대규모 데이터 처리를 로컬 환경에서도 빠르고 효율적으로 수행할 수 있도록 설계된 시스템SQLite와 비슷하게 작동하고, 주로.. 2024. 11. 12.