2024/10 4

딥러닝 1일차

1. 딥러닝 개념 이해1.1. 딥러닝이란?- 인공 신경망(Artificial Neural Net)신경망을 인공적으로 구현한 것신경망을 깊이(Deep) 쌓아서 학습시키는 방식 ➔ Deep Learning학습을 통해 연결의 강도를 조정 ➔ 가중치(Weight)- Deep Learning으로 할 수 있는 것Universal Approximation Theorem (보편 근사 정리)1989년 Cybenko가 작성한 논문“어떤 연속 함수든, 뉴럴넷으로 모두 구현할 수 있다.”Deep Learning으로 만들 수 있는 머신러닝 알고리즘지도학습 : 선형회귀, 로지스틱 회귀, KNN, DT, SVM, 랜덤 포레 등비지도학습 : 차원축소(PCA), k-means, 이상탐지용 알고리즘그 외, Deep Learning으로 ..

머신러닝 - 비지도 학습 1일차

1. 비지도 학습 개요- 전체 프로세스(CRISP-DM)업무 이해비즈니스 관점에서 프로젝트의 목적과 요구사항을 이해하는 단계업무 목적 파악, 상황 파악, 데이터 마이닝 목표 설정, 프로젝트 계획 수립데이터 이해분석을 위한 데이터를 수집하고 데이터 속성을 이해하는 단계초기 데이터 수집, 데이터 기술 분석, 데이터 탐색, 데이터 품질 확인데이터 준비분석을 위해 수집된 데이터에서 분석기법에 적합한 데이터를 편성하는 단계(많은 시간이 소요될 수 있음)분석용 데이터셋 선택, 데이터 정제, 분석용 데이터셋 편성, 데이터 통합모델링다양한 모델링 기법과 알고리즘을 선택하고 모델링 과정에서 사용되는 파라미터를 최적화하는 단계모델링 기법 선택, 모델 테스트 계획 설계, 모델 작성, 모델 평가평가모델링 결과가 프로젝트 목적..

성능 평가

회귀 모델 평가회귀 모델: 수치형 값을 예측하는 것회귀 모델이 정확한 값을 예측하기는 사실상 어렵다.예측값과 실젯값에 차이(=오차)가 있을 것으로 예상예측값이 실젯값에 가까울 수록 좋은 모델이라 할 수 있음→ 오차로 모델 성능을 평가분류 모델 평가분류 모델: 0 또는 1인지를 예측하는 것실젯값도, 예측값도 0과 1임물론 0을 1로, 1을 0으로 예측할 수도 있음예측값이 실젯값과 많이 같을 수록 좋은 모델→ 정확히 예측한 비율로 모델 성능 평가 1. 회귀 모델 성능 평가1. 용어실젯값: 실제로 예측하고 싶은 값, Target이자 목푯값             우리가 알아야 할 오차는 이 값과 예측값의 차이평균값: 이미 알고 있는, 이미 존재하고 있는 평균으로 예측한 값             우리가 만든 모델..

데이터 분석 - 이변량: 범주 vs 숫자

1. 환경준비(1) 라이브러리 불러오기import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport scipy.stats as spst (2) 데이터 불러오기※ 예제 데이터: 타이타닉 생존자# 타이타닉 데이터titanic = pd.read_csv('https://raw.githubusercontent.com/DA4BAM/dataset/master/titanic.0.csv')# 데이터 확인titanic.head() ※ 범주 vs 숫자 비교하는 방법범주가 2개: 두 평균의 차이 비교범주가 3개 이상: 전체 평균과 각 범주의 평균 비교 2. 시각화(1) 평균 비교: barplotsns.barplot(x..