본문 바로가기

ML4

ML4 확률적 경사 하강법8 한번에 모든 데이터를 모델에 학습시키지 않고 조금씩 추가되는 데이터를 모델에 학습시키려면?-> 매번 새 모델을 학습시키기에는 데이터의 양이 많이 늘어나버리면 문제가 됨.이때 활용할 수 있는 점진적 학습 알고리즘이 확률적 경사 하강법이다. 확률적 경사 하강법은 원하는 목표에 도달하기 위해 훈련 세트 중 하나를 랜덤하게 골라 활용하고 모든 세트를 이용하였을 때 한 과정을 epoch라고 한다. 이때 훈련 세트를 고르는 방법에 따라 확률적 경사 하강법(1개) / 미니배치 '' (여러개) / 배치 ''(전부) 로 나눌 수 있다.-> 이런 확률적 경사 하강법을 이용하는 대표적인 경우는 신경망 학습.. 방대한 양의 데이터를 한번에 학습시키기가 어렵기 때문. '' 손실함수 ''손실 함수 : 머신러닝 알고리즘의 정확도를.. 2024. 8. 7.
ML3 / 다중회귀, 특성공학 다중회귀란?여러개의 특성을 사용한 선형회귀(1차만 선형이 아님!)를 다중회귀라고 한다.1개의 특성을 사용하면 학습하는것은 직선.. 2개의 특성을 사용하여 학습하면 평면.. 3개 이상부터는 어떻게 되는가?-> 기존 특성들을 이용하여 새로운 특성을 만들어 사용한다 => 이를 특성공학이라고 함 사이킷런의 변환기(Transformer)사이킷런은 특성을 만들거나 전처리하기 위한 다양한 클래스를 제공한다. 변환기 클래스는 모두 fit(), transform()메소드를 제공한다.PolynomialFeatures : 사이킷런의 변환기중 하나이며 sklearn.preprocessing 라이브러리에 포함되어 있다. 입력데이터의 다항식 특성을 생성하도록 해주며 선형 모델이 비선형 특성을 잘 포착할 수 있도록 할 수 있다.사.. 2024. 7. 28.
2-1 import numpy as np input_arr = np.array(fish_data) target_arr = np.array(fish_target) print(input_arr) 훈련 세트와 테스트 세트 '샘플링 편향' 훈련 세트와 테스트 세트에 샘플이 골고루 섞여 있어야 한다. -> 하나도 훈련시키지 않은 데이터를 나중에 테스트 세트에 포함시켜 버리면 제대로 학습이 되지 않았음을 확인할 수 있음 numpy : 고차원의 배열을 다루고 편집하기 편하다. 라이브러리를 추가해 주어야 함 fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, .. 2024. 1. 29.
ML 1-3 대-AI 시대가 도래함에 따라 기초적인 AI 지식 정도는 찍먹해 줘야 한다고 생각하여 공부를 시작 ML에 포스팅되는 대부분의 포스팅은 교재를 통해 공부한 내용일 것입니다. K - Nearest Neighborhodd(K-NN) 알고리즘 *구글 Colab은 파이썬을 기반으로 작동한다. 생선의 종류를 구분하는 경우를 K-NN으로 구현해보기. 라이브러리 추가 import 사용 as ~ : C에서 typedef와 비슷하다. 그래프를 점선도로 plot하기 : .stcatter .show를 통해 표시. scatter를 합치면 한번에 표시 가능하다 K-NN알고리즘은 정답 데이터를 K-NN객체 안에 넣어 데이터를 통해 들어오는 입력값을 판단한다. score함수는 성능평가에 사용. 사용한 전체 코드 bream_lengt.. 2024. 1. 28.