본문 바로가기

책[이해 및 학습]16

08_선형 회귀 & polynomial regression K-NeighborsRegressor 단점에 대해서 알아보자 1) 영역에서 벗어날 경우, 어떻게 되는지?- 50Cm 일 경우, 예측하는 데 실패가 발생한 이유.In [1]:import numpy as np## 데이터 불러오기 및 array 생성.perch_length = np.array([8.4, 13.7, 15.0, 16.2, 17.4, 18.0, 18.7, 19.0, 19.6, 20.0, 21.0, 21.0, 21.0, 21.3, 22.0, 22.0, 22.0, 22.0, 22.0, 22.5, 22.5, 22.7, 23.0, 23.5, 24.0, 24.0, 24.6, 25.0, 25.6, 26.5, 27.3, 27.5, 27.5, 27.5, 28.0, 28.7, 30... 2023. 1. 3.
07_과대적합(overfitting) vs 과소적합(underfitting) 훈련세트로 훈련하면, 보통 훈련세트의 R^2값이 더 높게 나온다.훈련세트 R^2 >> 테스트세트 R^2과대적합 overfitting: 실전 투입 시, 새로운 샘플에 대한 예측값이 잘 맞지 않는다.해결책k 개수를 올려서, 여러 데이터를 반영이웃의 개수를 늘이면 데이터 전반에 있는 일반적인 패턴을 따른다.훈련세트 R^2 과소적합 underfitting: 모델이 너무 단순해서 훈련세트에 적절히 훈련되지 않은 경우해결책k 개수를 내려서 모델을 복잡하게 혹은 국지적인 패턴에 민감하게 변경이웃의 개수를 줄이면 훈련세트에 있는 국지적인 패턴에 민감모델을 조금 더 복잡하게 설계훈련세트와 데이터의 세트의 크기가 작기 때문에 발생.In [1]:import numpy as npperch_length = np.array([8.. 2023. 1. 3.
6. [혼자 공부하는 머신러닝] 회귀(Regression): k-최근접 이웃회귀 Target지도 학습의 한 종류인 회귀문제를 이해하고 k-최근접 이웃 알고리즘으로 농어 무게 예측지도 학습 알고리즘분류: 샘플을 몇 개의 클래스 중 하나로 분류하는 문제회귀: 임의의 어떤 숫자를 예측하는 문제 / 내년도 경제 성장률 예측, 배달이 도착할 시간을 예측k-최근접 이웃 분류 알고리즘 활용 데이터 준비In [1]:import numpy as npperch_length = np.array([8.4, 13.7, 15.0, 16.2, 17.4, 18.0, 18.7, 19.0, 19.6, 20.0, 21.0, 21.0, 21.0, 21.3, 22.0, 22.0, 22.0, 22.0, 22.0, 22.5, 22.5, 22.7, 23.0, 23.5, 24.0, 24.0, 24.6, 2.. 2023. 1. 3.
3. [혼자 공부하는 머신러닝/딥러닝] 심층 신경망(DNN) 2개의 층으로 심층 신경망 구성 In [3]: import tensorflow as tf from tensorflow import keras from tensorflow import keras (train_input, train_target), (test_input, test_target) =\ keras.datasets.fashion_mnist.load_data() In [4]: from sklearn.model_selection import train_test_split train_scaled = train_input/255.0 train_scaled = train_scaled.reshape(-1, 28*28) train_scaled, val_scaled, train_target, val_target.. 2022. 7. 22.