728x90 반응형 AI 입문/Machine Learning4 6장 - 비지도 학습 파이썬 코드 https://github.com/JHWannabe/self-taught_machine_learning_code.git 6.1 군집 알고리즘 비지도 학습(Unsupervised Learning): 타깃이 없을 때 사용하는 머신러닝 알고리즘 히스토그램 - 값이 발생한 빈도를 그래프로 표시한 것 - 보통 x축이 값의 구간(계급), y축은 발생 빈도(도수) 평균값과 가까운 사진 고르기 3장에서 봤던 절댓값 오차를 사용 numpy의 abs() : 절댓값을 계산하는 함수 (ex. np.abs(-1) = 1) 군집(Clustering) : 비슷한 샘플끼리 그룹으로 모으는 작업 ㄴ 대표적인 비지도 학습 작업 클러스터(Cluster) : 군집 알고리즘에서 만든 그룹 6.2 k-평균 k-평균(k-means).. 2022. 11. 30. 5장 - 트리 알고리즘 파이썬 코드 https://github.com/JHWannabe/self-taught_machine_learning_code.git 5.1 결정 트리 판다스 데이터프레임의 유용한 메서드 2개 info() : 데이터프레임의 각 열의 데이터 타입과 누락된 데이터가 있는지 확인하는 데 사용 describe() : 열에 대한 간략한 통계를 출력 (최소(min), 최대(max), 평균값(mean), 표준편차(std), 중간값(50%), 1사분위수(25%), 3사분위수(75%) 등) 스케일 값이 다르다 → 사이킷런의 StandardScaler 클래스를 사용해 feature를 표준화함 StandardScaler 클래스를 사용해 훈련 세트를 전처리 함. 결정 트리 모델 : 마치 스무 고개와 같음 사이킷런의 Decisi.. 2022. 11. 25. 4장 - 다양한 분류 알고리즘 파이썬 코드 https://github.com/JHWannabe/self-taught_machine_learning_code.git 4.1 로지스틱 회귀 k - 최근접 이웃 분류기의 확률 예측 2장에서 했던 것처럼 사이킷런의 KNeighborsClassifier 클래스 객체를 만들고 훈련 세트로 모델을 훈련한 다음 훈련 세트와 테스트 세트의 점수를 확인한다. 최근접 이웃 개수인 k를 3으로 지정하여 사용한다. 다중 분류(multi-class classification) : 타깃 데이터에 2개 이상의 클래스가 포함된 문제 주의점! 타깃값을 그대로 사이킷런 모델에 전달하면 순서가 자동으로 알파벳 순으로 매겨진다. 따라서 pd.unique(fish['Species'])로 출력했던 순서와 다르다. KNeighb.. 2022. 11. 11. 3장 - 회귀 알고리즘과 모델 규제 파이썬 코드 https://github.com/JHWannabe/self-taught_machine_learning_code.git 3.1 k - 최근접 이웃 회귀 회귀(Regression) : 임의의 어떤 숫자를 예측하는 문제 농어 길이와 무게를 산점도로 표시한 예제 결정계수(R^2) 사이킷런에서 k-최근접 이웃 회귀 알고리즘을 구현한 클래스는 KNeighborsRegressor이다. 이 클래스의 사용법은 KNeighborsClassifier와 매우 비슷하다. 분류의 경우는 테스트 세트에 있는 샘플을 정확하게 분류한 개수의 비율(정확도)이다. 회귀의 경우에는 결정계수라는 점수로 부르거나, R^2 라고도 부른다. 만약 타깃의 평균 정도를 예측하는 수준이라면 결정계수는 0에 가까워지고, 예측이 타깃에 아주.. 2022. 11. 11. 이전 1 다음 728x90 반응형