본문 바로가기

전체 글44

딥러닝 - 인공 신경망 ▷ 데이터 다운받기 # 관련 모듈 import 하기 from keras.datasets import fashion_mnist # 패션 MNIST 데이터 다운받기 (x_train,y_train),(x_test,y_test) = fashion_mnist.load_data() ▷ 그림 출력하기 # 관련 모듈 import 하기 import matplotlib.pyplot as plt # 그림 그리기 fig,axs = plt.subplots(1,10,figsize=(10,10)) for i in range(10): axs[i].imshow(x_train[i],cmap='gray_r') axs[i].axis('off') plt.show() ▷ 로지스틱 회귀로 패션 아이템 분류하기 # 각 샘플을 1차원 배열로 만들기.. 2023. 5. 25.
머신러닝 - 피마 인디언 당뇨병 예측 「 피마 인디언 당뇨병(Pima Indian Diabetes) 데이터 세트를 이용해 당뇨병 여부를 판단하는 머신러닝 예측 모델을 수립 」 ▷ 함수 생성하기 # 관련 모듈 import 하기 import numpy as np import pandas as pd import matplotlib.pyplot as plt %matplotlib inline from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score, precision_score,recall_score,roc_auc_score from sklearn.metrics import f1_score,confusion_matrix,precision.. 2023. 5. 17.
머신러닝 - 오차행렬 , 정확도 , 정밀도, 재현율 ▷ 정확도 실제 데이터에서 예측 데이터가 얼마나 같은지를 판단하는 지표 정확도 = 예측결과가 동일한 데이터 건수 / 전체 예측 데이터 건수 = ( TN + TP ) / ( TN + FP + FN + TP ) ▷ 오차행렬 학습된 분류 모델이 예측을 수행하면서 얼마나 헷갈리고 있는지도 함께 보여주는 지표 이진 분류의 예측 오류가 얼마인지와 더불어 어떠한 유형의 예측 오류가 발생하고 있는지를 함께 나타내는 지표 4분면 행렬에서 실제 레이블 클래스 값과 예측 레이블 클래스 값이 어떠한 유형을 가지고 매핑되는지를 나타냄 클래스 구분 예측 클래스 ( Predicted Class ) 실제 클래스 (Actual Class) Negative(0) Positive(1) Negative(0) TN (True Negative.. 2023. 5. 15.
머신러닝 - 데이터 전처리 (데이터 인코딩 & 피처 스케일링과 정규화) ▷ 데이터인코딩 - Label Encoding (레이블 인코딩) 카테고리 피처를 코드형 숫자값으로 변환하는 것 LabelEncoder 클래스로 객체를 생성한 후 fit() 과 transform()을 호출해 레이블 인코딩 수행 일괄적인 숫자 값으로 변환이 되면서 몇몇 ML 알고리즘에서 예측 성능이 떨어지는 경우가 발생할 수 있음 # 관련 모듈 import 하기 from sklearn.preprocessing import LabelEncoder import numpy as np # 리스트 작성하기 items=['TV','냉장고','전자레인지','컴퓨터','선풍기','선풍기','믹서','믹서',np.nan] # LabelEncoder를 객체로 생성하기 encoder = LabelEncoder() # fit_t.. 2023. 5. 13.
머신러닝 - Model Selection 모듈 소개 ▷ 학습/테스트 데이터 세트 분리 데이터 세트로만 학습한 후 예측하기 ( 예측 정화도 : 100% ) # 관련 모듈 import 하기 from sklearn.datasets import load_iris from sklearn.tree import DecisionTreeClassifier from sklearn.metrics import accuracy_score # 붓꽃 데이터 세트 로드하기 iris = load_iris() # DecisionTreeClassifier 객체 생성하기 dt_clf = DecisionTreeClassifier() # iris.data : feature 만으로 된 데이터 train_data = iris.data # iris.target: label 데이터 train_labe.. 2023. 5. 11.
머신러닝 - 사이킷런으로 수행하는 타이타닉 생존자 예측 ▷ 데이터 전처리 하기 - 관련 모듈 import 하기 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline - 데이터 불러오기 df = pd.read_csv('titanic_train.csv') - 결측치 확인하기 df.isna().sum() - 결측치 처리하기 ( 나이는 평균으로 처리, 선실번호 & 중간 정착항구는 N 으로 처리 ) df['Age'].fillna(df['Age'].mean(),inplace=True) df['Cabin'].fillna('N',inplace=True) df['Embarked'].fillna('N',inplace=True) - .. 2023. 5. 11.