Bomb Kirby Running
본문 바로가기

AI33

앙상블 모델 앙상블은 여러 개별 모델을 결합하여 하나의 강력한 모델을 형성하는 기술입니다. 이는 각 모델의 약점을 서로 보완하고 강점을 결합하여 높은 정확도와 안정성을 달성하는 데 도움이 됩니다. 1. 보팅( Voting) 1-1. VotingClassifier VotingClassifier는 여러 개의 서로 다른 머신러닝 분류기(Classifier)를 결합하여 하나의 강력한 앙상블 모델을 만드는 데 사용되는 Scikit-learn 라이브러리의 클래스입니다. 이는 앙상블 학습의 일종으로, 다양한 분류기의 예측을 조합하여 높은 정확도를 달성하려는 목적으로 사용됩니다. Hard Voting: Hard Voting은 다수결 원칙을 기반으로 합니다. 즉, 각 분류기가 투표를 하고, 다수의 분류기가 선택한 클래스를 최종 예측.. 2023. 12. 29.
랜덤 포레스트(데이터 전처리) 1. hotel 데이터셋 import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt hotel_df = pd.read_csv('/content/drive/MyDrive/KDT/머신러닝과 딥러닝/data/hotel.csv') hotel_df.info() RangeIndex: 119390 entries, 0 to 119389 Data columns (total 32 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 hotel 119390 non-null object 1 is_canceled 11939.. 2023. 12. 28.
서포트 벡터 머신 1. 손글씨 데이터셋 from sklearn.datasets import load_digits digits = load_digits() digits.keys() // dict_keys(['data', 'target', 'frame', 'feature_names', 'target_names', 'images', 'DESCR']) data = digits['data'] data.shape // (1797, 64) target = digits['target'] target.shape // (1797,) target // array([0, 1, 2, ..., 8, 9, 8]) data의 64개의 8*8 픽셀위치의 정보가 합해져서 숫자 손글씨가 완성됩니다. import matplotlib.pyplot as plt.. 2023. 12. 28.
로지스틱 회귀 1. hr 데이터셋 import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt hr_df = pd.read_csv('/content/drive/MyDrive/KDT/머신러닝과 딥러닝/data/hr.csv') hr_df.info() RangeIndex: 54808 entries, 0 to 54807 Data columns (total 13 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 employee_id 54808 non-null int64 1 department 54808 non-null o.. 2023. 12. 27.
의사 결정 나무(자전거 대여 예제) 1. 데이터 전처리 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns bike_df = pd.read_csv('/content/drive/MyDrive/KDT/머신러닝과 딥러닝/data/bike.csv') bike_df.info() RangeIndex: 33379 entries, 0 to 33378 Data columns (total 16 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 datetime 33379 non-null object 1 count 33379 non-null in.. 2023. 12. 26.
선형 회귀(랜트비 예측) 1. 데이터 전처리 import numpy as np import pandas as pd import seaborn as sns rent_df = pd.read_csv('/content/drive/MyDrive/KDT/머신러닝과 딥러닝/data/rent.csv') rent_df.info() RangeIndex: 4746 entries, 0 to 4745 Data columns (total 12 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 Posted On 4746 non-null object 1 BHK 4743 non-null float64 2 Rent 4746 non-null int64 3 Si.. 2023. 12. 26.