본문 바로가기

AI32

랜덤 포레스트(데이터 전처리) 1. hotel 데이터셋 import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt hotel_df = pd.read_csv('/content/drive/MyDrive/KDT/머신러닝과 딥러닝/data/hotel.csv') hotel_df.info() RangeIndex: 119390 entries, 0 to 119389 Data columns (total 32 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 hotel 119390 non-null object 1 is_canceled 11939.. 2023. 12. 28.
서포트 벡터 머신 1. 손글씨 데이터셋 from sklearn.datasets import load_digits digits = load_digits() digits.keys() // dict_keys(['data', 'target', 'frame', 'feature_names', 'target_names', 'images', 'DESCR']) data = digits['data'] data.shape // (1797, 64) target = digits['target'] target.shape // (1797,) target // array([0, 1, 2, ..., 8, 9, 8]) data의 64개의 8*8 픽셀위치의 정보가 합해져서 숫자 손글씨가 완성됩니다. import matplotlib.pyplot as plt.. 2023. 12. 28.
로지스틱 회귀 1. hr 데이터셋 import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt hr_df = pd.read_csv('/content/drive/MyDrive/KDT/머신러닝과 딥러닝/data/hr.csv') hr_df.info() RangeIndex: 54808 entries, 0 to 54807 Data columns (total 13 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 employee_id 54808 non-null int64 1 department 54808 non-null o.. 2023. 12. 27.
의사 결정 나무(자전거 대여 예제) 1. 데이터 전처리 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns bike_df = pd.read_csv('/content/drive/MyDrive/KDT/머신러닝과 딥러닝/data/bike.csv') bike_df.info() RangeIndex: 33379 entries, 0 to 33378 Data columns (total 16 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 datetime 33379 non-null object 1 count 33379 non-null in.. 2023. 12. 26.
선형 회귀(랜트비 예측) 1. 데이터 전처리 import numpy as np import pandas as pd import seaborn as sns rent_df = pd.read_csv('/content/drive/MyDrive/KDT/머신러닝과 딥러닝/data/rent.csv') rent_df.info() RangeIndex: 4746 entries, 0 to 4745 Data columns (total 12 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 Posted On 4746 non-null object 1 BHK 4743 non-null float64 2 Rent 4746 non-null int64 3 Si.. 2023. 12. 26.
타이타닉 데이터셋 1. 타이타닉 데이터셋 타이타닉 데이터셋은 역사적인 타이타닉호의 승객 정보에 관한 데이터입니다. 이 데이터셋은 기계 학습 및 데이터 분석을 연습하기 위한 대표적인 예제로 많이 사용됩니다. 주로 생존 여부와 관련된 문제로 사용되며, 승객의 여러 특성에 대한 정보를 포함하고 있습니다. Survived (생존 여부): 0이면 사망, 1이면 생존. Pclass (티켓 등급): 1, 2, 3 등급이 있음. Name (이름): 승객의 이름. Sex (성별): 남성 또는 여성. Age (나이): 승객의 나이. SibSp (형제자매 또는 배우자 수): 함께 탑승한 형제자매 또는 배우자의 수. Parch (부모 또는 자녀 수): 함께 탑승한 부모 또는 자녀의 수. Ticket (티켓 번호): 승객의 티켓 번호. Fare.. 2023. 12. 26.