AI33 파이토치로 구현한 선형회귀 1. 단항 선형 회귀 실습 단항 선형 회귀는 하나의 독립 변수와 종속 변수 간의 선형 관계를 모델링하는 통계적 기법입니다. import torch import torch.nn as nn import torch.optim as optim import matplotlib.pyplot as plt torch.manual_seed(2024) # 동일한 시드를 사용하는 경우 항상 동일한 난수가 생성 x_train = torch.FloatTensor([[1], [2], [3]]) y_train = torch.FloatTensor([[2], [4], [6]]) print(x_train, x_train.shape) tensor([[1.], [2.], [3.]]) torch.Size([3, 1]) print(y_trai.. 2024. 1. 8. 파이토치 1.파이토치(Pytorch) 파이토치(PyTorch)는 머신러닝과 딥러닝 분야에서 가장 널리 사용되는 오픈 소스 프레임워크 중 하나로, TensorFlow와 더불어 대중적으로 활용되고 있습니다. 초기에는 "Torch"라는 이름으로 루아(Lua) 언어를 기반으로 만들어졌으나, 파이썬 기반으로 변경된 것이 파이토치입니다. 이 프레임워크는 뉴욕대학교와 페이스북(현재는 메타로 알려져 있음)이 공동으로 개발하였으며, 현재는 머신러닝 및 딥러닝 업계에서 가장 대중적인 도구 중 하나로 자리매김하고 있습니다. import torch print(torch.__version__) // 2.1.0+cu121 2. 텐서(Tensor) 텐서(Tensor)는 다차원 배열로, 스칼라, 벡터, 행렬을 포함한 여러 차원의 숫자 데이터.. 2024. 1. 7. KMeans 1. Clusters(클러스터) 클러스터는 비슷한 속성을 가진 데이터 포인트들의 그룹(집합)입니다. 이는 데이터를 비슷한 패턴이나 특징을 공유하는 서로 다른 부분 집합으로 나누는 과정을 말합니다. 클러스터링은 데이터 내의 숨겨진 패턴이나 구조를 찾아 데이터를 유사한 특성을 가진 그룹으로 분류할 수 있습니다. (종속 변수가 없는 비지도 학습) 예를 들어 고객 분류, 유전자 분석, 이미지 분할 등으로 활용할 수 있습니다. K-평균 클러스터링, 계층적 클러스터링, DBSCAN (Density-Based Spatial Clustering of Applications with Noise) 등 다양한 클러스터링 알고리즘이 있습니다. import numpy as np import pandas as pd import .. 2024. 1. 5. 다양한 모델 적용 1. AirQualityUCI 데이터셋 import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt air_df = pd.read_csv('/content/drive/MyDrive/KDT/머신러닝과 딥러닝/data/AirQualityUCI.csv') air_df.info() RangeIndex: 9471 entries, 0 to 9470 Data columns (total 17 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 Date 9357 non-null object 1 Time 9357 no.. 2024. 1. 5. lightGBM 1. credit 데이터셋 import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt credit_df = pd.read_csv('/content/drive/MyDrive/KDT/머신러닝과 딥러닝/data/credit.csv') pd.set_option('display.max_columns', 50) credit_df.head() # 필요 없는 컬럼 삭제 credit_df.drop(['ID', 'Customer_ID','Name', 'SSN'], axis=1, inplace=True) credit_df.info() RangeIndex: 12500 entries, 0 to 124.. 2024. 1. 1. 랜덤 포레스트 1. 랜덤 포레스트 랜덤 포레스트는 머신러닝에서 널리 사용되는 앙상블 기법 중 하나로, 주로 배깅(Bagging) 방법을 기반으로 합니다. https://junyealim.tistory.com/90 앙상블 모델 앙상블은 여러 개별 모델을 결합하여 하나의 강력한 모델을 형성하는 기술입니다. 이는 각 모델의 약점을 서로 보완하고 강점을 결합하여 높은 정확도와 안정성을 달성하는 데 도움이 됩니다. 1 junyealim.tistory.com 랜덤 포레스트는 각 결정 나무를 구성할 때, 학습 데이터에서 랜덤하게 샘플을 추출하여 사용하고, 각 노드에서 최적의 분할을 찾을 때 특정 변수들을 랜덤하게 선택합니다. 이러한 랜덤성은 모델의 다양성을 증가시켜 오버피팅을 방지하고, 전반적인 일반화 성능을 향상시킵니다. 개별 .. 2023. 12. 29. 이전 1 2 3 4 5 6 다음