본문 바로가기

분류 전체보기124

데이터 로더 1. 데이터 로더(Data Loader) 머신러닝 및 딥러닝 모델을 훈련시키거나 테스트할 때 일반적으로 데이터는 모델에 배치(batch) 단위로 공급됩니다. 데이터 로더는 이러한 배치를 효과적으로 생성하여 데이터의 양이 많을 때 모델이 효율적으로 학습하도록 지원합니다. 2. 손글씨 인식 모델 만들기 import torch import torch.nn as nn import torch.optim as optim import torchvision.transforms as transforms import matplotlib.pyplot as plt from sklearn.datasets import load_digits from sklearn.model_selection import train_test_spl.. 2024. 1. 9.
파이토치로 구현한 논리회귀 x_train = torch.FloatTensor([[0], [1], [3], [5], [8], [11], [15], [20]]) y_train = torch.FloatTensor([[0], [0], [0], [0], [0], [1], [1], [1]]) print(x_train.shape) // torch.Size([8, 1]) print(y_train.shape) // torch.Size([8, 1]) 1. 단항 논리회귀(Logistic Regression) 실습 단항 논리회귀(Logistic Regression)는 주로 이진 분류 문제에 사용되는 간단하면서도 효과적인 통계 기반의 머신러닝 알고리즘입니다. 선형 회귀 공식으로부터 나왔기 때문에 이름에 "회귀"가 포함되어 있지만, 사실은 분류 알고리즘이.. 2024. 1. 8.
기온에 따른 지면 온도 예측 # df에 데이터 프레임으로 불러오기 import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt temp_df = pd.read_csv('/content/drive/MyDrive/KDT/머신러닝과 딥러닝/data/temps.csv',encoding='ms949') temp_df.info() RangeIndex: 8782 entries, 0 to 8781 Data columns (total 5 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 지점 8782 non-null int64 1 지점명 87.. 2024. 1. 8.
파이토치로 구현한 선형회귀 1. 단항 선형 회귀 실습 단항 선형 회귀는 하나의 독립 변수와 종속 변수 간의 선형 관계를 모델링하는 통계적 기법입니다. import torch import torch.nn as nn import torch.optim as optim import matplotlib.pyplot as plt torch.manual_seed(2024) # 동일한 시드를 사용하는 경우 항상 동일한 난수가 생성 x_train = torch.FloatTensor([[1], [2], [3]]) y_train = torch.FloatTensor([[2], [4], [6]]) print(x_train, x_train.shape) tensor([[1.], [2.], [3.]]) torch.Size([3, 1]) print(y_trai.. 2024. 1. 8.
파이토치 1.파이토치(Pytorch) 파이토치(PyTorch)는 머신러닝과 딥러닝 분야에서 가장 널리 사용되는 오픈 소스 프레임워크 중 하나로, TensorFlow와 더불어 대중적으로 활용되고 있습니다. 초기에는 "Torch"라는 이름으로 루아(Lua) 언어를 기반으로 만들어졌으나, 파이썬 기반으로 변경된 것이 파이토치입니다. 이 프레임워크는 뉴욕대학교와 페이스북(현재는 메타로 알려져 있음)이 공동으로 개발하였으며, 현재는 머신러닝 및 딥러닝 업계에서 가장 대중적인 도구 중 하나로 자리매김하고 있습니다. import torch print(torch.__version__) // 2.1.0+cu121 2. 텐서(Tensor) 텐서(Tensor)는 다차원 배열로, 스칼라, 벡터, 행렬을 포함한 여러 차원의 숫자 데이터.. 2024. 1. 7.
KMeans 1. Clusters(클러스터) 클러스터는 비슷한 속성을 가진 데이터 포인트들의 그룹(집합)입니다. 이는 데이터를 비슷한 패턴이나 특징을 공유하는 서로 다른 부분 집합으로 나누는 과정을 말합니다. 클러스터링은 데이터 내의 숨겨진 패턴이나 구조를 찾아 데이터를 유사한 특성을 가진 그룹으로 분류할 수 있습니다. (종속 변수가 없는 비지도 학습) 예를 들어 고객 분류, 유전자 분석, 이미지 분할 등으로 활용할 수 있습니다. K-평균 클러스터링, 계층적 클러스터링, DBSCAN (Density-Based Spatial Clustering of Applications with Noise) 등 다양한 클러스터링 알고리즘이 있습니다. import numpy as np import pandas as pd import .. 2024. 1. 5.