본문 바로가기
AI

머신러닝과 딥러닝

by 코낄2 2023. 12. 14.

1. 머신러닝과 딥러닝

머신러닝과 딥러닝은 인공지능 분야의 중요한 부분입니다. 인공지능이란 '인공(Artificial) + 지능(interlligence)'의 합성어로 크게 개발자의 의한 인공지능과 데이터에 의한 인공지능으로 나누어 볼 수 있습니다.

1. 머신러닝 (Machine Learning)
   - 개념: 머신러닝은 컴퓨터 시스템이 데이터에서 패턴을 학습하고 결정을 내릴 수 있도록 하는 인공지능의 한 분야입니다.
   - 동작 원리: 알고리즘이 주어진 데이터로부터 학습하고, 이를 기반으로 새로운 데이터에 대해 예측이나 결정을 내립니다.
   - 예시: 이메일 스팸 필터, 음성 인식, 추천 시스템 등이 머신러닝의 예입니다.

2. 딥러닝 (Deep Learning)
   - 개념: 딥러닝은 머신러닝의 한 종류로, 인공 신경망(ANN)을 사용하여 패턴 학습을 수행합니다. "딥"은 신경망이 여러 층으로 구성되어 있다는 것을 나타냅니다.
   - 동작 원리: 다층 신경망이 입력 데이터를 계층적으로 학습하고 추상화된 특징을 학습하여 복잡한 문제를 해결합니다.
   - 예시: 이미지 인식, 음성 인식, 자연어 처리 등이 딥러닝의 주요 응용 분야입니다.

간단히 말하면, 머신러닝은 데이터에서 규칙을 학습하여 작업을 자동화하는 방법을 제공하며, 딥러닝은 이를 위해 신경망 구조를 사용하여 보다 복잡하고 추상적인 패턴을 학습합니다.

1-1. 배경

과거에도 컴퓨터로 데이터를 읽어들이고, 데이터 안에서 특징을 학습하여 패턴을 찾아내는 작업(패턴인식)은 가능했습니다. 인터넷이 발달하면서 점차 데이터를 대량으로 수집 처리할 수 있는 환경이 갖춰짐으로 할 수 있는 일들이 많아졌습니다. 머신러닝은 데이터로부터 특징이나 패턴을 찾아내는 것이기 때문에 데이터가 가장 중요합니다.

1-2. 정의

머신러닝은 인공지능의 한 분야로 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야입니다.
"무엇(x)으로 무엇(y)을 예측하고 싶다"의 f(함수)를 찾아내는 것입니다.
y: 출력변수(종속변수), x: 입력변수(독립변수), f모형(머신러닝 알고리즘)이라고 할 수 있습니다.

2. 머신러닝의 다양한 처리방법

- 회귀(Regression)
시계열(시간적인 변화를 연속적으로 관측한 데이터)데이터와 같은 연속된 데이터를 취급할 때 사용하는 기법
예) 과거 주식 추세를 학습해서 내일의 주가를 예측하는 시스템을 개발
- 분류(Classification)
주어진 데이터를 클래스별로 구별해 내는 과정으로 데이터와 테이터의 레이블값을 학습시키고 어느 범주에 속한 데이터인지 판단하고 예측
예) 스팸메일인지 아닌지 구별해주는 시스템을 개발
- 클러스터링(Clustering)
분류와 비슷하지만 데이터에 레이블(정답 데이터)이 없음
유사한 속성들을 갖는 데이터를 일정한 수의 군집으로 그룹핑하는 비지도 학습
예) sns 데이터를 통해 소셜 및 사회 이슈를 파악

3. 학습

- 지도 학습 (Supervised Learning)
   - 개념: 문제와 정답을 함께 학습하여 예측 또는 분류하는 방식입니다. 모델은 입력 변수/독립 변수(x)와 출력 변수/종속 변수(y) 사이의 관계를 학습하여 새로운 데이터에 대한 예측이나 분류를 수행합니다.
   - 예시: 주어진 이메일이 스팸인지 아닌지를 판별하는 모델을 학습시키는 것.

- 비지도 학습 (Unsupervised Learning)
   - 개념: 출력 변수(y)가 없고, 입력 변수(x) 간의 관계를 모델링합니다. 군집 분석(유사한 데이터끼리 그룹화)이나 PCA와 같이 데이터의 패턴이나 구조를 파악하는 데 중점을 둡니다.
   - 예시: 비슷한 특성을 갖는 고객들을 그룹화하여 마케팅 전략을 수립하는 모델을 만드는 것.

- 자기지도 학습 (Self-Supervised Learning)
   - 개념: 데이터 자체에서 레이블을 생성하여 학습에 활용하는 방법으로, 다량의 레이블이 없는 데이터에서 부분들 간의 관계를 통해 레이블을 자동으로 생성하는 비지도 학습 기법입니다.
   - 예시: BERT, GPT와 같은 모델은 문장의 일부를 가리고 해당 부분을 예측하도록 학습하여 자기지도 학습을 수행합니다.

- 강화 학습 (Reinforcement Learning)
   - 개념: 순차적인 결정이 필요한 문제에 적용됩니다. 라벨이 있는 데이터를 통해 보상의 개념을 사용하여 시스템이 특정 행동을 취하도록 가중치와 편향을 조절합니다.
   - 예시: 게임에서 승리할 때마다 보상을 받아 게임 전략을 학습하는 에이전트를 구축하는 것과 유사한 원리입니다.

'AI' 카테고리의 다른 글

로지스틱 회귀  (0) 2023.12.27
의사 결정 나무(자전거 대여 예제)  (0) 2023.12.26
선형 회귀(랜트비 예측)  (1) 2023.12.26
타이타닉 데이터셋  (0) 2023.12.26
사이킷런/아이리스 데이터셋 예제  (0) 2023.12.24