[์ธ๊ณต์ง๋ฅ ์์๊ฐ๊ธฐ] ๋จธ์ ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ์ ์ข ๋ฅ
๋จธ์ ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ์ ์ข ๋ฅ ์ ๋ฆฌ ๐
๋จธ์ ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ์ ํฌ๊ฒ ์ง๋ํ์ต(Supervised Learning), ๋น์ง๋ํ์ต(Unsupervised Learning), ๊ฐํํ์ต(Reinforcement Learning), ๋ฅ๋ฌ๋(Deep Learning)์ผ๋ก ๋๋ ์ ์์ต๋๋ค. ๊ฐ๊ฐ์ ์ ํ์๋ ๋ค์ํ ์๊ณ ๋ฆฌ์ฆ์ด ์์ผ๋ฉฐ, ๋ชฉ์ ์ ๋ฐ๋ผ ์ ์ ํ ๋ฐฉ๋ฒ์ ์ ํํด์ผ ํฉ๋๋ค.
๐น 1. ์ง๋ํ์ต (Supervised Learning)
์ ๋ต(Label)์ด ์ฃผ์ด์ง ๋ฐ์ดํฐ๋ก ํ์ตํ๋ ๋ฐฉ์์ผ๋ก, ์ ๋ ฅ(X)๊ณผ ์ถ๋ ฅ(Y)์ด ์กด์ฌํ๋ฉฐ, ๋ชจ๋ธ์ด X → Y ๊ด๊ณ๋ฅผ ํ์ตํฉ๋๋ค.
โ ์ง๋ํ์ต ์ฃผ์ ์๊ณ ๋ฆฌ์ฆ
์๊ณ ๋ฆฌ์ฆ ์ค๋ช ์ฃผ์ ํ์ฉ ๋ถ์ผ
KNN (K-Nearest Neighbors) | ๊ฐ์ฅ ๊ฐ๊น์ด ์ด์ ๋ฐ์ดํฐ ๊ธฐ๋ฐ์ผ๋ก ๋ถ๋ฅ ๋๋ ํ๊ท ์ํ | ์ด๋ฏธ์ง ๋ถ๋ฅ, ์๋ฃ ์ง๋จ |
์ ํ ํ๊ท (Linear Regression) | ์ ๋ ฅ ๋ณ์์ ์ถ๋ ฅ ๋ณ์์ ์ ํ ๊ด๊ณ๋ฅผ ์ฐพ์ | ์ฃผ๊ฐ ์์ธก, ์ง๊ฐ ์์ธก |
๋ก์ง์คํฑ ํ๊ท (Logistic Regression) | ๋ถ๋ฅ ๋ฌธ์ ์ ์ฌ์ฉ๋๋ ํ๊ท ๋ชจ๋ธ (์๊ทธ๋ชจ์ด๋ ํจ์) | ์คํธ ๋ฉ์ผ ๋ถ๋ฅ, ์ง๋ณ ์ง๋จ |
SVM (Support Vector Machine) | ์ดํ๋ฉด์ ์ด์ฉํ์ฌ ๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฅ | ์ผ๊ตด ์ธ์, ๋ฌธ์ ๋ถ๋ฅ |
์์ฌ๊ฒฐ์ ๋๋ฌด (Decision Tree) | ๋ฐ์ดํฐ๋ฅผ ํธ๋ฆฌ ํํ๋ก ๋ถ๋ฅ | ๊ณ ๊ฐ ์ดํ ์์ธก, ์๋ฃ ์ง๋จ |
๋๋ค ํฌ๋ ์คํธ (Random Forest) | ์ฌ๋ฌ ๊ฐ์ ๊ฒฐ์ ํธ๋ฆฌ๋ฅผ ๊ฒฐํฉํ ๋ชจ๋ธ | ๊ธ์ต ์ฌ๊ธฐ ํ์ง, ์ง๋ณ ์์ธก |
XGBoost / LightGBM | ๋ถ์คํ ๊ธฐ๋ฒ์ ํ์ฉํ ๊ฐ๋ ฅํ ML ๋ชจ๋ธ | Kaggle ๋ํ, ๊ธ์ต ๋ถ์ |
๐น 2. ๋น์ง๋ํ์ต (Unsupervised Learning)
์ ๋ต(Label)์ด ์๋ ๋ฐ์ดํฐ๋ก ํ์ตํ๋ ๋ฐฉ์์ผ๋ก, ๋ฐ์ดํฐ์ ํจํด์ ํ์ตํ์ฌ ๊ตฐ์งํ(Clustering)๋ ์ฐจ์ ์ถ์(Dimensionality Reduction)๋ฅผ ์ํํฉ๋๋ค.
โ ๋น์ง๋ํ์ต ์ฃผ์ ์๊ณ ๋ฆฌ์ฆ
์๊ณ ๋ฆฌ์ฆ ์ค๋ช ์ฃผ์ ํ์ฉ ๋ถ์ผ
K-ํ๊ท ๊ตฐ์งํ (K-Means Clustering) | ๋ฐ์ดํฐ๋ฅผ K๊ฐ์ ๊ทธ๋ฃน์ผ๋ก ์๋ ๋ถ๋ฅ | ๊ณ ๊ฐ ์ธ๋ถํ, ์ด๋ฏธ์ง ์์ถ |
DBSCAN | ๋ฐ๋๊ฐ ๋์ ๋ฐ์ดํฐ ํฌ์ธํธ๋ฅผ ๊ตฐ์งํ | ์ด์ ํ์ง, ๋ฐ์ดํฐ ๋ ธ์ด์ฆ ์ ๊ฑฐ |
PCA (Principal Component Analysis) | ๊ณ ์ฐจ์ ๋ฐ์ดํฐ๋ฅผ ์ ์ฐจ์์ผ๋ก ์ถ์ | ์ด๋ฏธ์ง ์์ถ, ์ ์ ์ ๋ฐ์ดํฐ ๋ถ์ |
Autoencoder | ์ ๊ฒฝ๋ง ๊ธฐ๋ฐ ์ฐจ์ ์ถ์ ๊ธฐ๋ฒ | ์ด์ ํ์ง, ๋ฐ์ดํฐ ์์ถ |
๐น 3. ๊ฐํํ์ต (Reinforcement Learning)
๋ณด์(Reward)๊ณผ ๋ฒ์ (Penalty)์ ํตํด ํ์ตํ๋ ๋ฐฉ์์ผ๋ก, AI๊ฐ ํ๊ฒฝ์์ ํ๋ํ๋ฉด์ ๋ณด์์ ์ต๋๋ก ํ๋ ๋ฐฉ๋ฒ์ ํ์ตํฉ๋๋ค.
โ ๊ฐํํ์ต ์ฃผ์ ์๊ณ ๋ฆฌ์ฆ
์๊ณ ๋ฆฌ์ฆ ์ค๋ช ์ฃผ์ ํ์ฉ ๋ถ์ผ
Q-learning | ๋ณด์์ ์ต๋๋ก ํ๋ ํ๋์ ํ์ต | ๊ฒ์ AI, ๋ก๋ด ์ ์ด |
Deep Q-Network (DQN) | ๋ฅ๋ฌ๋ ๊ธฐ๋ฐ Q-learning | ์ํ๊ณ , ์์จ์ฃผํ |
PPO (Proximal Policy Optimization) | ์ ์ฑ ๊ธฐ๋ฐ ๊ฐํํ์ต | ๋ก๋ด ์ปจํธ๋กค, ์ฃผ์ ํฌ์ |
A3C (Asynchronous Advantage Actor-Critic) | ๋ฉํฐ์ค๋ ๋ ํ์ต ๋ฐฉ์ ๊ฐํํ์ต | ์ค์๊ฐ ๊ฒ์ AI |
๐น 4. ๋ฅ๋ฌ๋ (Deep Learning)
๋ฅ๋ฌ๋(Deep Learning)์ ๋จธ์ ๋ฌ๋์ ํ ๋ถ์ผ๋ก, **์ธ๊ณต์ ๊ฒฝ๋ง(Neural Networks)**์ ๊ธฐ๋ฐ์ผ๋ก ํฉ๋๋ค.
โ ๋ฅ๋ฌ๋ ์ฃผ์ ์๊ณ ๋ฆฌ์ฆ
์๊ณ ๋ฆฌ์ฆ ์ค๋ช ์ฃผ์ ํ์ฉ ๋ถ์ผ
CNN (Convolutional Neural Network) | ์ด๋ฏธ์ง ๋ถ์์ ์ํ ์ ๊ฒฝ๋ง | ์ผ๊ตด ์ธ์, ์์จ์ฃผํ |
RNN (Recurrent Neural Network) | ์์ฐจ ๋ฐ์ดํฐ ํ์ต | ์์ฑ ์ธ์, ๊ธฐ๊ณ ๋ฒ์ญ |
LSTM (Long Short-Term Memory) | ๊ธด ์ํ์ค๋ฅผ ์ฒ๋ฆฌํ๋ RNN | ์ฃผ๊ฐ ์์ธก, ์ฑ๋ด |
GAN (Generative Adversarial Network) | ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๋ ์ ๊ฒฝ๋ง | ๋ฅํ์ดํฌ, ์ด๋ฏธ์ง ์์ฑ |
Transformer | ์์ฐ์ด ์ฒ๋ฆฌ์ ์ต์ ํ๋ ์ ๊ฒฝ๋ง | ์ฑGPT, ๋ฒ์ญ ๋ชจ๋ธ |
๐ ๋จธ์ ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ ์ ํ ๊ฐ์ด๋
์ด๋ค ์๊ณ ๋ฆฌ์ฆ์ ์ ํํด์ผ ํ ๊น์?
๋ฌธ์ ์ ํ ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ
์ด์ง ๋ถ๋ฅ (0 ๋๋ 1 ์์ธก) | ๋ก์ง์คํฑ ํ๊ท, SVM, ๋๋ค ํฌ๋ ์คํธ |
๋ค์ค ํด๋์ค ๋ถ๋ฅ | ๋๋ค ํฌ๋ ์คํธ, XGBoost, ์ ๊ฒฝ๋ง |
์ฐ์๊ฐ ์์ธก (ํ๊ท) | ์ ํ ํ๊ท, ๋๋ค ํฌ๋ ์คํธ, XGBoost |
๋น์ทํ ๋ฐ์ดํฐ ๊ทธ๋ฃนํ | K-ํ๊ท , DBSCAN |
์ด๋ฏธ์ง ๋ถ์ | CNN |
์์ฐ์ด ์ฒ๋ฆฌ | Transformer (BERT, GPT) |
์๊ณ์ด ๋ฐ์ดํฐ ๋ถ์ | LSTM, RNN |
๊ฒ์ AI, ๋ก๋ด ์ ์ด | ๊ฐํํ์ต (DQN, PPO) |
๐ ๊ฒฐ๋ก
๋จธ์ ๋ฌ๋์๋ ๋ค์ํ ์๊ณ ๋ฆฌ์ฆ์ด ์กด์ฌํ๋ฉฐ, ๋ฐ์ดํฐ์ ํน์ฑ๊ณผ ๋ฌธ์ ์ ํ์ ๋ฐ๋ผ ์ ์ ํ ๋ฐฉ๋ฒ์ ์ ํํ๋ ๊ฒ์ด ์ค์ํฉ๋๋ค. ๋ฐ์ดํฐ๊ฐ ๋ง๊ณ ๋ณต์กํ ๊ฒฝ์ฐ ๋ฅ๋ฌ๋์, ๋ฐ์ดํฐ๊ฐ ์ ๊ณ ํด์์ด ํ์ํ ๊ฒฝ์ฐ ์ ํต์ ์ธ ๋จธ์ ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ์ ํ์ฉํ๋ฉด ํจ๊ณผ์ ์ ๋๋ค.