ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 강화학습과 지도학습의 차이
    인공지능 2022. 11. 30. 21:24
    728x90
    반응형
    SMALL

    강화학습 플랫폼의 인턴을 준비하면서, 동기가 회사 입사 전에 알아보면 좋을 것들에 대해 말해준 적이 있었다.

    그 중에는 우선 강화학습을 하는 팀이니, 인공지능에 대해 다시금 관련 지식을 머리에 새기고 오는 것도 좋을 것 같다는 말을 해줬다.

     

    인공지능(AI=Artificial Intelligence)에 대해 한 줄로 설명해보자면,

    AI는 인간의 지능을 모방하는 기초 지능을 뜻한다. 즉, 인간처럼 사고하고 행동하는 컴퓨터를 말한다.

     

    인공지능은 크게 3가지로 분류될 수 있는데, 그것은 지도학습, 비지도학습, 강화학습이 있다.

    지도학습

    정답이 있는 데이터를 활용해 데이터를 학습

    지도학습의 종류

    • 분류 - 주어진 데이터를 정해진 카테고리에 따라 분류
      • 스팸 메일 분류하기
    • 회귀 - 어떤 데이터들의 feature를 기준으로, 연속된 값을 예측하는 문제로 주로 어떤 패턴이나, 트렌드, 경향을 예측할 경우 사용된다.
      • 지역 별, 나이 별 어떤 제품에 대한 선호도를 조사한 뒤, 경기도민 30대의 이 제품에 대한 선호도를 예측

    비지도학습

    정답 라벨이 없는 데이터를 비슷한 특징끼리 군집화하여 새로운 데이터에 대한 결과를 예측하는 방법
    -> 라벨링 되어있지 않은 데이터들로부터 패턴이나 형태를 찾아야 한다.

    비지도학습 종류

    • 클러스터링 - 라벨링되어 있지 않은 비슷한 집단끼리 군집화하여 답을 찾는 형태입니다.
      • 치와와 사진과 쿠키 사진을 통해 이것은 치와와다 쿠키다라고 군집화 하는 것
    •  GAN(generative Adversarial Network)모델

    지도학습과 비지도학습의 종류

    강화학습

    분류할 수 있는 데이터가 존재하는 것도 아니고 데이터가 있어도 정답이 다로 정해져 있지 않으며 자신이 한 행동에 대한 보상을 받으며 학습하는 것을 말한다.

    딥러닝의 등장 이후 강화 학습에 신경망을 적용하면서부터 바둑이나, 자율 주행 자동차와 같은 복잡한 문제에 적용

    강화학습 종류

    • DQN(Deep Q networks)
    • A3C(Asynchronous Advantage Actor-Critic)

     

     

     

     

    ※ 다음 포스팅에는 강화학습의 용어에 대해 정리해보려고 합니다.

    반응형
    LIST

    댓글

Designed by Tistory.