-
강화학습과 지도학습의 차이인공지능 2022. 11. 30. 21:24728x90반응형SMALL
강화학습 플랫폼의 인턴을 준비하면서, 동기가 회사 입사 전에 알아보면 좋을 것들에 대해 말해준 적이 있었다.
그 중에는 우선 강화학습을 하는 팀이니, 인공지능에 대해 다시금 관련 지식을 머리에 새기고 오는 것도 좋을 것 같다는 말을 해줬다.
인공지능(AI=Artificial Intelligence)에 대해 한 줄로 설명해보자면,
AI는 인간의 지능을 모방하는 기초 지능을 뜻한다. 즉, 인간처럼 사고하고 행동하는 컴퓨터를 말한다.
인공지능은 크게 3가지로 분류될 수 있는데, 그것은 지도학습, 비지도학습, 강화학습이 있다.
지도학습
정답이 있는 데이터를 활용해 데이터를 학습
지도학습의 종류
- 분류 - 주어진 데이터를 정해진 카테고리에 따라 분류
- 스팸 메일 분류하기
- 회귀 - 어떤 데이터들의 feature를 기준으로, 연속된 값을 예측하는 문제로 주로 어떤 패턴이나, 트렌드, 경향을 예측할 경우 사용된다.
- 지역 별, 나이 별 어떤 제품에 대한 선호도를 조사한 뒤, 경기도민 30대의 이 제품에 대한 선호도를 예측
비지도학습
정답 라벨이 없는 데이터를 비슷한 특징끼리 군집화하여 새로운 데이터에 대한 결과를 예측하는 방법
-> 라벨링 되어있지 않은 데이터들로부터 패턴이나 형태를 찾아야 한다.비지도학습 종류
- 클러스터링 - 라벨링되어 있지 않은 비슷한 집단끼리 군집화하여 답을 찾는 형태입니다.
- 치와와 사진과 쿠키 사진을 통해 이것은 치와와다 쿠키다라고 군집화 하는 것
- GAN(generative Adversarial Network)모델
강화학습
분류할 수 있는 데이터가 존재하는 것도 아니고 데이터가 있어도 정답이 다로 정해져 있지 않으며 자신이 한 행동에 대한 보상을 받으며 학습하는 것을 말한다.
딥러닝의 등장 이후 강화 학습에 신경망을 적용하면서부터 바둑이나, 자율 주행 자동차와 같은 복잡한 문제에 적용
강화학습 종류
- DQN(Deep Q networks)
- A3C(Asynchronous Advantage Actor-Critic)
※ 다음 포스팅에는 강화학습의 용어에 대해 정리해보려고 합니다.
반응형LIST - 분류 - 주어진 데이터를 정해진 카테고리에 따라 분류