'강화학습' 태그의 글 목록 — J Story

강화학습

AI

[로봇인공지능] 핵심 총정리

로봇 인공지능 분야 9월 29일 목요일 오후 7:00, 인공지능대학원 4학기 첫 시험을 치른다. 로봇분야는 강화 학습의 역할이 크고 수학과 통계 개념이 중요하다. 어렵고 복잡한 내용이지만 공부한 내용을 간결하게 요약해보며 시험을 위한 준비를 해보려 한다. 복잡한 수식과 계산은 참고만 해두고 최대한 개념과 이론 설명 위주로 작성해본다. Robots with AI INTRO 인공지능? 추론, 의미 이해, 일반화, 과거로부터 학습, 어떻게 행동할 것인지 결정하는 능력을 갖춘 시스템. 로봇분야에서는 어떻게 행동할 것인지 결정하는 것, make decision to act이 중요하다. The ability to reason, discover meaning, generalize, learn from past, ma..

AI

[로봇인공지능]Markov Decision Process

Markov Decision Process(MDP) MDP는 RL, 강화 학습에서 중요한 핵심 이론이다. 이론을 알아보기 전에 Markov property에 대한 정의를 먼저 알아보면 agent가 환경에서 어떤 행동을 취하기 위해서는 의사결정이 필요하다. 그럴 때 의사결정을 위해서 주변 환경으로부터 정보를 받게 되는데 이런 정보들의 특성을 Markov property라 한다. 현재 state에서 다음 state로 변화하는 transition은 오로지 현재 state만 의존한다. 왜냐하면 현재 state에는 과거의 여러 과정을 거쳐서 행동한 것이므로 앞으로의 행동을 위한 정보를 충분히 포함하고 있다고 보는 것이다. Markov_마르코프 연쇄 Markov Chain Markov property를 가지고 있는..

AI

[로봇인공지능]강화학습 소개

강화 학습 강화 학습을 하는 주체를 agent라고 부른다. agent는 주변 환경과 상호작용(interaction)을 하면서 환경이 어떻게 변하는지 피드백을 받아 자신이 어떻게 행동해야 하는지 학습해서 발전된다. 강화 학습이 학습을 하는 방법은 사람이 경험을 통해 배우는 방법과 굉장히 유사하다. 어린아이의 경우 잘 모르던 시절에 위험한 행동을 했을 때 어른들로부터 부정적인 피드백을 받는다. 그 피드백을 통해 "이렇게 하면 안 되는구나"라고 학습하여 앞으로 피하게 되고 좋은 행동을 함으로써 부모님에게 칭찬 또는 갖고 싶었던 물건등으로 보상을 받게 되면서 그 피드백을 통해 또 배워나가게 된다. 이처럼 강화 학습은 사람이 배우는 것과 비슷한 패러다임을 갖고 있어 매력적인 분야이다. 강화 학습은 사실 머신러닝의..

AI

기계가 사람처럼 변해가는 과정 쉽게 알아보기(지도학습, 비지도학습, 강화학습)

기계가 사람처럼 행동하려면 뭐가 필요할까? 인공지능(artificial intelligence)이란 기계가 사람처럼 생각하고 결정하도록 만드는 과학분야입니다. 요즘 주변에서 AI가 붙은 제품을 많이 찾아볼 수 있습니다. 하지만 우리가 꿈꾸고 또 발전시키고 있는 인공지능은 사람과 대화도 나눌 수 있고 요청하면 필요한 것을 제공해줄 수 있는 정말 사람 같은 로봇입니다. 청소와 설거지 그리고 단순 반복 작업 같이 지루하고 귀찮은 일도 해주거나 높은 건물의 창문을 닦는 일, 깊은 탄광에서 오래 일하는 위험한 일들도 대신해주기를 바라죠. 그럼 인간은 단순 노동에서 해방될 수 있다고 기대하고 있습니다. 요즘 주변에서 AI란 키워드는 정말 쏟아지고 있지만 아직 영화에서 보던 인공지능과는 한참 떨어지는 수준입니다. A..

인프준
'강화학습' 태그의 글 목록