인공지능의 학습
인공지능이란 사람처럼 배우고 판단할 수 있는 지능을 연구하는 공학분야입니다.
우리는 강아지와 고양이를 잘 구분합니다. 하지만 어떻게 구분하는지 설명할 수 있을까요? 털이 있다, 다리가 4개다, 코가 동글동글 귀엽다..? 다른 동물들과 너무 겹치는 특징입니다. 하지만 대부분의 사람은 높은 확률로 강아지와 고양이를 구분해냅니다. 이렇게 구분한 이유를 명확하게 설명할 수 없습니다. 왜냐하면 그동안의 많은 강아지와 고양이를 보았던 경험을 통해 구분이 가능하기 때문입니다.
강아지와 고양이를 연구하는 전문가라면 일반인에 비해 더 세세하게 구분이 가능하고 아직 많은 강아지와 고양이를 보지 못한 아이라면 구분을 어려워합니다. 이렇게 지능을 만들기 위해서는 기계를 학습시켜야 합니다. 많은 강아지와 고양이 사진을 보여주어 지능을 만들어가는 과정이 필요합니다.
많은 사진만 보여주면 뚝딱하고 지능이 생겨날까요? 지능을 만들기 위해서는 좋은 두뇌(알고리즘과 컴퓨터)와 좋은 데이터(강아지와 고양이 사진)가 필요합니다. 두뇌에 데이터를 넣어주면서 학습시키는 과정에서 생기는 문제점과 해결방법들에 대해서 한번 알아보겠습니다.
Underfitting과 Overfitting
강아지와 고양이를 구분하기 위한 지능을 만들기 위해서 기계에게 강아지 사진을 잔뜩 보여주려 합니다. 네 발로 걷는 사진, 털이 길거나 짧은 사진, 눈코입이 있는 사진, 짖는 사진 등 여러 종류의 강아지 사진을 1,000장 정도 학습시켰습니다. 이제 만들어진 지능에 준비한 강아지 사진을 보여줍니다!
오~ 모두 강아지라고 답을 하네요. 학습이 잘된 것 같은데 고양이도 한번 보여줘 볼까요?
앗 고양이 사진을 보고도 강아지라고 답변을 합니다. 왜 그럴까요? 고양이 사진뿐만 아니라 털 있고 네 발로 걷는 모든 동물을 보고 모두 강아지라고 판단하고 있습니다. 그 이유는 바로 한정된 종류의 사진만 보여주었기 때문입니다. 이렇게 데이터가 너무 적게 학습되었거나 학습하는 지능(모델)이 너무 단순함으로써 제대로 학습되지 않은 상태를 Underfitting_과소 적합이라고 합니다.
과소 적합을 해결하기 위해서 모델도 더 복잡하게 만들고 강아지와 고양이 사진을 여러 종류로 100,000장 정도 준비해서 다시 한번 학습을 진행해봅니다. 학습이 완료된 후 잘 학습이 되었는지 확인을 하기 위해 학습했던 사진 100,000장에서 랜덤으로 기계에게 보여줍니다. 강아지와 고양이를 정확하게 구분해냅니다! 그렇다면 학습하지 않았던 새로운 강아지 사진을 보여주어서 확인해볼까요?
앗 강아지 사진을 보고 고양이라고 답변을 합니다. 왜 그럴까요? 너무 복잡한 모델이 지능이 높아 100,000장을 통째로 외워버려서 정확하게 학습되었지만 그로 인해 새로운 사진을 보면 판단이 흐려지는 경우입니다. 이런 경우를 Overfitting_과적합 또는 과대 적합이라고 합니다.
간단하게 피자로 예를 들어 보면 Underfitting은 피자의 동그랗다는 특징처럼 간단하고 적은 특징만 학습되어 모든 동그란 물체를 피자라고 판단하는 경우이고 Overfitting은 불고기와 야채들이 올라가 있는 것처럼 세세하고 많은 특징까지도 학습되어 불고기가 안 보이는 피자는 피자가 아니라고 판단하는 경우입니다.
Underfitting 의미와 해결방법
과소 적합이란 기계 학습과정에서 모델의 능력이 부족하거나 학습 데이터의 질이 낮아서 판단하기에 부족한 상태를 뜻합니다. 간단하게 아직 학습이 덜 된 모델이라고 생각하면 편합니다. 해결방법으로는 학습 반복 횟수를 늘리기와 모델을 좀 더 복잡하게 변경하거나 데이터의 양을 늘리는 방법이 있습니다.
Overfitting 의미
과대 적합이란 기계 학습과정에서 모델이 능력이 높아 데이터를 과하게 학습하는 것을 뜻합니다. 학습한 데이터가 아니면 판단능력이 떨어지게 됩니다. 비유하자면 연습경기는 정말 잘하는데 실전에서는 능력을 발휘하지 못하는 경우입니다. 이런 경우를 해결하는 다양한 방법들이 있습니다.
다음 포스팅에서 정규화, 일반화, DropOut, Batch Nomaliztion 등 오버 피팅을 해결하는 여러 가지 방법들을 소개해보겠습니다.
내용 참고
한양대학교 인공지능융합대학원 딥러닝 개론 강의자료
'AI' 카테고리의 다른 글
배치 정규화:Batch Nomalization 이론/특징/알고리즘/한계/장단점 (66) | 2022.10.24 |
---|---|
Overfitting:오버피팅:과적합 방지, 해결을 위한 다양한 방법들 (52) | 2022.10.22 |
[로봇인공지능] 핵심 총정리 (58) | 2022.09.29 |
[로봇인공지능]Markov Decision Process (46) | 2022.09.28 |
[로봇인공지능]강화학습 소개 (60) | 2022.09.27 |