월드 모델1 만들면서 배우는 생성 AI 12장 - 월드 모델 월드모델이란? 현재 상태와 행동이 주어졌을 때 다음 상태에 대한 확률분포를 만드는 생성모델로, 무작위로 이동하면서 그에 따른 환경적 변화를 학습하게 되면 모델이 새로운 작업에 대해 처음부터 스스로 훈련할 수 있게 되지 않을까?가 이 논문의 핵심입니다. 모델이 스스로 생성한 꿈속 세상(world)에서 수행한 실험을 통해 특정 작업을 처리하는 방법을 배우는 것을 보여주어, 생성모델링을 강화학습과 같은 다른 머신러닝 모델과 함께 적용했을 때 실용적인 문제를 해결하는 방법을 보여주는 훌륭한 사례입니다. 0. 사전 개념 : 강화 학습 월드 모델은 다양한 머신러닝 기법들이 섞여 있어서 하나하나씩 설명해보려고 합니다. 기본 개념 강화학습은 주어진 환경에서 에이전트가 특정 목적과 관련해서 최적의 성능을 발휘하는 것을 .. 2023. 12. 15. 이전 1 다음