GAN3 만들면서 배우는 생성 AI 12장 - 월드 모델 월드모델이란? 현재 상태와 행동이 주어졌을 때 다음 상태에 대한 확률분포를 만드는 생성모델로, 무작위로 이동하면서 그에 따른 환경적 변화를 학습하게 되면 모델이 새로운 작업에 대해 처음부터 스스로 훈련할 수 있게 되지 않을까?가 이 논문의 핵심입니다. 모델이 스스로 생성한 꿈속 세상(world)에서 수행한 실험을 통해 특정 작업을 처리하는 방법을 배우는 것을 보여주어, 생성모델링을 강화학습과 같은 다른 머신러닝 모델과 함께 적용했을 때 실용적인 문제를 해결하는 방법을 보여주는 훌륭한 사례입니다. 0. 사전 개념 : 강화 학습 월드 모델은 다양한 머신러닝 기법들이 섞여 있어서 하나하나씩 설명해보려고 합니다. 기본 개념 강화학습은 주어진 환경에서 에이전트가 특정 목적과 관련해서 최적의 성능을 발휘하는 것을 .. 2023. 12. 15. 만들면서 배우는 생성AI 10장 : 고급 GAN 1. ProGAN 핵심 아이디어 NVIDIA LABS가 GAN 훈련의 속도와 안정성을 향상하려고 개발한 방법론입니다. 앞서, GAN은 두개의 서로 다른 경쟁적인 모델을 학습시켜야하기 때문에 훈련시키기가 매우 어렵다는 이야기가 있었습니다. 이 논문은 전체 해상도 이미지에서 바로 GAN을 훈련하는 대신 먼저 4X4 픽셀의 저해상도 이미지로 생성자와 판별자를 훈련한 다음 점차 해상도를 높이는 방법을 사용합니다. 점진적 훈련 위에서 말한 점진적 훈련은 아래와 같은 방식으로 고차원으로 확장해갑니다. 크게 전환과 안정화 두가지가 점진적 훈련의 주요 단계입니다. 전환 단계와 안정화 단계의 역할 : 이전의 4X4 생성자가 배운 이미지 생성 능력을 고해상도(8X8) 생성자도 배울 수 있도록 잔차 연결로 연결해줍니다. 새.. 2023. 12. 14. 만들면서 배우는 생성 AI 정리 4장 - GAN 모델 생성 AI 분야에서 모델이 학습하는 것은 우리가 만들어내려는 이미지의 "분포"를 학습하는 것이다. 이 부분이 가장 중요하고 이번 장에서 이 개념을 인지하고 보는 것이 가장 중요하다. WGAN의 경우에는 특히 분포간의 거리를 측정하는 와서스테인 손실함수가 나오는데 사실 이해하는데 오래 걸리긴 했지만 원리 자체는 결국 분포와의 분포 거리를 좁히기 위해 이런 개념을 도입한 거라고 보면 된다. 6가지 생성 모델링 방식 : GAN 4.1 소개 우리나라에서 화폐를 위조하면 범죄가 된다. 범죄임에도 사람들이 위조 지폐를 만드는 이유는 돈이 되기 때문이다. 애초에 화폐를 위조하기 쉽게 만들면 선의의 피해자가 생길 수 있기 때문에 화폐를 만드는데는 위조하기 힘들게 여러 구분장치들을 마련해둔다. 그럼에도 불구하고 위조 지.. 2023. 11. 21. 이전 1 다음