본문 바로가기

전체 글54

Machine Learning Yearning Book 정리 이 책은 Andrew Ng 교수님이 이북 형태로 공개한 책으로, 머신러닝 프로젝트를 구조화하고 개선하는 전략과 다양한 기법을 소개한다. 단순히 개념 소개라기보다는 머신러닝 모델을 만들면서, 접할 수 있는 다양한 케이스들에 대한 소개와 방법들을 예시와 함께 정리해놓은 책이다. 전체 58장으로 구성되어 있고, 무료로 다운로드 가능하기 때문에 실무적인 내용이나 트레이닝할 때 유의할 점 등을 어깨 너머로 배우기에는 좋은 책인 것 같다. 약 120페이지 정도이고, 주변의 번역해놓은 블로그도 많아서 영어 번역이 귀찮으신 분들은 참고하시면 좋을 것 같다. 책 정리는 모든 내용을 정리하기 보다는 내가 보면서 중복되는 내용 제거하고 도움될만한 것들 참고용으로 정리했다. 데이터 양과 모델 성능의 관계 전통적인 머신러닝 방.. 2023. 9. 15.
DAN 2023 요약 (팀네이버 컨퍼런스) 네이버에서 지난 8월 24일에 진행한 컨퍼런스 다시보기가 풀려서, 들은 내용을 조금 정리해보았다. 기술 트렌드를 보기 위한 목적이라서 개별 네이버 사업분야의 발전 방향보다는 네이버의 AI 방향성과 새로 나온 하이퍼클로바가 어떤 부분에 집중하는지에 대해서 정리했다. (다시보기 링크) 전체 구성 1. 오프닝 키노트를 시작으로 네이버가 출시한 하이퍼클로바 X에 대한 소개 2. 주요 사업부/프로덕(검색, 광고, 쇼핑, 페이, 웹툰)에 대한 성과, AI 적용(이 부분이 많은 부분을 차지하고 있진 않았다.) 3. 하이퍼 클로바X를 사용한 스타트업들의 후기 이렇게 3개 정도로 나눠볼 수 있을 것 같다. 주요 인사이트 앞서 말했듯이 전체 세션이 모두 다 기록할 필요는 없고, LLM 관점에서 어떻게 활용하고 장점이 있는.. 2023. 9. 15.
back-propagation 개념 서론 앞에서 우리는 실제 신경망을 통해서 값을 예측하는 연산인 forward pass를 수행했다. 당연히 랜덤하게 가중치를 설정해서 연산한 값으로 예측이 잘 맞을리 없고, 이제부터 실제 정답과 비교하면서 가중치를 조정해야한다. 상단 그림을 잠깐 설명해보면, 파란색 원은 모델이 예측한 값이고 보라색 네모는 실제 정답이다. 자세히 보면, 보라색의 3번째 값만 1이고 나머지는 다 0인데 즉 정답은 손글씨로 숫자 3으로 적혀져있다고 보면 된다. 하지만 동일한 위치의 파란색 원은 0.4로 1과 비교했을 때 매우 작은 것을 볼 수 있다. 우리가 원하는 건 결국 모델의 가중치 W를 수정해서 0.4 -> 1에 가까워지길 원하는 것이 딥러닝의 목표라고 볼 수 있다. 또한 나머지 파란색 원들의 값(0.1, 0.03, 0... 2023. 9. 15.
Forward Pass code의 수학적 이해와 code 구현하기 오늘은 이전까지 배워온 내용을 실제로 Forward pass 코드로 구현하는 작업을 해보려고 한다. 캐글이 바로 데이터를 가져오기 쉽고 별도의 설정 없이도 바로 웹에서 돌아가기 때문에 캐글 노트북 기준으로 코드를 작성했다. 사용법은 이 블로그(링크)에서 잘 설명이 되어 있어서 참고하시면 될 것 같다. 실습 데이터 설명 1. MNIST 데이터란? - MNIST 데이터는 사람의 손으로 직접 쓴 0~9까지의 글씨와 실제 해당 이미지가 무슨 숫자를 의미하는지를 라벨로 정의해놓은 데이터다. - 이미지라고 표현했지만, 실제로는 784픽셀로 이루어진 이미지 중에 검은색으로 칠해진 경우에 1, 흰색으로 칠해진 경우에는 0으로 표시한 벡터이다. - 실제 데이터를 예시로 표현해보면 이렇게 구성되어 있다.(train dat.. 2023. 9. 14.
Deep Neural Network의 구성요소와 Forward pass 0. 서론 실제 인간처럼 학습을 위해서는 단순히 1~2개 정도의 뉴런 단계를 만드는 것이 아니라, 수백 수천개를 쌓기 때문에 그 층이 깊다고 해서 Deep이라고 붙인다. 그래서 우리는 딥 뉴럴 네트워크라고 부르고 이렇게 깊은 신경망을 학습시키기 때문에 딥러닝이라고 부른다. 앞의 내용까지가 기존의 프로그래밍적 사고와 DNN이 어떻게 다른지에 대한 개념 설명이었다면, 이제는 실질적으로 DNN을 이루는 요소들과 실제로 어떻게 학습하는지에 대해서 설명해보려고 한다. 기본적인 프로세스는 "함수"를 생각하면 된다. 함수란? 쉽게 말하면 Input값이 들어가면 어떤 함수에 의해 변형된 output값이 노출되는 것을 말한다. 각 구성요소별로, 어떤 값이 입력으로 들어오고, 어떤 변형(변형의 목적)을 통해서 어떤 값이 .. 2023. 9. 13.
머신러닝과 딥러닝의 개념적 이해 남들에게 가르치듯이 공부하다보면 단기기억에서 장기기억으로 넘어가면서 더 효과적으로 공부할 수 있다는 파인만의 공부법에 따라 앞으로 AI와 관련해서, 기본적인 개념들을 쉽게 설명하는 형태로 글을 써보면서 딥러닝 개념들을 정리해보려고 한다. 1. AI 정의 인간은 오래 전부터, 인간을 대체할만한 수준의 지능을 가진 인공지능(오늘날에는 AGI)을 구현해내려고 했다. 인공지능이란, "인간이 할 수 있는 모든 Task들을 할 수 있는 지능"을 의미한다. 그동안 컴퓨터와 대화할 수 있는 프로그래밍 언어를 통해서 인공지능을 만드는 노력들을 하면서 수학 계산 등의 처리는 가능해졌지만, 인간은 오감을 가지고 있기 때문에 소리, 시각과 같은 처리에 있어서는 프로그래밍 언어만으로는 한계가 보이기 시작했다. 예시로, 인간보.. 2023. 9. 12.