2.1 문제해결전략과 동적계획법 : 강화학습의 수학적 기초와 알고리즘의 이해
강화학습의 수학적 기초와 알고리즘의 이해 강의를 듣고, 정리한 글 임을 밝힙니다. 수학적 귀납법(Mathematical induction) $p_1, p_2, p_3, \dots$ 라는 참 또는 거짓인 명제가 있다고 하자 $p_1$이 참이고, 모든 $n \ge 1$ 에 대해 $p_n$이 참일 때 $p_{n+1}$도 참이라면, $p_1, p_2, \dots$ 모두 참이다 동적계획법(DP)으로 풀기 $$ V(i,j) = min \begin{cases} C_{ij} + V(i,j +1) \\ C_{ij} + V(i + 1, j) \end{cases} $$ 탐욕 알고리즘(Greedy Algorithm) 매 순간 최선의 선택 분할 정복 알고리즘(Divide-and-conquer Algorithm) 문제를 하나 이..
2022. 11. 1.