廣宣學堂為您推出機器學習系列之 強化學習系列
強化學習 (Reinforcement Learning) 是一個有趣而充滿潛力的領域,其演算法具備了類似人類的決策要素,也內含了人類在學習中的摸索過程,能計算最佳策略、能建立獎勵機制、能根據已存有的經驗檢討過去、推演未來。近年來日益火紅,強化學習已經在各種決策應用有很突出的表現 (如 Deepmind 最火紅的 AlphaCraft、以及過去很成功的 AlphaGo),目前是人工智慧一個受人矚目而且充滿潛力的領域。
廣宣學堂特約講師為在人工智慧領域擁有堅實理論背景、又在國外知名數據公司擁有實戰經驗的洪博士,以精華、高效方式,帶領您一次跨入強化學習的各個重要議題與內容,並且配合實作,讓學習更有收穫。投資自己的競爭力,在專業上多人一步、勝人一籌 !
課程內容:
六小時名師高品質教學、詳細研究、精華一次吸收
9/21 (六) 9:30~12:30 / 13:30~16:30 (準時開始,時段以當場狀況為準,中午自行用餐)
一. 強化學習概論
環境因素與智慧代理人 / 策略與規劃(Policy and Planning) / 價值函數(Value Function) / 運作模型介紹 / 獎勵與懲罰機制 /最佳價值函數 /馬可夫決策問題(MDP)
二、深入強化學習
有限馬可夫決策處理(FMDP) / 動態規劃 / 蒙地卡羅方法(Monte Carlo Method) / 時間差分學習 / Q學習(Q-Learning) / 策略梯度法(Policy Gradient Method)
三、 深度強化學習
深度Q學習網路(DQN) / 演員評判家方法 (Actor Critic method) / deepmind 的 Deep Deterministic Policy Gradients(DDPG) / 從 AC 到 A3C / Distributed Proximal Policy Optimization (DPPO)
四、Case Study :
1. AlphaGo原理講解
2. 問答推薦系統強化學習等
精彩課程、高手經驗、句句精華。(講師依學員實際狀況動態調整進度)