廣宣學堂為您推出機器學習系列之 強化學習系列
近年來人工智慧的興起,AlphaGo 打敗棋王事件是一大關鍵,能夠對複雜的決策進行推估與修正,是人工智慧一個非常重要的關鍵技術。不管是 AlphaGo、自駕車系統、金融決策、推薦系統、甚至讓 AI 自己打遊戲 ,都少不了決策的關鍵能力。
強化學習 (Reinforcement Learning) 不但具備了類似人類的決策要素,也內含了人類在學習中的摸索過程。包含最佳策略(Policy)的計算、獎勵機制(Reward)的建立、能夠根據經驗擁有檢討過去、推演未來的行為特質。這幾年來,強化學習已經深入各種層面的決策應用,成為當今人工智慧開發的關鍵技能。
廣宣學堂特別邀請人工智慧領域知名,擁有豐富研究經歷、與具跨國業界資歷的講師,用其功力以精華、高效方式,帶領您能夠一次綜覽強化學習的各個重要議題與內容,並配合實作,讓學習更有感覺。絕對精采與值得一聽。把最好的投資,投資在自己身上,讓自己在專業勝人一籌 !
課程內容:
名師高品質教學、詳細研究、深入實作
一. 強化學習概論
環境因素與智慧代理人 / 策略與規劃(Policy and Planning) / 價值函數(Value Function) / 運作模型介紹 / 獎勵與懲罰機制 /最佳價值函數 /馬可夫決策問題(MDP)
二、深入強化學習
有限馬可夫決策處理(FMDP) / 動態規劃 / 蒙地卡羅方法(Monte Carlo Method) / 時間差分學習 / Q學習(Q-Learning) / 策略梯度法(Policy Gradient Method)
三、 深度強化學習
深度Q學習網路(DQN) / 演員評判家方法 (Actor Critic method) / deepmind 的 Deep Deterministic Policy Gradients(DDPG) / 從 AC 到 A3C / Distributed Proximal Policy Optimization (DPPO)
四、Case Study :
1. AlphaGo原理講解
2. 問答推薦系統強化學習等
六小時精彩扼要課程、高手經驗、句句精華。(講師依學員實際狀況動態調整進度)