Name: 機器決策技能 : 強化學習概論
Start: 2019-09-21T09:30:00.000+08:00
End: 2019-09-21T09:30:00.000+08:00
Location: 台北市中山區松江路131號(2樓教室)

廣宣學堂為您推出機器學習系列之 強化學習系列

強化學習 (Reinforcement Learning) 是一個有趣而充滿潛力的領域，其演算法具備了類似人類的決策要素，也內含了人類在學習中的摸索過程，能計算最佳策略、能建立獎勵機制、能根據已存有的經驗檢討過去、推演未來。近年來日益火紅，強化學習已經在各種決策應用有很突出的表現 (如 Deepmind 最火紅的 AlphaCraft、以及過去很成功的 AlphaGo)，目前是人工智慧一個受人矚目而且充滿潛力的領域。

廣宣學堂特約講師為在人工智慧領域擁有堅實理論背景、又在國外知名數據公司擁有實戰經驗的洪博士，以精華、高效方式，帶領您一次跨入強化學習的各個重要議題與內容，並且配合實作，讓學習更有收穫。投資自己的競爭力，在專業上多人一步、勝人一籌 !

課程內容:

六小時名師高品質教學、詳細研究、精華一次吸收

9/21 (六) 9:30~12:30 / 13:30~16:30 (準時開始，時段以當場狀況為準，中午自行用餐)

一. 強化學習概論

環境因素與智慧代理人 / 策略與規劃(Policy and Planning) / 價值函數(Value Function) / 運作模型介紹 / 獎勵與懲罰機制 /最佳價值函數 /馬可夫決策問題(MDP)

二、深入強化學習

有限馬可夫決策處理(FMDP) / 動態規劃 / 蒙地卡羅方法(Monte Carlo Method) / 時間差分學習 / Q學習(Q-Learning) / 策略梯度法(Policy Gradient Method)

三、深度強化學習

深度Q學習網路(DQN) / 演員評判家方法 (Actor Critic method) / deepmind 的 Deep Deterministic Policy Gradients(DDPG) / 從 AC 到 A3C / Distributed Proximal Policy Optimization (DPPO)

四、Case Study :

1. AlphaGo原理講解

2. 問答推薦系統強化學習等

精彩課程、高手經驗、句句精華。（講師依學員實際狀況動態調整進度）

一般價：3980 (熱賣中）

團報價：2980

課程提醒

1.主辦單位得依報名人數狀況調整時間。

2.預計時段: 9:30~12:30 / 13:30~16:30 (準時開始，時段以當場狀況為準，中午自行用餐)。

3.自備筆電，建議充足電池。

4.為尊重智慧財產權，現場不開放錄音錄影，敬請配合。

5.課程開始前十天內除天災、主辦單位異動外，恕不接受退費。

票種	販售時間	售價
一般票	2019/09/09 13:31(+0800) ~ 2019/09/18 23:59(+0800) 結束販售	TWD$3,980
團體票	2019/08/20 00:00(+0800) ~ 2019/09/18 23:59(+0800) 結束販售	TWD$2,980

機器決策技能 : 強化學習概論

活動票券