Name: 強化學習研究 : 決策人工智慧超技能
Start: 2018-12-08T09:30:00.000+08:00
End: 2018-12-08T09:30:00.000+08:00
Location: 台北市中山區松江路131號2F-1 (2樓教室)

廣宣學堂為您推出機器學習系列之強化學習系列

近年來人工智慧的興起，AlphaGo 打敗棋王事件是一大關鍵，能夠對複雜的決策進行推估與修正，是人工智慧一個非常重要的關鍵技術。不管是 AlphaGo、自駕車系統、金融決策、推薦系統、甚至讓 AI 自己打遊戲，都少不了決策的關鍵能力。

強化學習 (Reinforcement Learning) 不但具備了類似人類的決策要素，也內含了人類在學習中的摸索過程。包含最佳策略(Policy)的計算、獎勵機制(Reward)的建立、能夠根據經驗擁有檢討過去、推演未來的行為特質。這幾年來，強化學習已經深入各種層面的決策應用，成為當今人工智慧開發的關鍵技能。

廣宣學堂特別邀請人工智慧領域知名，擁有豐富研究經歷、與具跨國業界資歷的講師，用其功力以精華、高效方式，帶領您能夠一次綜覽強化學習的各個重要議題與內容，並配合實作，讓學習更有感覺。絕對精采與值得一聽。把最好的投資，投資在自己身上，讓自己在專業勝人一籌 !

課程內容:

名師高品質教學、詳細研究、深入實作

一. 強化學習概論

環境因素與智慧代理人 / 策略與規劃(Policy and Planning) / 價值函數(Value Function) / 運作模型介紹 / 獎勵與懲罰機制 /最佳價值函數 /馬可夫決策問題(MDP)

二、深入強化學習

有限馬可夫決策處理(FMDP) / 動態規劃 / 蒙地卡羅方法(Monte Carlo Method) / 時間差分學習 / Q學習(Q-Learning) / 策略梯度法(Policy Gradient Method)

三、深度強化學習

深度Q學習網路(DQN) / 演員評判家方法 (Actor Critic method) / deepmind 的 Deep Deterministic Policy Gradients(DDPG) / 從 AC 到 A3C / Distributed Proximal Policy Optimization (DPPO)

四、Case Study :

1. AlphaGo原理講解

2. 問答推薦系統強化學習等

六小時精彩扼要課程、高手經驗、句句精華。（講師依學員實際狀況動態調整進度）

一般票 $3980 (熱賣中)

團體票 $2980 (兩人同行、限額划算價)

課程提醒

1.主辦單位得依報名人數狀況調整時間。

2.預計時段: 9:30~12:30 / 14:00~17:00 (準時開始，時段以當場狀況為準，中午自行用餐)。

3.自備筆電，建議充足電池。

4.為尊重智慧財產權，現場不開放錄音錄影，敬請配合。

5.課程十天內除天災、主辦單位異動外，恕不接受退費。

ゼミナール

チケット種別	販売期間	価格
一般票	2018/11/26 13:31(+0800) ~ 2018/12/05 23:59(+0800) 販売終了	TWD$3,980
團體票 (限額額滿即止)	2018/11/01 00:00(+0800) ~ 2018/12/05 23:59(+0800) 販売終了	TWD$2,980

強化學習研究 : 決策人工智慧超技能

イベントチケット