跳至內容

理查·S·薩頓

本頁使用了標題或全文手工轉換
維基百科,自由的百科全書
理查·S·薩頓
Richard S. Sutton

FRS FRSC
2021年
出生1957/1958年(67—68歲)
美國俄亥俄州
公民權加拿大
教育程度史丹佛大學
麻薩諸塞大學阿默斯特分校
知名於時序差分學習, Dyna, Options, GQ(λ)
獎項人工智慧促進協會會士(2001年)
國際神經網路學會會長獎(2003年)
加拿大皇家學會會士(2016年)
圖靈獎(2025年)
網站incompleteideas.net
科學生涯
研究領域人工智慧
強化學習
機構阿爾伯塔大學
論文Temporal credit assignment in reinforcement learning(1984)
博士導師安德魯·巴托
博士生大衛·席爾瓦
多伊娜·普雷祖普英語Doina Precup

理查·S·薩頓(英語:Richard S. Sutton FRS FRSC,1957/1958年 - ),加拿大電腦科學家阿爾伯塔大學電腦科學系教授、Keen Technologies研究科學家[1],被認為是現代電腦強化學習領域的奠基人[2],對該領域有諸多突出貢獻,包括時序差分學習策略梯度演算法英語Policy gradient method[3]

2025年,他與安德魯·巴托共同獲得圖靈獎[4][5]

參考資料

[編輯]
  1. ^ John Carmack and Rich Sutton partner to accelerate development of Artificial General Intelligence. markets.businessinsider.com. [2023-10-02] (英語). 
  2. ^ Exclusive: Interview with Rich Sutton, the Father of Reinforcement Learning. 2018-01-11 [2018-12-17]. (原始內容存檔於2018-01-11). 
  3. ^ Piatetsky, Gregory. Exclusive: Interview with Rich Sutton, the Father of Reinforcement Learning. KDnuggets. 2017-12-05 [2024-02-10] (美國英語). 
  4. ^ Turing Awardees – Directorate for Computer and Information Science and Engineering (CISE). National Science Foundation. 2025-03-05 [2025-03-08] (英語). 
  5. ^ Turing Award Goes to 2 Pioneers of Artificial Intelligence. The New York Times. 2025-03-05 [2025-03-21] (英語). 

外部連結

[編輯]