跳转到内容

理查德·S·薩頓

本页使用了标题或全文手工转换
维基百科,自由的百科全书
理查德·S·萨顿
Richard S. Sutton

FRS FRSC
2021年
出生1957/1958年(67—68岁)
美國俄亥俄州
公民权加拿大
教育程度史丹佛大學
马萨诸塞大学阿默斯特分校
知名于时序差分学习, Dyna, Options, GQ(λ)
奖项人工智能促进协会会士(2001年)
国际神经网络学会会长奖(2003年)
加拿大皇家學會会士(2016年)
图灵奖(2025年)
网站incompleteideas.net
科学生涯
研究领域人工智能
强化学习
机构阿爾伯塔大學
论文Temporal credit assignment in reinforcement learning(1984)
博士導師安德魯·巴托
博士生大衛·席爾瓦
多伊娜·普雷祖普英语Doina Precup

理查德·S·薩頓(英語:Richard S. Sutton FRS FRSC,1957/1958年 - ),加拿大電腦科學家阿爾伯塔大學计算机科学系教授、Keen Technologies研究科学家[1],被认为是现代计算机强化学习领域的奠基人[2],对该领域有诸多突出贡献,包括时序差分学习策略梯度算法英语Policy gradient method[3]

2025年,他与安德魯·巴托共同获得图灵奖[4][5]

参考资料

[编辑]
  1. ^ John Carmack and Rich Sutton partner to accelerate development of Artificial General Intelligence. markets.businessinsider.com. [2023-10-02] (英语). 
  2. ^ Exclusive: Interview with Rich Sutton, the Father of Reinforcement Learning. 2018-01-11 [2018-12-17]. (原始内容存档于2018-01-11). 
  3. ^ Piatetsky, Gregory. Exclusive: Interview with Rich Sutton, the Father of Reinforcement Learning. KDnuggets. 2017-12-05 [2024-02-10] (美国英语). 
  4. ^ Turing Awardees – Directorate for Computer and Information Science and Engineering (CISE). National Science Foundation. 2025-03-05 [2025-03-08] (英语). 
  5. ^ Turing Award Goes to 2 Pioneers of Artificial Intelligence. The New York Times. 2025-03-05 [2025-03-21] (英语). 

外部链接

[编辑]