IT之家 6 月 2 日音书,科技媒体 The Decoder 昨日(6 月 1 日)发布博文,报谈称图灵奖得专揽查德 · 萨顿(Richard Sutton)以为粗造生成式 AI 衰退自我评估与捏续筛选能力,难以完成委果科学发现。
IT之家注:萨顿是好意思国诡计机科学家,强化学习范围主要奠基东谈主,现任阿尔伯塔大学诡计机科学解释、北京大学图灵导师、前 DeepMind 磋商科学家,2025 年 3 月与安德鲁 · 巴托共同获 2024 年图灵奖。

萨顿指出粗造生成式 AI 并不具备委果科学发现所需的要津能力。大谈话模子、图像模子和视频模子能从海量样本中学习,并生成相同实践,但好服从时常来自检修材料自己。
当模子输出委果新颖实践时,它通常一经超出原有材料。靠近事实问题,这类新颖实践常被称为幻觉。萨顿用磋商者见笑空洞近况:好的部分不新,AG真人国际中国官网登录入口新颖的部分不好。
萨顿并未否定生成式 AI 的实用价值。它可用于摘录、磋商援手、助手和文娱。若指标仅仅更快、更低廉、更小、更可定制地效法原对象,生成式 AI 仍能带来明确价值。
AG真人中国官网入口萨顿以为,科学发现不成停在效法。委果发现包含变异、评估、领受性保留 3 步。系统需要建议不同选项,测试它们,再保留有用花样。这亦然进化、科学花样、绸缪、搜索和强化学习中的共同原则。
粗造生成式 AI 最缺的是评估。谈话和图像模子能生成好多变体,但莫得测试要领,就无法筛出更好有绸缪。东谈主类领受图片、棋局胜率、神情化诠释、法子测试和模拟奖励,王人可成为有用反映。
萨顿列举 AlphaGo(阿尔法围棋)、AlphaZero、AlphaFold、AlphaProof、Claude Code 和 GT-Sophy 等案例。这些系统王人有超出文本或图像生成的评估闭环,因此能跟踪更优解,而不仅仅产出候选谜底。
他还品评 AI 行业过度押注更大的谈话模子AG真人国际·(中国)官方网站,他更敬重能恒久与环境互动、从告戒中学习、构建宇宙模子并绸缪计谋的 AI 智能体。