[人人能懂] 从潜在行动、结构化生成到奖励解耦

倍速播放下载节目

00:00

31:47

主播信息

爱可可爱生活

爱可可爱生活

Nice Day!

AI可可AI生活

229

来自 @爱可可-爱生活的第一手AI快报，用最简单易懂的语言，带你直击最前沿的人工智能科研动态。无论你是科技小白，还是行业达人，这里都有你想知道的AI故事和未来趋势。跟着我们，轻松解锁人工智能的无限可能！ #人工智能 #科技前沿

APP内查看主播

节目详情

我们总希望AI更像一个聪明的伙伴，而不是一个笨拙的机器。但怎样才算“聪明”？本期节目，我们将透过几篇最新的研究，一起窥探AI学习智慧的深层秘密。我们会聊到，AI如何像婴儿一样，在无声的世界里自己“悟”出万物的规律；又如何像个特工，在“聊天模式”和“任务模式”间无缝切换；我们还会探讨，如何用一把精妙的尺子，量出AI学到的究竟是“真本事”还是“假把式”，以及如何避免它在多重目标下“偏科”，甚至沦为一个只会讨好规则的“马屁精”。

00:00:39 AI学会了“无师自通”，世界将有什么不同？

00:06:21 给AI装上一个“万能遥控器”

00:12:57 AI上课也分“顿悟”和“补课”？一把尺子量出它学到了多少真本事

00:19:54 AI“偏科”怎么办？谈谈多目标奖励的艺术

00:25:33 “好学生”与“马屁精”，AI如何学会做个人

本期介绍的几篇论文：

[LG] Learning Latent Action World Models In The Wild

[FAIR at Meta]

https://arxiv.org/abs/2601.05230

---

[LG] XGrammar 2: Dynamic and Efficient Structured Generation Engine for Agentic LLMs

[Shanghai Jiao Tong University & CMU]

https://arxiv.org/abs/2601.04426

---

[LG] Excess Description Length of Learning Generalizable Predictors

[UC Berkeley & Anthropic]

https://arxiv.org/abs/2601.04728

---

[CL] GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

[NVIDIA]

https://arxiv.org/abs/2601.05242

---

[CL] Learning to Simulate Human Dialogue

[Stanford University]

https://arxiv.org/abs/2601.04436

展开

大家都在听

创新灯塔

欢迎来到“科技灯塔”，我们的播客致力于向你传递最新的国内外科技新闻和趋势。每天，我们都会搜集并整合全球各地的科技信息，力图提供最全面，最前沿的科技知识以滋养你的头脑。就像灯塔一样，我们的目标是引导你在这个快速发展的科技世界中找到方向，触摸未来，感知创新。我们不仅提供新闻，更希望通过每一条科技新闻，都能激发你对科技的热爱，对未知的探索，对创新的追求。让我们一起，在科技的海洋中，跟随“科技灯塔”向前航行！

星佳是个小人物

星佳是个小人物

用“星佳是个小人物”的笔名在互联网江湖用文字浪迹了几年，日积月累也码了几十万字，原创文章三百余篇。目前受邀入驻百度百家、今日头条、一点资讯、搜狐、腾讯媒体平台等自媒体平台，用一个90后的标准理工男跟文字死磕精神来证明星佳对于互联网的热爱和痴狂。欢迎大家直接关注，也可以加微信xingjia10086，微博@星佳是个小人物，为了让更多小白用户更好的应用互联网工具而努力。

杜仲生态文化——皇芈科普

杜仲生态文化——皇芈科普

杜仲孑遗植物，伴随人类经历了原始社会、农耕文明、工业文明及生态文明，用药2000多年，其全身都是宝。《杜仲产业绿皮书》、林业局下发产业规划、科研文献众多。记笔记费眼。尝试用蜻蜓，边看边读边录音边分享，检索方便可以回放听听，可以加深印象，随后找到原著再研读。

数码梦工厂

数码梦工厂

《数码梦工厂》为您打造最好听且零门槛，数码小白和女生都听得懂的节目！

元生讲《今日简史》

元生讲《今日简史》

人类命运大议题。《今日简史》是以色列新锐史学家尤瓦尔.赫拉利继《人类简史》《未来简史》之后的“简史三部曲”收官之作。作者以议题的形式讲述了人类今天面临的危机和困惑，或者在不久的将来要面临的生存难题。从科技颠覆、政治挑战、恐怖威胁以及教育困境等等各个方面，提出了人类至今无解的问题，面对信息技术和科技技术的高速发展，人类或许会和人工智能和解并合作，人类最重要面对我们被无足轻重的情绪困扰和生存的意义。在这本书中，作者依旧没有给出答案，但是提出了解决问题的思考和角度。元生从一位女性的角度为您讲《今日简史》，希望可以带来更多具有温度的关注和思考！

这就是物理

这就是物理

物理知识介绍

数据要素领导干部公开课

数据要素领导干部公开课

人民日报出版社初版《数据要素领导干部公开课》，主编杨涛。通过汇聚个人小数据集或小样本数据集形成大数据集，撬动社会更大范围便捷性的实现，切实提高人民群众的获得感幸福感。

ZealerChina

欢迎大家关注优酷频道：ZealerChina 淘宝店铺：zealerchina.taobao.com

AI科技前沿站

AI科技前沿站

欢迎收听《AI前沿站》，带你走进近年来炙手可热的人工智能世界。每期节目，我们将聚焦AI的最新动态、前沿技术与创新应用，邀请行业专家深入浅出地解读，从AI改变生活的点滴到推动行业变革的力量，全方位展现AI的魅力。同时，探讨AI在播客领域的应用，如内容生成、个性化推荐等，为你带来不一样的听觉盛宴。让我们一起探索AI的无限可能！

抖音电商运营赚钱零基础入门课程

抖音电商运营赚钱零基础入门课程

本视频适合学习人群：想通过抖音招商的加盟项目想通过抖音卖产品的电商、微商期望通过抖音做品牌宣传的的企业希望通过抖音往线下引流的实体店希望转型抖音的淘客、网赚从业人员手里没项目但希望通过抖音赚钱的普通人适合行业：美妆、美容、服饰、餐饮、美食、服务、教育、知识付费、水果、特产、生鲜、搞笑IP、装潢、淘客、网赚等。

评论(0条)

快来抢沙发吧！

打开蜻蜓查看更多

打开APP，高品质·离线听

沪ICP备06026464号-4 网络文化经营许可证

沪网文[2014]0587-137号

信息网络传播视听许可证：0911603

©2011-2019 qingting.fm ALL Rights Reserved.

应用名称：蜻蜓FM | 开发者：上海麦克风文化传媒有限公司

版本号：9.5.0 | 应用权限 | 隐私协议