76. 王小川返场谈o1与强化学习：摸到了一条从快思考走向慢思考的路

倍速播放下载节目

00:00

39:05

节目详情

在过去两集节目中，关于OpenAI o1和AGI范式转移，我们先是推出了一集预言，之后推出了一集解析。在一个新范式来临的临界点上，我们希望听到更多来自业界不同视角的声音。哪怕这些声音是切片的、冲突的，我们都希望当做一种记忆和留存收集起来。

今天这期是王小川的返场。

王小川在创业开始就关注到强化学习并且很早开始公开谈论。他曾说，大模型代表快思考，它叫“学”；强化学习是慢思考，它叫“思”。“学”和“思”两个系统最终会走向融合。除了o1，王小川也聊了聊强化学习在一个特定场景——医疗——中的应用。

我们的播客节目在腾讯新闻首发，大家可以前往关注哦，这样可以第一时间获取节目信息和更多新闻资讯：）

01:30 大模型是“学而不思则罔”，强化学习是“思而不学则殆”
03:45 Sam Altman被宫斗下课与强化学习大神Noam Brown的动态
05:45 OpenAI o1是范式升级，摸到了一条从快思考走向慢思考的道路
（DIKW模型：Data – Information – Knowledge – Wisdom）
08:18 怎么看o1隐藏思维过程，有人破解o1思维链会被警告要封号？
09:04 从以语言为核心走向思维链，分两阶段运行增加泛化性
11:38 强化学习 vs 监督学习
16:39 除了数学和代码以外，医疗是可以用强化学习提升的领域
19:55 之前做强化学习实验没有CoT（思维链），今天更强调CoT了
22:16 复现o1 vs 复现GPT-4
26:30 未来几年将从强化学习范式走向写代码解决问题新范式
28:35 做“水涨船高的应用”，不只是“沿途下蛋的应用”
31:35 创业公司要走出大厂射程，在射程内你是没什么好活的

【更多信息】

联络我们：微博@张小珺-Benita，小红书@张小珺jùn

更多信息欢迎关注公众号：张小珺

展开

大家都在听

消费圈内人

消费圈内人

消费圈内人

苗师傅·天真与经验

苗师傅·天真与经验

苗师傅·天真与经验

oh!my ga

oh!my ga是一档由gaga出品的谈话类播客。每期邀请生活有料、品味有趣的朋友做客，通过不一样的生活方式故事、有趣的观点输出，犀利的行业观察，为你带来【品质、品味的城市生活方式】灵感加餐。就像gaga门店一样，oh!myga没有“目的性”和“正襟危坐的大餐”，“不知道去哪的时候去gaga“---不知道听什么的时候听oh!my ga。 All Day Chill, 我们秉持全时段享乐主义的生活原则, 现在就放松下来，和我们一起喝喝果茶、聊聊天。

美妆内行人

美妆内行人

全网第一档垂直于美妆行业的商业播客希望能为每位喜欢美妆行业的你带来价值记得点击「订阅」这样就不会错过每期更新啦~❤️ ————————— 从品牌、研发、营销、渠道到彩妆、护肤、体护、美发与Beauty产业相关的每个环节，都有深谙其道的“内行人” 我们希望邀请这些内行人作为嘉宾，以他们的视角聊聊美妆这个品牌化程度最高且充满创新的行业相信这会是这个时代商业的缩影也有幸与每位听众一起见证中国美妆品牌的成长 ————————— ?想跟我们主播和嘉宾深入交流的朋友 ??欢迎添加小助理vx进群: BeyondPod2024 ?记得备注：美妆 ?我们可能是全平台福利最好的社群哟~ ————————— 【主播】艾勇 - Beyondpod发起人，映天下CEO 寒笑 - 用过1000+款护肤品的美妆品牌公关

咖啡 OR TEA

「咖啡 OR TEA」是一档杂谈类成长型播客。每两周更新一期，上线时间为周五晚8点。主播沈夏夏和张哈哈是两个认识多年的老友，坐标天津。希望通过这档播客把天津人的快乐音符传递给你。真诚表达，用心交流是我们的主旋律；结识志趣相投的朋友是我们的小确幸。在这里，我们每期都会围绕着一个主题，分享经历、谈论观点、展开辩论。愿我们的进步，有你的参与！感谢聆听「咖啡 OR TEA」，在忙碌的日子里，不要忘记，多喝热水！

日常建筑学 | 这就是创新！

日常建筑学 | 这就是创新！

用创意拓展边界，用行动改变未来。《这就是创新！》是一档创意实战的播客，由日常建筑学出品，由郑宝宝（数字产业专家）和黄沛（设计媒体人）共同发起，持续关注小众品牌和设计工作室的成长，每期都会邀请一位嘉宾来讲述创新背后的故事。

涟漪效应

《涟漪效应》是一档热点话题播客，由澎湃人物和镜相栏目联合出品。新闻背后的故事，热点之外的冷思考，打开可能，通往更大的世界。

商业WHY酱

全新一季的「商业WHY酱」，邀请充满好奇心和对商业故事感兴趣的你一起，继续跟随 36 氪主编杨轩的视角，观察充满变化的 2022 年，会有什么重大商业节点，背后又有怎样的逻辑和故事。身在变局中的我们，又该如何去理解和把握新经济的变迁，以及人与商业的关系？本节目由声动活泼制作播出。

综合立体主义

综合立体主义

这是两个90后设计师创立的播客，重在表达

文旅圈内人

文旅圈内人

平台首档专注文旅赛道的商业类播客文旅行业是一个边界很模糊的行业，衣食住行，吃喝玩乐，皆可文旅！因此，文旅也成了信息差最大的行业之一，无论是对消费者，甚至是从业者！在这档节目中，我们邀请泛文旅圈内各个领域的资深从业者，一起分享和探讨他们的行业观察，经验技巧。打破行业信息差，分享优质旅行资讯、圈内信息；以业内人的视角，洞察热点新闻，探讨人文新知。「本节目适合的人群」 1、文旅创业者 2、文旅职场资深打工人 3、刚涉足或准备涉足文旅行业的初创团队「主持人」 Robin，14年专注于文旅行业的猎头老兵，始终保持对人的好奇，从业生涯与超过30,000名泛文旅圈中高端从业者进行过深入交流 Hiei黑黑，沉浸式体验设计专家，2010年起先后参与并主持了100余场室内外实景体验项目的创作与落地，致力于让各种场景“好玩”起来～

评论(0条)

快来抢沙发吧！

打开蜻蜓查看更多

打开APP，高品质·离线听

沪ICP备06026464号-4 网络文化经营许可证

沪网文[2014]0587-137号

信息网络传播视听许可证：0911603

©2011-2019 qingting.fm ALL Rights Reserved.

应用名称：蜻蜓FM | 开发者：上海麦克风文化传媒有限公司

版本号：9.5.0 | 应用权限 | 隐私协议