EP 54. 深度对谈顶尖AI开源项目：大模型开源生态, Agent 与中国力量

倍速播放下载节目

00:00

03:19:06

节目详情

聊到生成式AI的发展，开源绝对是最关键的话题之一。这次的嘉宾，可以说涵盖了大模型开源领域最值得关注的公司：从顶流社区Huggingface, 到全球开源社区都关注的阿里通义千问 Qwen 大模型，堪称行业标准的 LLM 推理框架 vLLM, 还有最近最火的软件开发 agent 项目 OpenDevin. 真的是黄金阵容！

这一期节目也发布得很应景：就在今天凌晨，阿里发布了最新的通义千问 Qwen 系列模型！Qwen2-72B 的表现甚至全面超过 SOTA 的 Llama 3，大家赶紧去关注！

首先跟大家汇报一下，上周日我们在北京举办的 OnBoard! 第一次线下听友会真是超预期！开放报名4天就250多人报名，周日从上午9点到下午3点，从机器人到AI，创业投资和软件出海，100人的场地，直到最后都几乎座无虚席！真的是非常感谢大家的支持~我们正在努力整理精华文字稿，也请期待我们更多活动！

Hello World, who is OnBoard!?

回到这一期播客，我们将深入探讨大模型的开源生态。

在生成式AI飞速发展的一年多时间里，开源无疑是一个不可忽视的话题。开源模型的迅猛发展，从 Meta 的 Llama 3 到 Mistral 的最新模型，它们对闭源大模型如 GPT4 的追赶，不仅令人惊艳，更加速了 AI 场景下产品的实际应用。而围绕大模型的生态系统，从推理加速到开发工具，再到智能代理，技术栈的丰富程度，虽然已经孕育出了像 Langchain 这样的领军企业，但这一切似乎只是冰山一角。

特别值得一提的是，随着阿里千问系列、Deepseek、以及 Yi 等中国团队主导的模型在国际舞台上崭露头角，我们不禁思考，除了模仿和追赶，中国在大模型领域的发展是否还有更多值得我们关注和自豪的成就。

今天，Monica 有幸邀请到了几位极具代表性的重磅嘉宾，来自 Huggingface 的开源老兵，有通义千问 Qwen 的开源负责人（他也是 Agent 领域最受关注的项目 OpenDevin 核心成员），还有最具国际影响力的开源项目 vLLM 主导人。真是涵盖了大模型开源生态的各个领域的最一线视角！

嘉宾们都太宝藏了，我们的话题延伸到大模型的各个方面，录了近4个小时！我们前半部分聊了很多infra的创新，以及最近很火的、以OpenDevin 为代表的软件开发agent 背后的技术和生态等话题。下半部分，我们回到大模型开源的主题，畅谈了：

底层基础大模型的开源闭源生态，未来可能有怎样的演进？
开源模型商业化跟过去我们在大数据时代看到的databricks 之类开源商业模式有哪些异同？
如何做一个有国际影响力的开源项目？

还有数据、评测等等大模型领域的核心话题，真的非常全面，又不失一线从业者的深度。

索性就不分成两部分了，大家可以对着 show notes 里面的时间戳，直接跳转到你感兴趣的话题（虽然我觉得每个话题都很好！）

介绍了这么多，还要声明一下，节目里面重点聊到的开源社区 Huggingface，还有几个开源的项目，包括阿里千问、OpenDevin, Deepseek, 零一万物的 Yi，vLLM 等，都没有收取任何广告，完全是嘉宾走心分享，全程无广！当然，如果你们或者其他AI公司考虑赞助一下我们用爱发电的播客，我们当然也是欢迎的！

三小时硬核马拉松开始，enjoy!

嘉宾介绍

Tiezhen Wang, Huggingface 工程师，他可以说是中国与世界开源 AI 生态的桥梁，更是从 Google TensorFlow 时代到 Huggingface 早期员工，对中国和世界的开源 AI 生态都有极深的洞察。
Junyang Lin, 通义千问开源负责人，作为 Qwen 在全球开源社区的主要代言人，他不仅见证了开源的发展历程，还是目前备受瞩目的 Agent 开源项目 OpenDevin 的核心团队成员。
李卓翰，UC Berkeley PhD，他所主导的项目更是大名鼎鼎，就是已经成为行业标准的大模型推理框架 vLLM！他所在的 Sky Lab 被誉为开源基础设施的摇篮，从估值百亿美元的 Databricks 到 Anyscale（开源计算框架 Ray 的商业化公司）。他还深度参与了 Chat Arena, Vicuna 等多个国际知名开源项目，对大模型周边生态和 infra 的不仅有国际一线经验，更是有很多有技术理想的干货！
OnBoard! 主持：Monica：美元VC投资人，前 AWS 硅谷团队+ AI 创业公司打工人，公众号M小姐研习录 (ID: MissMStudy) 主理人 | 即刻：莫妮卡同学

我们都聊了什么

05:28 嘉宾自我介绍，有意思的开源 AI 项目

18:37 vLLM 如何开始的，如何成为全球顶尖项目，为什么我们需要一个大模型推理框架？

30:24 Agent framework: OpenDevin 这样的负责 agent 会带来怎样的推理挑战？

40:37 做好一个编程 Agent，还需要哪些新的工具？多模态会带来怎样的变化？

56:16 我们需要怎样的 Agent Framework？为什么最适合开源社区来做？Framework 会收敛吗？

67:46 什么是 Crew AI? 如何看待 Multi-agent 架构？

73:11 借鉴前端框架的发展历史，如何理解一个框架如何成为行业标准？

77:54 Huggingface 上开源LLM现状，过去一年多有哪些重要进展？有哪些不同的开源方式？泽娜要给你看待一个开源模型的流行程度？

94:27 如何理解不同架构的开源大模型生态？Qwen 如何通过架构演进打造更好的开源生态？

104:59 中国的大模型开源项目有哪些创新？大模型架构有哪些变化？

112:17 为什么说新的模型架构可能会带来商业化的新机会？我们能从以前的开源商业化中学到什么？

119:22 我们看到现有大模型架构的天花板了吗？什么是一个新的架构？

128:03 Zhuohan 从参与最早的开源 LLM 之一 Vicuna 的经历学到什么？学术界和业界在大模型生态上如何分工？

140:48 用于大模型的数据集领域有哪些值得关注的进展？

149:42 Mistral 为什么这么快爆火？打造一流国际开源项目有什么可借鉴的经验？vLLM 有什么道和术上的心得？

166:13 Chatbot Arena 是如何开始的？为什么模型的评测那么重要？还有哪些挑战和可能的进展？

180:49 Zhuohan 对于 vLLM 商业化方式有什么思考？未来推理成本还有哪些下降空间？

188:17 快问快答：过去一年生成式AI发展有什么超出预期和不及预期的地方？未来还有什么值得期待？

我们提到的公司和重点名词

Qwen, Qwen-2
OpenDevin: opendevin.github.io
vLLM: github.com
Yi (Github), 零一万物
Chatbot Arena: huggingface.co
AutoGPT: github.com
crew AI: www.crewai.com
autoAWQ: github.com
LLM.c: github.com
Flash attention: github.com
Continuous batching：一种数据处理技术，用于将连续的数据流分批处理，以提高效率和可扩展性。
KV cache：键值对缓存，一种存储结构，通过键快速访问数据值，常用于提高数据检索速度。
Page attention：页面注意力机制，一种在处理长文本时，使模型集中注意力于当前页面或段落的技术。
Quantization：量化，将数据表示的精度降低到更少的比特数，以减少模型大小和提高计算效率。
Direct Preference Optimization (DPO): Your Language Model is Secretly a Reward Model
Google Gemini: deepmind.google
Adept: www.adept.ai
MetaGPT: github.com
Dolphinan open-source and uncensored, and commercially licensed dataset and series of instruct-tuned language models based on Microsoft's Orca paper
Common crawl: commoncrawl.org

参考文章

欢迎关注M小姐的微信公众号，了解更多中美软件、AI与创业投资的干货内容！

M小姐研习录 (ID: MissMStudy)

欢迎在评论区留下你的思考，与听友们互动。喜欢 OnBoard! 的话，也可以点击打赏，请我们喝一杯咖啡！如果你用 Apple Podcasts 收听，也请给我们一个五星好评，这对我们非常重要。

最后！快来加入Onboard！听友群，结识到高质量的听友们，我们还会组织线下主题聚会，开放实时旁听播客录制，嘉宾互动等新的尝试。添加任意一位小助手微信，onboard666, 或者 Nine_tunes,小助手会拉你进群。期待你来！

展开

大家都在听

泰度Voice

来自最前沿的声音，助你洞察先机。我们定期邀请来自华泰证券的分析师、投行专家、投资人、技术专家，与您共同探索真正的长期价值。

oh!my ga

oh!my ga是一档由gaga出品的谈话类播客。每期邀请生活有料、品味有趣的朋友做客，通过不一样的生活方式故事、有趣的观点输出，犀利的行业观察，为你带来【品质、品味的城市生活方式】灵感加餐。就像gaga门店一样，oh!myga没有“目的性”和“正襟危坐的大餐”，“不知道去哪的时候去gaga“---不知道听什么的时候听oh!my ga。 All Day Chill, 我们秉持全时段享乐主义的生活原则, 现在就放松下来，和我们一起喝喝果茶、聊聊天。

101个心理治疗难题书本内容与讨论

101个心理治疗难题书本内容与讨论

天南地北几位咨询师一起读书，探索《101个心理治疗难题》的奥秘。一念：国家二级心理咨询师、国家社会工作师观心空间儿童青少年专职心理咨询师；映雪：国家二级心理咨询师心理评估师；裘建萍：精神科主任医师，国家二级心理咨询师，中级心理治疗师；阿华田；卓玛：应用心理学硕士在读；

OA智能办公

主持人KK和CC讨论了连锁企业在管理上的挑战，并特别强调了OA办公系统在解决这些挑战中的作用。分析传统办公的局限性，并探讨了如企业微信、钉钉和飞书等新型智能化OA办公软件如何帮助企业提高效率、改善沟通并优化管理流程。

BraveNewWorld（美丽新世界）

BraveNewWorld（美丽新世界）

朗读清晰，语速适中，让你从声音中领略名著的魅力!

敏捷式供应

敏捷式供应

"VUCA时代已经来临，客户的需求变得越来越多样化、个性化，企业要么选择退出市场，要么适应这种新的需求特点。由于行业还没有完全洗牌，使得规模较大的企业暂时还能存活下来，但代价和风险是巨大的。因为供应链管理模式没有升级，只能多备库存来应对多样化、交期短的需求。高位运行的库存水平，使得企业资金成本和经营风险很大，虽然账面上还能勉强盈利，但老板个个都心惊胆战，纷纷犹豫是否退出市场。有远见、有实力的企业认识到问题所在，会致力于升级转型，如引入外部咨询机构完善管理体系、导入较先进的信息系统等，让企业变得更加敏捷，能够以较小的成本应对新的市场需求。这种敏捷化转型很痛苦，但这是在行业里生存下去的*办法，否则只有等着被市场淘汰。敏捷式供应并没有大家想象中那么“高大上”，它还是以精益生产和供应链管理为基础，加入了敏捷式运作的时代新要求，使企业能够更好地适应多样化、个性化的市场需求。很多企业其实也在努力适应新的局面，只不过在惯性思维和短期利益面前，很难坚定地走下去。希望通过本书的观点和案例分享，能够坚定企业敏捷转型的决心，以全新的姿态拥抱市场新变化。零牌顾问机构一直在践行“智力兴企、产业报国”的使命，与致力于提升自身竞争力的企业共勉前行！"

趣味英语词根-初中第2季

趣味英语词根-初中第2季

“最强大脑”的图像记忆法+“事半功倍”的英语词根词缀，本专辑有以下特点： 1.中学生也能听懂的词根课程，与教材基本同步 2. 结合图像记忆法，给字母赋予形象，让背单词更有乐趣 3. 词根学习事半功倍，从小打好基础意义深远 4.参考了众多课程，汲取精华、博采众长 5.零基础英语词根同样适合成年人收听，可作为亲子课程 6.主播音色甜美、中英双语发音标准、亲和力强掌握英语词根记忆法，学单词越背越快！

解透教材-课文同步听人教PEP英语四下

解透教材-课文同步听人教PEP英语四下

课程介绍：本册内容主要学习用英语，介绍自己的学校，包括学校里的物品、设施，描述其位置；询问时间，并描述即将要做某事的时间，培养时间观念；能询问和描述天气状况，关心日常天气变化；能介绍各种农场动物和蔬菜，并描述其特点；能简单介绍衣着；能以得体的方式与人交流，描述物品并询问商品的价格。词句目标方面，一起学习听、说、认读词汇共94个，语句44个，以及常用字母组合在单词中的发音规则；语法目标方面，会了解特殊疑问句结构，含有情态动词can、be动词开头的一般疑问句结构。课程亮点： 1. 真人老师全程语音辅导，多角度解透教材，帮助学员有效学习，对学习者有更亲切的学习体验； 2. 通过对知识点的回顾，当天知识点的重难疑点归纳总结、作业习题讲解、下次辅导的学习目标，进行科学有效辅导，提升学习者自主学习能力； 3. 领读词汇、词组、课文，讲解重点语法，提升听说读写的英语应用能力。适用人群：对英语感兴趣的学员

新共赢生态：政信金融投资指南

新共赢生态：政信金融投资指南

本书基于信用理论和政信实务，提出了“政信金融”的概念和体系框架，具有较强的前瞻性和较大的创新性。本书具有信息量大、涵盖面广、专业性强、理论与实践密切结合等特征，适用于政信金融领域的一线从业人员、政府相关部门和机构、专业研究人员以及其他对政信金融领域感兴趣的人士参考借鉴。

宋德伟：突破雅思A类核心词汇

宋德伟：突破雅思A类核心词汇

宋德伟老师独创了“七道魔音背单词法则”——包括单词的“初次记忆”、“及时巩固”、“双词循环”、“四词循环”、“八词循环”、“整体循环”和“边听边译”七道流程。七道魔音的核心和精髓：将“学习内容”、“学习方法”、“学习过程”和“学习计划”巧妙融合，高度统一，打造易学、实用、高效的学习模式。通过这七道流程的多重刺激（分别学习和复习7遍），单词会在大脑中留下一个深刻的印象

评论(0条)

快来抢沙发吧！

打开蜻蜓查看更多

打开APP，高品质·离线听

沪ICP备06026464号-4 网络文化经营许可证

沪网文[2014]0587-137号

信息网络传播视听许可证：0911603

©2011-2019 qingting.fm ALL Rights Reserved.

应用名称：蜻蜓FM | 开发者：上海麦克风文化传媒有限公司

版本号：9.5.0 | 应用权限 | 隐私协议