S3.对谈spike|管你百度、阿里开源闭源,谁家大模型能帮我挣钱?

00:00
38:37
主播信息
信号&噪声

信号&噪声

人人都是蜻蜓主播,欢迎关注信号&噪声
关注
信号&噪声
15
在高流动性的噪声世界,屏蔽生活中的噪声,找到你生命中的信号。 这是一档分享前沿的产品、技术和思考的泛科技播客。从作战一线的投资和产品视角,希望通过准确、长期、系统的追踪科技,与科技爱好者、创业者、投资人一起探索新变化,启发新可能。 信号&噪声是资深投资人杨刚、徐奕联合圣冰发起,有超过十多年出海、硬科技产品、AI、新能源的投资、战略、产品和营销经验,一起思考事物本质,回归真实生活。 微博/小红书/抖音/公众号/B站:@信号&噪声
信号&噪声
17
这是一档分享前沿的产品、技术和思考的泛科技播客。从作战一线的投资和产品视角,希望通过准确、长期、系统的追踪科技,与科技爱好者、创业者、投资人一起探索新变化,启发新可能。
APP内查看主播
节目详情

这期聊大模型的开源和闭源,听起来有点技术宅的话题,其实是未来科技圈的大热门。请来了投资界的Spike,一起探讨了开源大模型是不是真那么“开放”,以及Meta为啥要开源它的LLAMA模型。还八卦了一下阿里和字节,他们是怎么在这个开源和闭源的游戏中找到自己的赚钱路子。

最后,我们还聊了聊国内大模型社区的热闹事儿,以及那些想在AI领域大展拳脚的创业公司们。这期节目,就是想带你一探究竟,在AI的世界里,开源和闭源到底怎么玩。

本期涉及专业词汇较多,可提前看shownote食用。

🎙 主播团队

嘉宾 Spike:一个对大模型技术充满热情的早期投资人。

Patric:身兼多职的投资界工作者,热爱智能硬件和小家电。

Eric:硬核博士,投资世界的探索者和挑战者。

圣冰:前华为、特斯拉等科技大厂员工,出海、硬科技长期顾问。

⌛️ 内容索引

  • 00:03 开场与嘉宾介绍
  • 00:26 Spike分享投资视角下的开源闭源重要性
  • 01:05 讨论开源闭源对商业模式的影响
  • 02:49 传统软件开源与大模型开源的区别
  • 04:16 业界对开源大模型的真实性和透明度的讨论
  • 05:54 判断模型开源的标准
  • 07:54 从使用角度讨论开源与闭源的安全感
  • 10:33 论文发布与模型透明度的关系
  • 11:50 影响公司开源决策的因素
  • 13:40 Meta开源策略的背后逻辑
  • 15:10 开源是否能成为行业标准
  • 18:04 技术进步的可持续性问题
  • 20:04 OpenAI的免费策略与商业策略
  • 21:19 大模型社区的现状与参与门槛
  • 23:47 国内大模型社区的发展
  • 25:34 国内大模型的备案问题
  • 27:58 阿里的开源与闭源并行策略
  • 29:12 阿里云的商业闭环
  • 31:19 360的大模型联盟策略
  • 33:42 字节跳动的AI应用与数据优势
  • 36:17 字节跳动在AI领域的海外尝试
  • 37:47 字节跳动使用的底层大模型

🧲 本期相关

  1. 大模型(Large Models):指规模较大的人工智能模型,通常需要大量数据和计算资源进行训练。
  2. 开源(Open Source):指软件或模型的源代码对公众开放,允许任何人自由使用、修改和分发。
  3. 闭源(Closed Source/Proprietary):与开源相对,指软件或模型的源代码不公开,由特定公司拥有和控制。
  4. Meta(Facebook):社交媒体公司Facebook的母公司,也是大模型技术的重要参与者。
  5. LLAMA:Meta开发的一个大型语言模型。
  6. 阿里云(Alibaba Cloud):阿里巴巴集团的云计算业务,提供包括大模型在内的多种云服务。
  7. 摩搭(ModelScope):阿里云推出的AI模型分享平台。
  8. 算力(Computational Power):指进行计算任务的能力,通常与硬件性能相关。
  9. API(Application Programming Interface):应用程序接口,允许不同软件之间进行交互。
  10. 模型训练(Model Training):使用大量数据来训练人工智能模型,使其能够执行特定任务。
  11. 数据污染(Data Pollution):指在模型训练过程中,由于数据集中的偏差或不当使用导致的模型性能问题。
  12. 多模态(Multimodal):指能够处理和理解多种类型数据(如文本、图像、声音等)的模型。
  13. token:在自然语言处理中,指文本中的一个元素,可以是单词、字符或其他语言单位。
  14. GPT(Generative Pre-trained Transformer):一种由OpenAI开发的预训练语言模型。
  15. DeepMind:Alphabet(Google的母公司)旗下的人工智能公司,以开发先进的AI模型而知名。
  16. 模型部署(Model Deployment):将训练好的模型应用于实际应用中的过程。
  17. AI人才储备(AI Talent Pool):指公司或组织拥有的人工智能领域的专业人才。
  18. 字节跳动(ByteDance):一家中国的科技公司,拥有TikTok(国际版抖音)等流行应用。
  19. 高斯(Gaussian):字节跳动推出的一款AI应用,可能与数学或教育相关。
  20. 模型天花板(Model Ceiling):指模型性能达到的上限,难以进一步显著提升。

📚 栏目介绍

在高流动性的噪声世界,成为一个优秀的滤波器,屏蔽生活中的噪声,找到你生命中的信号。

《信号& 噪声》是一档分享前沿的产品、技术和思考的泛科技播客。从作战一线的投资和产品视角,希望通过准确、长期、系统的追踪科技,与科技爱好者、创业者、投资人一起探索新变化,启发新可能。

🔍 关注我们

微博/小红书/抖音/公众号/B站:@信号&噪声

欢迎在评论区留言/小红书分享你的听后感,对于节目话题的更多观点,获取更多未呈现观点的拓展阅读,欢迎添加信号&噪音听众群参与讨论。

👥 制作团队

策划制作:Patric、Eric、圣冰

剪辑:Patric

展开
大家都在听
SEO优化
SEO优化
搜索引擎优化(SEO)的主要目标就是让你的网站内容尽可能地出现在搜索结果靠前位置。具体可以通过四个步骤来实现:1.抓取系统,2.关键词调研,3.页面优化,4.外链建设1. 抓取系统(Spider) 首先,我们需要了解搜索引擎的工作原理,以便更好得理解SEO。搜索引擎有一个抓取系统,俗称Spider,你可以把它想象成一群在互联网上乱爬的蜘蛛(有点恶趣味...),它们会读取各个页面的HTML,并且通过页面上的链接关系,不断抓去新的有价值的页面内容,再将其发回搜索引擎。根据Spider传回的信息,搜索引擎来给你的页面排名。对于这个Spider,你需要注意什么呢?1. 搜索引擎无法很有效地抓取flash的内容。HTML5的出现解决了这个问题。HTML5可以达到很多flash能达到的效果,并且它与搜索引擎更加兼容。2. 搜索引擎无法读取图片中的文字。所以你需要给图片配上标记(alt tags),告诉spider这个图片是什么内容。3. 搜索引擎对于PDF,word,PPT等格式的文件没什么好感,这些格式在排名上会有劣势。4. 不要过度重复关键词。讲一个有趣的宝马公司的例子,宝马公司的营销人员为了提高产品页面的搜索排名,在每个产品上都贴上BMW的标签,导致Spider读到这个页面的时候的效果是“BMW...BMW...BMW...BMW..."这个就属于SEO中的黑帽手段(black-hat)了,这也是GOOGLE所不能接收的,这样做的一般后果是从Google搜索结果中除名。想象一下如果你是某公司的营销总监,你的行为让贵公司被GOOGLE除名,你会是什么下场不用我说了吧?幸好,宝马是个大公司,GOOGLE也不想用户搜宝马的时候只能跳出奔驰,最后这件事双方就协商着解决啦。
--
1
评论(0条)
快来抢沙发吧!
打开蜻蜓 查看更多