【大白话系列 #3】大白话聊 ChatGPT(Sarah & 王建硕)

00:00
02:17:51
听完整版
节目详情

欢迎各位收听 Traders’ Talk 大白话系列的第 3 期。


这次建硕和我聊的是一个充满未知和想象力的话题——ChatGPT。就在今天凌晨(2023/3/15),OpenAI 发布了多模态预训练大模型 GPT-4,它比之前的产品更加可靠、更有创意,能处理更细微的指令。


在本期节目中,建硕科普了 ChatGPT 的定义和原理,澄清了关于它的常见误解,并从创业者的角度出发畅谈了 ChatGPT 的应用前景和创业机会。最后,我们还探讨了与 AI 相关的隐忧。


感谢各位的收听,我是 Sarah,让我们开始本期节目吧!


———以上文本由 ChatGPT 生成———


相关文稿及视频】


本期播客逐字稿(未精校)https://d58hixvcd6.feishu.cn/minutes/obcnyme2oqv67s82sct87997

完整视频直播逐字稿(精校):https://d58hixvcd6.feishu.cn/docx/HfMEds7Z1ov37wxqM19czTBinWg

如何收看视频直播详见下图�


【嘉宾简介】


王建硕,


百姓网创始人、董事长

公众号:王建硕


【Timeline】


一、ChatGPT 定义及原理


00:02:58 ChatGPT 首先是一个产品,其次才是一个大语言模型


00:04:23 自然语言处理 NLP 的两大分支:大语言模型 VS 特定语言模型


00:08:30 GPT-3.5 中的 3.5 编号是怎么来的?


00:10:36 ChatGPT 中 G、P、T 三个字母以及微调的含义


00:18:26 特德·姜的文章比喻:ChatGPT 是人类知识模糊的 JPG


00:21:18 人工智能幻觉 AI Hallucinations 是怎么产生的,需要规避吗?


二、澄清关于 ChatGPT / LLM 的迷思


00:30:41 为什么 ChatGPT 是数学很差的文科生?它在做的不过是文字补全


00:34:41 近两年大语言模型的突破性进展:涌现、思考链路,但依然算不上通用人工智能


00:40:52 ChatGPT 敲开了自然语言用户界面 LUI 的大门


00:45:09 建硕经历的四次历史上的惊叹时刻,其中浏览器时刻与 ChatGPT 时刻极为相似


00:49:48 Web3 现在还相当于互联网的 1979 年,有改变人类世界的能力、但还未到火候,在行业里等待可能是危险的


00:53:51 中国有必要再做一个类似 ChatGPT 的大语言模型吗?


00:59:51 ChatGPT 与搜索引擎的关系和区别


01:01:33 ChatGPT 有没有自我 / 意识 / 人格?


01:13:14 如何看待杨立昆 Yann LeCun 教授的评价:ChatGPT 所应用的技术并无多大创新,只是在工程设计上非常优秀?


三、创业视角看 ChatGPT


01:15:36 ChatGPT 可能被应用的领域有哪些?


01:19:34 基于同一套 GPT 模型 API 开发的产品该如何进行产品差异化、构建竞争壁垒?


01:22:38 ChatGPT 这一次浪潮究竟是谁的机遇,产业链的价值捕获最终会落在何处?


01:28:43 国内外创业者在这条路上时间差吗?各有什么风险和机遇?


01:35:31 ChatGPT 会让人失业吗?


01:39:50 会用 AI 的人和不会用 AI 的人之间会形成更大的不公平吗?


四、AI 隐忧


01:42:13 ChatGPT 生成的内容(包括 AI 作图的作品)应该受版权保护吗?


01:44:45 ChatGPT 背后的语料是否可能涉及侵犯隐私或非授权的数据爬取?


01:49:48 未来互联网会不会充斥着 AI 生成了大量同质化 / 平均水平的语料,进而让未来的一代成为「迷失的一代」?


01:59:48 ChatGPT 不仅不会像抖音算法那样割裂世界,反而给人类一个世界大同的可能性


五、其他


02:10:07 AI 教育的重要性,以及建硕在实践的瀛海威互联网分享精神的传承


【名词解释】

1. ChatGPT 的核心是大型语言模型(详见第 4 点),及《ChatGPT 中,G、P、T 分别是什么意思?》。

2. 微调(Fine-Tuning):这部分训练是在预训练之后进行的。该程序接受一项任务,然后针对更具体的数据在更小、更具体的任务上进一步训练它。

3. OpenAI 各代产品:GPT-1、2、3、4 、InstructGPT 与 ChatGPT

2018 年 GPT-1(开源):首次让人工智能像人类一样「理解文字」、写出文字

2019 年 GPT-2(开源,1.5 billion 参数)

2020 年 GPT-3(未开源,175 billion 参数,45T 文本)

InstructGPT:专注于让其听懂指令

ChatGPT(GPT-3.5,500G 文本):基于对话场景以及安全边界等进行加强,是 GPT-3 模型上进行微调的产物。

2023/3/2 GPT-3.5 API 开放:人人可用、接入门槛低

2023/3/15 GPT-4 上线,拥有多模态能力,可接受图像输入并理解图像内容

4. 自然语言处理(Natural Language Processing,简称 NLP):是 AI 领域的一个子领域,旨在让计算机能够理解、处理、生成自然语言。

    大语言模型(Large Language Model,简称 LLM):是自然语言处理领域中的一种技术。LLM 可以基于深度学习算法构建的模型,通过学习大量的文本数据,可以对文本数据进行学习和预测。“大”指的是参数多、语料多。

    特定语言模型(Specific Language Model):是一种针对特定语种和领域的自然语言处理模型。它在大语言模型的基础上,使用特定领域的文本数据进行训练和优化,以提高模型在该领域中的预测和生成能力。

    意图检测(Intention Detection):是 NLP 领域的一种技术,旨在识别和理解用户在一段文本中的意图。在应用中,意图识别通常与语音识别和语音合成等技术相结合,以实现智能对话和交互。

    实体检测(Entity Detection):同样是 NLP 领域的一种技术,旨在从文本中识别出具有特定意义的实体,例如人名、地名、组织机构、日期、数字等。

5. 提示词(Prompt):一种文本片段,包含了对输入数据进行处理的指令或提示,系统可以根据 Prompt 生成相应的输出。通常用于生成文本、回答问题等任务中。

6. 人工智能幻觉(AI hallucinations):人工智能系统在生成输出时,所产生的一些错误或不合理的结果。这些结果通常是由于模型在训练过程中,所接受的数据不足或不平衡所导致的。

7. 涌现(Emergence):从简单的算法、模型或数据中出现的意想不到的结果或行为。当神经网络的复杂性和训练样本的多样性超过一定规模后,就会有抽象的推理结构在神经网络里自发地涌现出来,这个过程是非线性的,量变导致质变。

8. 思维链路(Chain of Thought,简称 CoT):用于描述神经网络中的信息流动和计算过程。这一概念试图复现慢思考模式的过程。

9. 通用人工智能(Artificial General Intelligence,简称 AGI):与目前大多数人工智能系统只能解决特定领域的问题不同,AGI 可以具有类似人类的智能,能够在多个领域中学习和应用知识,处理和理解不同类型的信息,并具备自我学习和自我改进的能力。AGI 被认为是人工智能领域中最具挑战性和最具科学意义的目标之一。

10. AIGC(Artificial Intelligence Generated Content):由人工智能自动生成的内容,这些内容可以是文字、图像、音频、视频等。

11. Yann LeCun 杨立昆教授:Meta AI 首席科学家,2018 年图灵奖获得者,CNN 卷积神经网络之父,是世界上最有影响力的人工智能研究人员之一。

12. BUI、TUI、CUI、GUI、GIUI、LUI:https://mp.weixin.qq.com/s?__biz=MjM5NzI0Mjg0MA%3D%3D&mid=2652376369&idx=1&sn=488d996d44e4d01a7c7d00d7892702f6&chksm=bd305f868a47d690bba06466c7e93df8c817169ab0cd4ea734e83f1df1433d3e046eb9a935ff&scene=21#wechat_redirect

13. 乔布斯与 GUI:1979 年,在一次对施乐的帕洛阿托研究中心(Palo AltoResearch Center)的拜访过程中,史蒂夫·乔布斯(Steve Jobs)发现了 GUI 的设计图纸和鼠标。随后便将它运用于 Apple Macintosh 的开发过程中。

14. DNS(Domain Name System):一个用于将域名转换为 IP 地址的分布式数据库系统。

Netscape Navigator:第一个广泛使用的商业化 Web 浏览器,由美国公司 Netscape Communications Corporation 开发并于 1994 年发布。

15. 图灵测试(Turing Test):一种测试人工智能是否具有智能的标准之一,由英国计算机科学家图灵在 1950 年提出。

16. HTTP 协议、HTML 协议、FTP 协议、Telnet 协议、Mailto 协议、Gopher 协议、NNTP 协议(大家感兴趣的话自行查定义哈……后台不让放这么多字于是我删掉了)。

17. 阿帕奇(Apache):一款开源的 Web 服务器软件。它以高性能、稳定性、灵活性和安全性著称,可以满足各种 Web 应用的需求。

18. 红旗浏览器:中国自主研发的一款浏览器软件,由中国红旗软件股份有限公司开发,它是国内第一款支持 IPv6 协议的浏览器。

19. AI 军备竞赛 The AI Arms Race Is On:2023 年 2 月,Google 推出 Bard;微软推出 New Bing。国内百度类 ChatGPT 聊天机器人项目名字确定为「文心一言」(ERNIE Bot);中国初创公司元语智能首发 ChatYuan。

20. 巴别塔:《圣经·创世纪》中的一个故事,讲述了人类曾经想要建造一座高耸入云的巨塔,以便让自己的名字传遍全世界,但被上帝惩罚,使得人类的语言不同,无法相互理解,于是他们停止了建造,分散到世界各地。这个故事被认为是对人类的骄傲和自大的警示,同时也是对人类语言多样性的认识和尊重。


【相关链接】

1. 建硕公众号中关于 ChatGPT 的文章(文末)

2. ChatGPT Is a Blurry JPEG of the WebChatGPT是网上所有文本的模糊图像),《降临》原作者、科幻小说家 Ted Chiang(特德·姜)发布于 The New Yorker 的文章。

3. 木遥《涌现》《涌现(续)》

4. A Conversation With Bing’s Chatbot Left Me Deeply Unsettled,出自《纽约时报》专栏作家、 Hard Fork 播客主播 Kevin Roose,他讲述自己花了两个小时体验 New Bing,得到了一场非常诡异的被 AI 示爱的体验。

5. “ChatGPT is 'not particularly innovative,' and 'nothing revolutionary', says Meta's chief AI scientist”《Meta首席AI科学家:ChatGPT并无特别的变革创新》,Yann LeCun 杨立昆教授认为,与其说 ChatGPT 是一个科学上的突破项目,不如说它是一项成功的工程实践。

6. A16z《Who Owns the Generative AI Platform?》,这篇文章将 ChatGPT(或 AIGC)产业链玩家分为了以下几种:

实体基础设施供应商可能是迄今为止这个市场上最大的赢家,捕获了大部分的价值,占据了流经此的大部分资金。如底层的芯片等硬件制造商、云服务商(基本无创业公司机会)。

上层的 AI 模型开发公司,也就是创造最大价值的公司——即训练生成式 AI 模型并将其应用于新应用程序——并没有获得大部分价值。

终端的纯调用模型 API 的应用开发公司的收入增长非常快,但往往在留存率、产品差异化和毛利率方面苦苦挣扎。

7. 斯坦福大学心智理论论文:Theory of Mind May Have Spontaneously Emerged in Large Language Models

8. 百姓网 AI 教育负责人 ElfeXu 文章:《因 AI 而强大》《如何在遍布 AI 的世界里游刃有余地生活》

9. Hung-yi Lee 关于 ChatGPT 的原理剖析视频系列

10. 老华《关于 ChatGPT 的一些问题和思考》分享:王建硕视频号-直播回放-3月4日 ChatGPT 应用畅想小聚(00:11:00-01:50:25)。

11. 《ChatGPT 与人类未来:AI 茧房、安全漏洞与未知的社会形态》,来自硅谷 101 公众号文章,提到创新工场 CTO 王咏刚在朋友圈中写到:「悲观情况是:因为人类的极度懒惰,互联网被AI生成的、错误率普遍高于人类知识工作者的『灌水内容』占领,我们的孩子成为『迷失的一代』」。

12. 《AI 作图的版权属于作者吗?》 by 刘飞 Lufy


剪辑:二琳


制作:Sarah、我不跑调


展开
大家都在听
吉列尔斯《钢琴演奏录音辑》
吉列尔斯《钢琴演奏录音辑》
这套9CD合辑是钢琴家吉列尔斯,1954-1972年间与克利夫兰管弦乐团、巴黎音乐学院管弦乐团、爱乐乐团、新爱乐乐团合作的演奏录音。 CD1-3收录了吉列尔斯1968年4月29日-5月4日在克利夫兰赛佛伦斯音乐厅,与乔治·塞尔指挥的克利夫兰管弦乐团合作,演奏贝多芬的5部钢琴协奏曲。一位是看起来内敛,实际上拥有钢铁般意志力的钢琴演奏家,另一位是以训练要求严格著名的指挥,他们二人相遇之后,会激荡出什么火花呢?在这个录音中,吉列尔斯没有采用早年注入凶猛的火力的演奏,而是偏重在音色的平稳度与抒情的灵性上。吉利尔斯经常强调的“自然”并不是光指音乐的自发性而已。在固定的节奏之外,谨慎的思考可以为乐曲增添不同的效果,就像这个录音中的贝多芬《第四钢琴协奏曲》,他把崇高威严的气势带进这部协奏曲。 CD4收录了吉列尔斯1957年4月30日-5月1日在伦敦阿比路第一录音棚,与利奥波德·路德维希指挥的爱乐管弦乐团合作,演奏贝多芬《第四、五钢琴协奏曲》。路德维希是位奥地利指挥,对音乐的处理工整严谨,吉列尔斯在这个录音中一反他在演奏俄罗斯作品时那种激昂奔放的手法,稳健的速度、遒劲的触键、绵密的结构将古典主义的典雅和贝多芬音乐中的雄浑崇高铺排得丝丝入扣。 CD5收录了吉列尔斯1957年6月1-2日(贝二)、6月19-20日(贝一)在巴黎瓦格拉姆音乐厅,与安德烈·范德努特指挥的巴黎音乐学院管弦乐团合作,演奏贝多芬《第一、二钢琴协奏曲》。这个录音是吉列尔斯正值壮年录制的,他以高超的技巧与丰富的情感变化,细腻地诠释了贝多芬这两部早期钢琴协奏曲。 CD6收录了吉列尔斯1954年3月9-10日在巴黎香榭丽舍剧院,与安德烈·克路易坦指挥的巴黎音乐学院管弦乐团合作,演奏贝多芬《第三钢琴协奏曲》。1954年3月12日在巴黎香榭丽舍剧院独奏莫扎特《第十六钢琴奏鸣曲》。 CD7收录了吉列尔斯1954年3月11日(拉三)、1955年6月13日(圣二)在巴黎香榭丽舍剧院,与安德烈·克路易坦指挥的巴黎音乐学院管弦乐团合作,演奏拉赫玛尼诺夫《第三钢琴协奏曲》、圣-桑《第二钢琴协奏曲》。1955年10月19-20日在纽约Capitol Studio独奏肖斯塔科维奇《前奏曲与赋格》的第五首和第二十四首。
44
91
妮寇拉·本内德蒂《巴洛克》
妮寇拉·本内德蒂《巴洛克》
这张专辑是苏格兰裔意大利小提琴家妮寇拉·本内德蒂与本内德蒂巴洛克乐团携手,2020年12月在伦敦录制的。她给专辑起了个简洁明了的名字《巴洛克》。妮寇拉·本内德蒂说:“演奏这些音乐的挑战在于要做到极致,还要有做到极致的勇气。”她表示,在十八世纪的威尼斯、那不勒斯和罗马,热烈、激情和美是世俗和宗教音乐的基石,在那个画家、作曲家和建筑师们把想象力推至极限的年代,巴洛克音乐代表着一种“表达的放纵”。 维瓦尔第写了很多D大调协奏曲,他总是会以一种很明快的方式使用这个调式,妮寇拉·本内德蒂介绍其中一首:“《D大调小提琴协奏曲, RV 211》采用了典型的三乐章形式,第二乐章很有亲密氛围,第三乐章则更有追逐感,有很多奔驰的十六分音符,更加轻盈、富于技巧。”在《b小调小提琴协奏曲, RV 386》中,维瓦尔第写了很多装饰音、琶音和模进,包括反复快速的十六分音符,“但第一乐章里距离结束一分钟左右的时候,时间似乎停止了。然后,突然之间,我们闯进了一个最戏剧化、最激烈的音乐与鼓点共同构成的世界,几乎有种流行乐的感觉。” 另一首《降B大调小提琴协奏曲, RV 583》,妮寇拉·本内德蒂曾听过意大利小提琴家朱里亚诺.卡米诺拉演奏的录音,她感慨:“我觉得自己无法达到他的水平,但我真的尽力了。我打心底里喜爱这个乐章。它基本上是主题与变奏的形式,但美妙绝伦,犹如来自天使灵魂的声音。” 这张专辑除了展示维瓦尔第的四部小提琴协奏曲,还有另一位作曲家弗朗切斯科·吉米尼亚尼的《大协奏曲》(改编自阿尔坎格罗·科莱里创作的一组主题与变奏曲。“很多学琴的年轻人都很喜欢科莱里的作品,”妮寇拉·本内德蒂说:“但吉米尼亚尼的版本会把你带向科莱里不曾达到的极端,远比原作更为大胆。” 《d小调大协奏曲, H.143 “佛利亚舞曲”》是根据一段历史悠久的低音和弦行进改编的主题与变奏,在低音基础上演奏的西班牙萨拉班德舞曲式,其主题有种非常晦暗的感觉,妮寇拉·本内德蒂难以抑制地称赞道:“吉米尼亚尼在这部作品里触碰了变奏曲的极限,再多走一步,它就无法被称为那段主题的变奏了。”
26
11
奥曼迪《柴科夫斯基·1812序曲》
奥曼迪《柴科夫斯基·1812序曲》
这张专辑是奥曼迪指挥费城管弦乐团,演奏柴科夫斯基《1812序曲》、贝多芬《惠灵顿的胜利》、格里格《“培尔·金特”组曲》。 柴科夫斯基《降E大调序曲“1812”》作品49,作于1880年。为了纪念1812年库图佐夫带领俄国人民击退拿破仑大军的入侵,赢得俄法战争的胜利。此曲以其中的炮火声闻名,在一些演出中,尤其是户外演出,曾启用真的大炮。曲目开始时出现一个深广的主题,代表着俄罗斯广袤的领土和无限风光。后来乐曲进入发展部,一个侵略性的主题代表着法军的入侵。再次转到一个进行曲,表达的是俄罗斯人武装上前线,准备抵抗侵略者。后来激烈的主体冲突描绘了残酷的战争。里面被扭曲的马赛曲代表着法军。后来,俄国人赢得了战争的胜利,俄国国歌在炮声钟声中把乐曲推至最高潮。 贝多芬《惠灵顿的胜利》作品91,作于1813年。此曲是应节拍器发明者梅泽尔(Maelzel, 1772—1838)之邀而作,当时梅泽尔发明了一种称为Panharmonicon的自动管弦乐。曲中为模仿炮声与枪声,使用大鼓和木制齿车。全曲分为“战争”和“胜利交响曲”两部分。战争中在鼓号声中代表英军的是《保卫大不列颠》进行曲,代表法国的是根据《马赛曲》作成的进行曲。在枪炮声中,又引用了《冲锋进行曲》。第二部分,D大调,以英国国歌《神佑吾皇》为序引,圣歌的曲调共反复4次,使气势愈演愈烈,尾奏中,英国国歌织入赋格曲主题,在华丽的赋格展开中结束。 格里格《“培尔·金特”组曲》是格里格应邀为易卜生的诗剧 《培尔·金特》所写的配乐,完成于1874至1875年间,但他从配乐中选编的两套组曲(各分四段),却到1888和1891年才先后编出。这两部组曲都是曲作者格里格的代表作品。
175
18
布伦德尔《贝多芬·钢琴协奏曲全集》
布伦德尔《贝多芬·钢琴协奏曲全集》
这套3CD合辑是钢琴家布伦德尔与拉特尔指挥的维也纳爱乐乐团合作,演奏贝多芬的五部《钢琴协奏曲》。这是布伦德尔录制的第四套贝多芬《钢琴协奏曲全集》,与以前的三套录音有着同样的品质、感性、理智的严密性以及在大钢琴上铸就的辉煌,这也使得早期的唱片愈发妙趣横生。 一直以来,布伦德尔弹奏的所有五个慢乐章都极为优异,如同圣餐桌上的神父,吸引着管弦乐队中不同的乐器组环绕在自己的身旁,这次录音甚至比之前更好了。在两部早期的协奏曲中,维也纳爱乐乐团的演奏甜美而魅惑;在宏大的后期作品中,指挥西蒙·拉特尔彰显出了自身的能量。布伦德尔在早期协奏曲中的演奏,使人回想起他那些早期奏鸣曲以及早、晚期钢琴小品的优秀唱片,但布伦德尔是一位非常私密的人,对传统习俗以及作为“公共”作品拘泥于形式的协奏曲缺乏容忍性。 在《第三钢琴协奏曲》中,人们进入了一个不同的世界。这是一场精彩绝伦的演出,主音c小调暗示着充满黑暗和恐吓的聆听体验,低音乐器在前部奏出、作为打击乐器的鼓则准备就绪可随时投入使用。尤其是慢乐章之后的终曲部分,是不祥的预兆(只有一根发出光泽的单簧管在独奏),全景色调然却有如此宁静,这样的演绎还很少听到。《c小调钢琴协奏曲》以英雄为模型;而降E大调的《第五钢琴协奏曲“皇帝”》第一乐章的速度比先前的要慢,但效果并不理想。也许现在的诠释者们,和他们那些具有贝多芬式英雄特质的前辈们相比,要少了些许快乐。回到《第四钢琴协奏曲》的私密世界里,独奏家、管弦乐团以及指挥,状态都非常好。布伦德尔那熠熠生辉钢琴独奏部分的背后,是真实的热情和敏感性作为支撑。从各个方面来说,这套合辑都堪称一流。
79
15
布赫宾德《勃拉姆斯钢琴协奏曲》
布赫宾德《勃拉姆斯钢琴协奏曲》
这张专辑是钢琴家布赫宾德与哈农库特指挥的阿姆斯特丹皇家音乐厅管弦乐团合作,演奏勃拉姆斯的两部钢琴协奏曲。这是1998-1999年在阿姆斯特丹的现场演奏录音。布赫宾德的演奏追求简单的线条、不加雕琢的简约,展现了德奥音乐的正统诠释风格,哈农库特曾对他说:“你演奏的勃拉姆斯钢琴协奏曲有我心目中最理想的声音。”通过这版演奏录音,布赫宾德的演奏功力受到全世界乐迷的肯定。 《d小调第一钢琴协奏曲》作品15,完成于1858年。起初是一首双钢琴变奏曲,之后有意改写成交响曲,最后却成为一首钢琴协奏曲。由于勃拉姆斯本人是一位优秀的钢琴家,同时又和天才女钢琴家克拉拉·舒曼相互商讨才写出这首协奏曲,所以此曲要求有相当高深的钢琴弹奏技巧。它以宏伟的构思和史诗般的概括性,反映着波涛澎湃的、憧憬式的遐想。 《降B大调第二钢琴协奏曲》作品83,作于1881年。此曲具有勃拉姆斯所独有的沉着与厚重,同时又有他明朗、温柔的另一面。1878年春,勃拉姆斯到意大利旅行,这一南欧古国的风土人情给作者留下了极为深刻的印象,由此勃拉姆斯开始构思这首乐曲。1881年三月,作者再度访问意大利,这一次彻底唤起了他的灵感,于是回国后立刻伏案疾书,当年夏天便完成了此曲。实际上,此曲中的意大利风格并不明显,但无疑是作者真实情感的流露,堪称勃拉姆斯的代表作品之一。
123
7
评论(0条)
快来抢沙发吧!
打开蜻蜓 查看更多