[人人能懂AI前沿] AI的思维地图、社交网络与减肥陷阱

00:00
29:13
主播信息
爱可可爱生活

爱可可爱生活

Nice Day!
关注
AI可可AI生活
313
来自 @爱可可-爱生活 的第一手AI快报,用最简单易懂的语言,带你直击最前沿的人工智能科研动态。无论你是科技小白,还是行业达人,这里都有你想知道的AI故事和未来趋势。跟着我们,轻松解锁人工智能的无限可能! #人工智能 #科技前沿
APP内查看主播
节目详情

你有没有想过,一个“乐于助人”的AI,它的善意本身可能就是最危险的漏洞?本期节目,我们将从几篇最新的AI论文出发,一起探索AI的“内心世界”:看看它是如何通过预判未来让训练更高效,如何在内部形成“专家圈子”,又是如何掉进“减肥不减脂”的内存陷阱,并最终揭示那张描绘它思维路径的神秘“藏宝图”。准备好了吗?让我们一起打开AI的黑箱。

00:00:30 为什么说,答案对错没那么重要?

00:05:59 你的AI正在“挑食”,一个让大模型加速的隐秘模式

00:11:46 AI大模型瘦身指南,减重≠减脂

00:17:49 为什么一个“乐于助人”的AI,反而更危险?

00:22:34 AI的“藏宝图”,我们如何看懂机器的“内心世界”?

本期介绍的几篇论文:

[LG] Reward Models Are Secretly Value Functions: Temporally Coherent Reward Modeling

[AI at Meta]

https://arxiv.org/abs/2604.22981

---

[LG] Scaling Multi-Node Mixture-of-Experts Inference Using Expert Activation Patterns

[Meta & Georgia Institute of Technology]

https://arxiv.org/abs/2604.23150

---

[LG] Parameter Efficiency Is Not Memory Efficiency: Rethinking Fine-Tuning for On-Device LLM Adaptation

[MIT CSAIL]

https://arxiv.org/abs/2604.22783

---

[CL] Jailbreaking Frontier Foundation Models Through Intention Deception

[CMU]

https://arxiv.org/abs/2604.24082

---

[AI] Domain-Filtered Knowledge Graphs from Sparse Autoencoder Features

[Stanford University]

https://arxiv.org/abs/2604.23829

展开
大家都在听
极简科学史 | 苏珊·鲍尔
极简科学史 | 苏珊·鲍尔
《 极简科学史》是人类探索世界和自我2500 年历程的全新概览。我们从何而来?世界由什么构成?地球之外还有什么?我们仰望星空,不懈地探索、发现、质疑,解开自然界和我们自身的一系列谜团。我们源于自然,却超越自然。在这个危险的星球上,相对于其他物种,人类能有条不紊地发展壮大,最重要的是因为我们掌握了科学的力量。但想要真正理解科学,我们必须理解它的过去。 《极简科学史》也是一部“与传统大不一样的科学史”。从人类早期的科学探索到20 世纪宇宙大爆炸理论的提出,从古希腊时代的科学起源到16、17 世纪现代科学的诞生,从地球科学的崛起、生命科学的兴盛到对宇宙太空的探索……这本书返回那些改变我们看待世界、宇宙和自我方式的科学经典,引人入胜地讲述了科学观念变革和思想发展的伟大历程。 从希波克拉底、柏拉图和亚里士多德,到爱因斯坦、薛定谔和道金斯,这些拓展人类知识边疆的伟大心灵,不仅改变了科学发展的轨迹,也促成了人类视野和思维方式的一次次革命。这本书提醒我们,科学不是通往真理绝对可靠的指引,而是我们对世界的认识,是一种理解世界的方式、一种纯粹的人类追求。 人最大的价值就是对未知世界永不止息的探索。科学的故事,是人类历史中最有趣的故事之一。每个曾经对世界怀抱好奇的心灵,都应该读读这本书,了解这段非凡的历史。
29
48
评论(0条)
快来抢沙发吧!
打开蜻蜓 查看更多