设计 | 怎么用声音对抗 AI 狂潮中的信息过载?

设计 | 怎么用声音对抗 AI 狂潮中的信息过载?

Design For AI

// 设计AI,设计未来 // 从产品设计角度介绍 AI 产品、讲解设计方法、传授设计策略

查看专题

OpenAI 推出 ChatGPT 后引发了 AI 狂潮,每个人每天醒来都面临恐慌,不知道今天又会被什么 AI 新功能、新用法、新工具…新赚钱机会击中,更不知道今天会错过什么改变世界的 AI 新动态。怎么办?解决办法貌似很奇怪:听播客

解决了什么问题

在持续不断的 AI 信息轰炸中,目前占据 AI 信息价值链(aka 鄙视链)最顶端的,无疑是各种 AI 论文作者,以及阅读论文、把论文变成产品的 AI 开发者。不过 AI 的指数级爆发也带来了一个史无前例的障碍:AI 论文也是指数级爆发,每天论文太多了、太多了、太多了…多到根本看不过来!

优秀学习者、阅读者都知道,获取优质信息需要一个好的处理流程,比如精选优质信息源、以某种价值筛选出优质文章、按照信息的重要程度优先阅读、通过泛读和预读来提前消化信息…这些方法本质上都是一种优化信息获取的信噪比,尽可能优选出优质信息、过滤掉噪音信息。

论文和一般信息的差别在于,它们的信息源、质量、重要性都已经经过高度优化,很难在这些高质量信息里再做筛选和过滤。这就逼着论文读者们不得不硬着头皮,阅读越来越多的“每篇”论文。

yeah、yeah、yeah 我知道你想说什么:为什么不用 ChatGPT 给论文生成摘要呢?预先读一下摘要,不就能判断这篇论文是否值得深入阅读和研究了么?


解决问题的方法:听 Podcast 播客

的确如此,开发者、研究者们用 ChatGPT、GPT 制作了各种工具,来生成论文摘要、简化选择论文的难度。

但是很遗憾,现在论文多到了连生成的摘要都没时间阅读!这真是人类历史上少有的奇怪问题。

著名论文预印本网站 arXiv 提供了一个解决方案:借助 ScienceCast 公司的力量,把每天的新论文变成播客节目。

![设计 | 怎么用声音对抗 AI 狂潮中的信息过载? 8](nishuang.net/wp-content/uploads/sites/10/20.. "设计 | 怎么用声音对抗 AI 狂潮中的信息过载? 8")

ArXiv 论文播客

具体而言,他们综合使用了两种不同的 AI 技术:先用 GPT 生成自然语言的论文摘要,突出论文重点、减少低信息量的冗余信息;再用语音合成 AI 合成自然发音的人声;最后制作为每日的播客节目。

订阅者可以按照科研领域,收听不同领域的论文播客。试听最新一期 AI 主题的论文播客

这套方案最大的亮点在于:眼睛是独占的,你不能边开车边看论文;而耳朵能够“多任务”,你可以一边开车、一边吃饭、一边遛狗、一边那个…一边听论文播客。

毫不夸张地说,播客这种“多任务”的音频信息,能帮你在满满当当的一天 24 小时里,再凭空多出半小时、一小时。


产品设计想象空间

基本上播客是音频信息最简单的载体,因为播客播放器很普及,播放设备也不限于手机、电脑、汽车,甚至收听时间和地点都可以很碎片化,在不跟 TikTok 们抢时间的大前提下,收听播客属于阻力特别小、收益也不低的信息消费方式。

利用 GPT 和语音合成 AI 来制作播客节目,会把以前那种创作者为中心的创作流程,变成以信息、以内容为中心的制作流程。不难想象,以后以播客为载体的音频类信息会急剧增加,听播客会变成一种更普及的信息获取方式。

![设计 | 怎么用声音对抗 AI 狂潮中的信息过载? 9](nishuang.net/wp-content/uploads/sites/10/20.. "设计 | 怎么用声音对抗 AI 狂潮中的信息过载? 9")

另外,因为 GPT 具备自然语言交互能力,语音识别 AI 的准确性也越来越高,以后收听播客的交互方式和综合体验也会有新变化。比如你可以不依赖手和眼睛,直接用语音和 AI 附体的播客播放器交互:

  • 你问它有什么好听的?它马上告诉值得听什么。
  • 你问它这期节目好听在哪儿?它马上把精彩部分摘录出来直接放给你听。
  • 你说这期节目真不错…它说好的!它马上按你语气生成分享台词,然后自动分享给你的朋友 A、B、C、D…

今天拿播客来对抗信息超载,似乎是有点奇怪。

但有了 AI 作为支撑,播客和那些还没被发明的音频内容,一定会从每天 24 小时里挤出更多时间,用这些时间来帮助人类改变世界。