他用GPT-3实现了「量子速读」

丰色 2023-04-06 12:41:59 来源：量子位

有ChatGPT那味儿了

Alex 发自凹非寺

量子位 | 公众号 QbitAI

你是否曾为了查一个问题，翻书翻到头秃？

要是书里有的内容，一问便知就好了……等等，“一问便知”，这怎么有ChatGPT那味儿了？

话说，有人还真就由此思路开发出一个聊天Bot，做示例的书是马可·奥勒留的《沉思录》（全书共12卷，497则）。

只用几分钟，AI就能记下全书内容。

然后随便问个书里讲过的东西，比如“如何处理负面情绪？”，AI可以快速扫描文本并给出高质量回答，甚至还一条条给你列好。

原帖一发布，网友纷纷围观点赞。

开发者Dan Shippers称，做出这个AI并不难，主要功臣就是语言大模型GPT-3，另外再加几行代码就搞定了。

另外，这哥们儿甚至还嗅到了一丝商机：

网上现在有很多受版权保护的文本、音视频资料集，都能被做成聊天机器人！

对想获取信息的人来说，有时一看给了钱自己还要慢慢整理，可能就放弃了；而要是能通过AI快速锁定目标内容的话，应该会有更多人愿意自掏腰包。

怎么做出来的？

用Dan哥的话来说，Bot制作过程主要分为3个步骤。

首先，当然是找到整活的素材。比如整本《沉思录》。

Dan哥从网上下载了《沉思录》原著，将其保存在Google Dive的一个文件夹中。通过Google Drive，用户可以将文件存储在云端，并在设备间同步、共享。

然后再在谷歌的云端编程平台Colab上，运行下面这段Python代码，既能访问Google Drive，还能轻松实现与GPT-3的互动。

Dan介绍称，GPT-3能以任何文本素材为基础，给你整出一个聊天bot。

不过有个问题：单次能向GPT-3输入的文本字数是有限的。

所以第二步，就是访问存在Google Dive上的那个文件夹，再把整个文本素材划分成一个个小块，存到新的文件中。

第三步，当用户提问时，先通过OpenAI的API访问书中包含相关解释的小块内容，再把这些内容传到GPT-3中，整理出语言通顺的回答。

具体代码如下：

到此，为整本《沉思录》专门定制的聊天机器人就做好了。

除此之外，基于此基本思路，Dan哥又把他喜欢的某系列播客节目也做成了聊天Bot。

他说自己曾在节目中听到一个感兴趣的名词，但忘了是啥意思。平时想弄明白的话，不得不把一集内容重新听一遍。

但现在有了聊天Bot——重听？不存在的。

Dan是何许人也？

话说回来，能从聊天机器上人看到新的商机，Dan哥的过往经历或许也产生了一定影响。

他本科毕业于宾夕法尼亚大学的文科类哲学系，但这位哥其实还是个技术大佬。

他从小学5年级就开始编程，在大学期间又和小伙伴创办了一家软件公司FireFly，收入在六位数以上。

他还在上大二时，不少科技公司就已抛来橄榄枝，但人家都拒绝了，说是想先完成学业。

大学一毕业，他把FireFly卖给了知名业务软件公司Pegasystems，赚到第一桶金。

紧接着，他在Pega担任起项目负责人，并把业务部门的收入提高到百万美元级别。

再后来，他从Pega出来，于2020年又创办一家公司Every，主要创作商业类简报和播客，目前已有6万+订阅用户。

（怪不得他会想到把播客内容做成聊天机器人）

目前除了自己开公司，Dan还兼任红杉资本的Scout，为风投者出谋划策。

参考链接：
[1]https://twitter.com/danshipper/status/1620464918515302401
[2]https://every.to/chain-of-thought/i-trained-a-gpt-3-chatbot-on-every-episode-of-my-favorite-podcast
[3]http://danshipper.com/

GPT-3

丰色

他用GPT-3实现了「量子速读」

怎么做出来的？

Dan是何许人也？

相关阅读

算力直降97%，GPT-3存储只用20MB？！这篇直接在1.58-bit下训练模型的新论文火了

“AI复活了我的妻子，但我决定跟她说再见了”

单张GPU搞定GPT-3超参数！先训练小模型，再“一键迁移” | 已开源

想玩GPT-3申请不到？UC伯克利让你免费在线玩，无需注册，最快10s出结果

GPT-3开始探索付费使用：每月给个700块，写得比莎士比亚还多

「炫富」的GPT-3来了：31位作者，45TB数据，72页论文，1750亿个参数，会编故事，还会三位数加减法

热门文章

英伟达含量为零！华为密集模型性能比肩DeepSeek-R1，纯昇腾集群训练

联想百应智能体入选量子位“2025年值得关注的AIGC产品”：国内首个AI服务智能体打破中小企业AI落地困局

DeepSeek引爆「万物皆可AI」时代，20余位大咖分析行业痛点，万字梳理干货在此

最强视觉生成模型获马斯克连夜关注，吉卜力风格转绘不再需要GPT了

发放1亿元代金券！商汤大装置SenseCore 2.0全新升级