他用GPT-3实现了「量子速读」
有ChatGPT那味儿了
Alex 发自 凹非寺
量子位 | 公众号 QbitAI
你是否曾为了查一个问题,翻书翻到头秃?
要是书里有的内容,一问便知就好了……等等,“一问便知”,这怎么有ChatGPT那味儿了?
话说,有人还真就由此思路开发出一个聊天Bot,做示例的书是马可·奥勒留的《沉思录》(全书共12卷,497则)。
只用几分钟,AI就能记下全书内容。
然后随便问个书里讲过的东西,比如“如何处理负面情绪?”,AI可以快速扫描文本并给出高质量回答,甚至还一条条给你列好。
原帖一发布,网友纷纷围观点赞。
开发者Dan Shippers称,做出这个AI并不难,主要功臣就是语言大模型GPT-3,另外再加几行代码就搞定了。
另外,这哥们儿甚至还嗅到了一丝商机:
网上现在有很多受版权保护的文本、音视频资料集,都能被做成聊天机器人!
对想获取信息的人来说,有时一看给了钱自己还要慢慢整理,可能就放弃了;而要是能通过AI快速锁定目标内容的话,应该会有更多人愿意自掏腰包。
怎么做出来的?
用Dan哥的话来说,Bot制作过程主要分为3个步骤。
首先,当然是找到整活的素材。比如整本《沉思录》。
Dan哥从网上下载了《沉思录》原著,将其保存在Google Dive的一个文件夹中。通过Google Drive,用户可以将文件存储在云端,并在设备间同步、共享。
然后再在谷歌的云端编程平台Colab上,运行下面这段Python代码,既能访问Google Drive,还能轻松实现与GPT-3的互动。
Dan介绍称,GPT-3能以任何文本素材为基础,给你整出一个聊天bot。
不过有个问题:单次能向GPT-3输入的文本字数是有限的。
所以第二步,就是访问存在Google Dive上的那个文件夹,再把整个文本素材划分成一个个小块,存到新的文件中。
第三步,当用户提问时,先通过OpenAI的API访问书中包含相关解释的小块内容,再把这些内容传到GPT-3中,整理出语言通顺的回答。
具体代码如下:
到此,为整本《沉思录》专门定制的聊天机器人就做好了。
除此之外,基于此基本思路,Dan哥又把他喜欢的某系列播客节目也做成了聊天Bot。
他说自己曾在节目中听到一个感兴趣的名词,但忘了是啥意思。平时想弄明白的话,不得不把一集内容重新听一遍。
但现在有了聊天Bot——重听?不存在的。
Dan是何许人也?
话说回来,能从聊天机器上人看到新的商机,Dan哥的过往经历或许也产生了一定影响。
他本科毕业于宾夕法尼亚大学的文科类哲学系,但这位哥其实还是个技术大佬。
他从小学5年级就开始编程,在大学期间又和小伙伴创办了一家软件公司FireFly,收入在六位数以上。
他还在上大二时,不少科技公司就已抛来橄榄枝,但人家都拒绝了,说是想先完成学业。
大学一毕业,他把FireFly卖给了知名业务软件公司Pegasystems,赚到第一桶金。
紧接着,他在Pega担任起项目负责人,并把业务部门的收入提高到百万美元级别。
再后来,他从Pega出来,于2020年又创办一家公司Every,主要创作商业类简报和播客,目前已有6万+订阅用户。
(怪不得他会想到把播客内容做成聊天机器人)
目前除了自己开公司,Dan还兼任红杉资本的Scout,为风投者出谋划策。
参考链接:
[1]https://twitter.com/danshipper/status/1620464918515302401
[2]https://every.to/chain-of-thought/i-trained-a-gpt-3-chatbot-on-every-episode-of-my-favorite-podcast
[3]http://danshipper.com/
- 北大开源最强aiXcoder-7B代码大模型!聚焦真实开发场景,专为企业私有部署设计2024-04-09
- 刚刚,图灵奖揭晓!史上首位数学和计算机最高奖“双料王”出现了2024-04-10
- 8.3K Stars!《多模态大语言模型综述》重大升级2024-04-10
- 谷歌最强大模型免费开放了!长音频理解功能独一份,100万上下文敞开用2024-04-10