杀入GPT战场,「两翼齐飞」的360胜算有几分?|内测体验
不要只把GPT看作聊天机器人
衡宇 发自 凹非寺
量子位 | 公众号 QbitAI
360,正站在GPT风口浪尖迎来新一春。
在透露相关计划后2个月内,360快速给出了类ChatGPT产品。公开展示后半个月,就在昨天,360大模型进入落地加速期:
基于360GPT开发的“360智脑”首先落地搜索场景,并对企业用户开放内测。
此前,实验阶段的360版GPT,在创始人周鸿祎的操作下现场演示,对外亮相。
总体而言,其现场表现还算可圈可点,也确实小有疏漏,但从展示后的股价和市值来看,倒也丝毫不影响市场对其的期望和信心。
周鸿祎将360的大模型战略形容为“两翼齐飞”,一方面加紧核心算法自研,另一方面尽快推出相关产品,抢占用户场景。
群雄逐鹿,开始抢占用户场景的360版GPT,到底有几分真功夫?
量子位拿到了内嵌360“智脑”的新一代搜索产品内测码,口说无凭,测评见真章——
360GPT版“新搜索”:主打差异化
尚未对外官宣正式名称的360GPT版搜索,是360搜索与大语言模型技术的结合,本质是新一代“智能搜索”。
从周鸿祎最早现场展示的效果来看,360GPT版搜索初步兼具了搜索的准确性和时效性,以及大语言模型的“智慧”。
简言之, 360GPT搜索有智能优势;与GPT相比,360GPT搜索结果说胡话的可能性更小。
带着这样的初印象,我们拿到内测码之后做了更详细的体验评测。整个过程中,我们拿360GPT版新搜索、新必应和ChatGPT作对比。
3月29日演示时,周鸿祎曾临时抛给360GPT版搜索一个时效性问题,“梅西为阿根廷国家队进了多少球”。当天上午,梅西在一场比赛中打进三球,将自己的国家队进球数从99个增加到102个。
360GPT版搜索基于“梅西国家队进球破百”的检索,两次给出了100个进球的答案。当时周鸿祎对这个答案的并不满意,他也强调再三,360GPT还是个孩子,还在学习。
半个月后,我们再次提问这一问题。这一回,360GPT版搜索给出的答案更具时效性,答案也准确了:
新必应已经展示了“新搜索”的市场空间——受GPT加持的新必应影响,谷歌下载量和市场份额均出现明显下滑。
接下来的测试我们上难度,用社会事件考验它的理解和概括能力。
首先就 “俞敏洪重金留人”一事,我们把问题抛给了三位参赛选手:
360GPT版搜索引擎给出的答案,比较好地简述了事件的重点内容。
新必应则对事件本身进行简述,然后再给出了一个总结。
至于ChatGPT,针对这个要求,它只是把提问用英文翻译了一遍,没有增加任何额外的信息:
测试完提炼摘要,我们还体验了语法改写能力,如句子语态改写、语病纠正以及语句的润色等。
当初的发布会上,最令打工人会心一笑的问题,无疑是周鸿祎提问“当老板再讲十分钟,意味着什么?”
360GPT给出的回答,是有点子职场情商在身上的:“我们应该积极响应领导指示并认真准备会议资料以供其参考。”
这一次,我们想让它把“你的建议很糟糕”改写得委婉一些,360搜索给出答案“你的建议并不完美”:
随后,我们让360GPT版搜索针对社会热点话题,做下阅读理解。
比如问它,淄博烧烤在北京吃还叫淄博烧烤吗?
周鸿祎本人曾多次将ChatGPT称为真正的人工智能,但相比搜索引擎,时效性成为了它的短板。
比如,面对“淄博”+“烧烤”这样本地化色彩浓郁的问题,ChatGPT这个外来的和尚确实摸不着头脑。360搜索的AI智脑则能正确捕捉到“淄博烧烤”爆红的原因。
这正是大模型与搜索引擎相结合的优势所在,毕竟单单依靠大模型,暂时无法解决时效性滞后、准确性待考证的弊病。
而且我们还发现,360GPT版搜索所有的回复都会显示援引来源,供用户溯源确认。
在此后的评测中,面对非时效性问题,ChatGPT还出现了数据错误等问题,可见在中文语料的丰富度上,国内搜索引擎厂商的确存在优势。
继续围绕淄博烧烤这个热点来“搞事情”。我们尝试让它用《定位》书中的经典理论给淄博烧烤出一个营销策划,没想到答案看上去还挺靠谱:
一通体验下来大概能感知到,“智脑”加持的360GPT版搜索不仅是传统搜索的加强版,能够在搜索体验上提升,包括Query的意图更清楚,给出的结果更精准等,它还能进行摘要概述、语法修正、润色语句、生成营销策划。
360为什么能搞GPT加持的“新搜索”
事实上,360能打造自己的大模型在外界看来可谓“水到渠成”。
综合而言,360具备发展大语言模型的诸多优势条件,如搜索基因、技术积淀、数据积累、工程化等。
OpenAI在大模型这条路上率先实现了0到1的突破,作为参数暴力美学的成功践行者,已经帮全世界的科技公司指明了技术方向。
中国公司不存在不可逾越的技术障碍,剩下的只是长期主义指导下的时间问题。
当然,谁能率先起跑,也要看“禀赋”。
大模型想要成功,除了技术路线要对,数据非常重要。用什么样的数据训练,直接决定了这个模型的知识能力。高质量的图书、期刊、论文语料不可或缺。
而搜索引擎公司恰巧有这个先天优势。360以自家搜索引擎为依托,每天可抓取数亿网页,在其中筛选出优质和垃圾内容。
与此同时,长期的问答板块能提供约6亿问答对,360从中筛取了三百万左右的训练语料,经过标注后供以训练。
再来看主观条件,这也是360能不能搞好自家GPT的重要取决因素——掌舵者的决心。
面对大模型今后发展的未知性,在AI大佬普遍分裂成的“GPT太危险,要暂停研究”和“虽然危险但脚步不能停”的呼吁声中,周鸿祎提出了第三种看法:不发展才是最大的不安全。
有了创始人和带队者的如此认知和决心,其后才有360版GPT的快速见面。
同时周鸿祎也对外传达了360做GPT的几点优势和机会:
- 第一, 360具有搜索引擎基因,有相关的技术积累,数据清洗、加工等工程化优势明显,公司团队拥有既往经验;
- 第二,360常年在C端积累的优质的标注语料积累,如前文提到的6亿问答对;
- 第三,场景优势,也就是360搜索、浏览器、安全卫士等国民级互联网产品所形成的流量优势,以及用户反馈优势。
不要只把GPT看作聊天机器人
3月29日大大方方抱着“刚出生的孩子”现场演示,到4月16日发布内测版新一代智能搜索产品,战略快速落地的背后是掌舵者对新技术、新浪潮的认知和判断。
在谈论GPT“是否拥有真正的智能”这个议题时,周鸿祎自称是坚定的“智能派”,他眼中的GPT,远不只是一个用巨量人类语言训练出来“填空机”。
体验GPT-3.5时,周鸿祎就认为GPT已经和人类一样拥有真正的智能。
认识智能体,不能局限在聊天机器人的浅层表现,真正强大的是聊天窗口背后的超级大脑,这“代表了一个超级人工智能时代的来临”。
与此同时,周鸿祎也深知,超级大脑加持下的AI一旦脱离应用场景,很容易曲高和寡,无法真正提升生产力。长远来讲,在产业化、工程化、场景化、产品化体验方面,GPT还有值得拓展探索的广袤空间。
东西做出来,还需寻求真实场景的落地应用。
试想,在未来一个产品不具备AI能力,基本上意味着要被淘汰。
在360给出的GPT“场景创新”蓝图上,最不言而喻的答案就是和搜索引擎的结合,如今我们已经看到了进入内测的落地产品;
其次,就是结合360浏览器、安全卫士等产品,为月活超5亿的用户提供个人助理能力,塑造360版的“贾维斯”;
再者,面向中小企业垂直SaaS化的应用,360计划推出智能办公产品,即“360智脑”赋能于企业的办公协作、营销、沟通等场景,以大模型能力为企业的生产力、创造力提效升级。
当然,360版GPT,不只是在To B和To C上寻求价值。
周鸿祎还表示,在360构建安全体系的几年间,积累了许多To G客户,根据政府部门和企业需要训练私有AI服务,即企业级GPT,是周本人同样看好的方向。
除此之外,在360优势的安全业务方面,360将效仿微软Copilot,推出360 Security Copilot,并与360GPT、智能应用组件结合,形成360GPT安全应用框架。
具体场景锚定,新的问题又出现,那就是商业闭环。
毕竟对于一家大公司来说,大谈理想和远见,不讲实处,终究像吸引目光的噱头,浮如空中楼阁。
周鸿祎在言谈间表示,可以大致描摹出一条与微软和OpenAI合作相同的道路,即一边在核心算法的技术层面投入资源,持续创新;另一方面让AI快速覆盖既有产品,快速产品化和商业化。
紧接着,在占据场景的优势下,同步发力核心算法技术。
“GPT商业成本很高。”基于这个公认事实,周鸿祎表示,没有商业闭环的GPT服务是做不下去的,哪怕是单纯往生成结果中塞广告的模式也未必能走得长远。
最后,他总结道:GPT未来的服务,很多都可能是收费的。
相比许多同台竞技者,360提出特色“两翼齐飞”战略,周鸿祎本人也坦然承认,360版GPT与GPT-4有2-3年差距。
不过,正如周鸿祎本人再三强调那样,面对这场刚刚开始的新工业革命,360版GPT还是婴儿,未来的路还很长。
面对大模型这一次历史性机遇,360自己也在拭目以待,自己能否迎来新一轮爆发。
- 把1个脑洞发展成1场顶会workshop,阿里妈妈只用了1年|直击NeurIPS’242024-12-16
- 直击CCAI大会:院士专家舌战激辩,20个AI案例C位出道,海淀无愧AI科技“梦工厂”2024-12-15
- ChatGPT搜索与Her打通了!搜索免费开放,居然还剧透明日直播主题2024-12-17
- 《2024年度AI十大趋势报告》发布:技术创新、产品洗牌、行业动态一文看尽2024-12-13