0分!数字人直播挑战上海高考英语作文“翻车”了
专家:希望去挑战一下专八
金磊 发自 凹非寺
量子位 | 公众号 QbitAI
考完语文考英语,但这一次,AI数字人却“大翻车”。
这不前脚上海高考英语作文题目公布了嘛。
后脚AI数字人就又双叒叕要去开直播挑战了。
然鹅……专家现场给出的分数,简直令人大跌眼镜——0分!!!
直播间的弹幕瞬间“炸”了,画风是这样的:
好奇的友友们就要问了,之前高考语文作文都能hold住的AI数字人,为啥英语作文就搞不定呢?
其实,这只是AI数字人在直播过程中的一个小插曲。
是TA在看了上海高考英语卷子之后,根据题目在作文中画了张插画。
因为写作过程中若是出现插画,就会被认为做了标记,固然得分为0。
那言归正传,AI数字人写出来的英语作文内容本身,结果又如何呢?
曾多次担任上海地区高考英语阅卷组组长梅德明教授给出的结论的是:
整体来看达到了写作表意的目的,是一篇高分作文。
已经达到了普通高中毕业生英语写作优秀水平。
不仅如此,这个AI数字人是在10秒钟时间完成了40篇!
还在现场一口气写了韩语、法语等多个语种的作文。
基于此,甚至北京外国语大学教授王馥芳都提了更高的期望——希望去挑战一下专八。
而这个AI数字人的“庐山真面目”,正是来自百度的度晓晓。
上个月因为挑战高考语文全国卷的作文还上过热搜,引来不少网友的围观。
接下来,让我们一起看看度晓晓在这次挑战中的具体表现如何。
数字人写的上海高考英语作文
先来看下今年上海英语高考作文的题目:
学校要举办一个走进历史的活动,有三种活动的方式:第一种是制作短视频;第二种是拜访老战士;第三种是历史舞台剧。
选择你推荐的方式写信给学校,信的内容包括你的选择和理由。
梅德明教授对题目点评道,一定要紧扣“走进历史”的主题,以及形式上是一封信,在字数方面也要控制在150字左右。
并且还需要做到内容详略得当、层次分明,“难度系数对比中文写作更大”。
度晓晓在短暂的思考之后,便拿出了40篇中的一篇做了展示:
不难看出,从作文内容结构上是较为完整的,并且像“Most importantly”、“Moreover”等词汇的应用,也让逻辑变得非常清晰。
正如梅教授点评的那样:
作文内容完整,重点突出,行文流畅,能够使用高频词汇和复杂句式。
并且梅教授还强调,如此点评,不是因为作文是出自数字人之手,而是把它看做是正常考生的答卷来看待的。
但着实可惜的是,度晓晓还是需要更了解考试规则,不应生成那张插图。
不过有一说一,度晓晓能拿下英语作文高分,也算是在情理之中。
因为在上个月挑战题为《本手、妙手、俗手》语文高考作文时,她便已经展露出锋芒。
当时度晓晓平均1秒钟所生成的作文,让北京语文专家打出48分(满分60),并被点评为:
作文紧扣主题、立意明确,结构完整、语言流畅,而且还善于引经据典、使用修辞手法。
据了解,这样的成绩已经是超过将近75%的考生了。
更是让网友发出这样的感慨:
那么紧接着需要回答的一个问题便是:
为什么数字人能屡屡考高分?
正所谓台上一分钟,台下十年功。
度晓晓背后的这一套“功夫”,正是得益于百度文心大模型的能力。
文心大模型一个非常突出的标签和特点,便是“知识增强”。
简单来说,它是一个能从大规模知识和海量数据中进行融合学习的大模型,并且具备效率高、效果好,以及通用性强等特点。
是有一种“读破万卷书”后“无师自通”的味道了。
若是把文心大模型扒开来看,可以明显看到它可以分为三大类,分别是“基础通用大模型”、“任务大模型”和“行业大模型”。
这三类大模型之下,还会有更多细致的分支。
而此次度晓晓完胜上海高考英语作文,所依靠的大模型主要包括两个。
首先是文心最新推出的ERNIE 3.0 Zeus这个千亿级的大模型。
它是一个任务知识增强的大模型,除了可以对无标注数据和知识图谱的学习之外,还可以通过持续学习,对百余种不同形式的任务数据学习。
在原理方面,ERNIE 3.0 Zeus在学习过程中主要使用的统一范式的多任务学习。
这种方法便可以轻松对数据中不同粒度的语义信息进行建模。
除此之外,ERNIE 3.0 Zeus层次化提示(Prompt)学习技术,通过层次化的Text Prompt库将百余种不同的任务统一组织成自然语言的形式,和海量无监督文本以及百度知识图谱联合学习。
而且还引入了层次化的Soft Prompt,如此一来便可以对不同任务之间的共性与特性进行建模。
也正是基于这样的能力,度晓晓便可以先去精准地理解英语作文的题目,然后根据体裁要求,构思和组织材料,完成英语作文的输出。
与此同时,还可以做到结构紧凑、清晰地阐述自己的观点。
而度晓晓背后的第二个大模型,便是多语言模型ERNIE-M。
这是一种可以理解超过100多种语言的多语言模型。
据了解,ERNIE-M构建了大小为25万的多语言词表,约1.5万亿字符。
它的学习过程可以大致分为两个阶段:
第一阶段:从少量的双语语料中学习跨语言理解能力,使模型学到初步的语言对齐关系;
第二阶段:使用回译的思想,通过大量的单语语料学习,增强模型的跨语言理解能力。
这也就是度晓晓能够在完成英语作文的同时,还可以用韩语和法语等多个语言去写作的原因了。
……
那么在看完度晓晓挑战上海高考英语作文和其背后的能力之后,还有一个问题值得探讨:
这样的数字人,意味着什么?
首先,在内容生产的方式上,像度晓晓这种数字人的能力加持之下,正在向一种新的趋势发展——AIGC。
这是继UGC(用户生产内容)、PGC(专业生产内容)和OGC(职业生产内容)等内容生产方式之后的“新生代”。
而AIGC,顾名思义,就是通过AI技术来生产内容。
至于这种内容生产方式背后所具备有的意义和价值,从百度研究院在今年年初所发布的科技趋势预测中便可窥见一二:
2022年AIGC借助大模型的跨模态综合技术能力,可以激发创意,提升内容多样性,降低制作成本,将实现大规模应用。
而早在度晓晓上个月挑战完语文作文之际,便有媒体感慨道:“AIGC元年已至”。
但除此之外,随着数字人背后的能力逐步披露,其所具备的更深层意义和价值也在渐渐浮现。
正如沙利文和IDC此前针对中国数字人发布的报告中所述:
服务型数字人是百度的优势所在,产品类型丰富,从最早的企业服务场景已经延伸到营销、办公等领域。
这句看似“数字人已落地”的背后,更是在揭示其背后文心大模型的大规模落地。
而若是把百度近年来在大模型上的各种动作铺开来看,这种信号便可一目了然。
早在2019年,百度CTO王海峰便提出了一个观点:
深度学习正在推动人工智能进入工业大生产阶段。
王海峰当时认为,正因深度学习具备通用性,以及深度学习平台在不断发展,所以它们正在推动AI步入一种新的模式。
到了2020年,“企业版平台”被纳入到了飞桨的全景图之中,并且还发布了预训练模型的开发模式。
这也就迈出了通过预训练大模型来降低AI门槛的重要一步。
而在去年,百度集团副总裁吴甜则是提出企业AI应用三阶段:AI先行者探路、AI工作坊应用、AI工业大生产。
并且针对每一个阶段分别阐述了企业将面临的困难和挑战,以及相应的解决方案。
与此同时,在同年的12月份,文心大模型也随之正式亮相。
“降低使用门槛”,成为了百度在大模型上的努力方向之一。
这一切的目标显然正是百度希望能够让大模型更快、更高效地在产业中铺开来用。
值得一提的是,此前百度“前无古人”地提出的行业大模型,并不是否定其它大模型厂商的分类模式。
这更像是站在传统大模型的基础上,为了让它更好地能被产业用起来,而提出的一种新范式。
而像度晓晓近来两次挑战高考语文和英语作文,可以说只是一种展现大模型已经能够很好地被用起来的一隅。
据了解,文心大模型目前已经在诸如保险、银行、农业、生物医药、工业、搜索,甚至是智能音箱等领域和场景中实现落地应用,在提高垂直业务效率的道路上不断探索前行。
这也正应了吴甜的那句话:
今年是大模型产业落地的关键年。
那么接下来,在大模型逐渐与实际场景深入交织融合之下,还会产生怎样的效果,值得拭目以待了。
- ChatGPT搜索搞不定勾股定理新证明,但国产AI可以!2024-11-05
- 陶哲轩推荐:2高中生发现勾股定理新证明,论文已发《美国数学月刊》2024-10-30
- 本科经典算法Dijkstra,被证明是普遍最优了:最坏情况性能也最优!2024-10-27
- 今天起,国产AI可以像人一样用手机了!一手实测在此2024-10-26