教育大模型迎来新玩家:十年深耕剑指智适应,25道题能测1000个知识点

按计划,将搭载在松鼠Ai已有学习机产品中。

白交 发自 凹非寺

量子位 | 公众号 QbitAI

新的一年,教育领域大模型,迎来新玩家。

来自松鼠Ai,十年教育领域躬身者,刚刚发布首个智适应教育大模型。

教育大模型迎来新玩家:十年深耕剑指智适应,25道题能测1000个知识点

据介绍,它可以实现纯文本外的更多任务支持,在知识获取、信息输入及传达信息等方面都具备更好的性能,同传统的大语言模型有着本质的不同。按计划,这一大模型将搭载在松鼠Ai已有学习机产品中。

与此同时,还有松鼠Ai牵头的IEEE AI教育大模型标准组(P3428)成立。第一批专家工作组包括北京师范大学黄荣怀教授、清华大学许斌教授、华东师范大学顾小清教授。

并且是松鼠Ai创始人兼董事长栗浩洋任该工作组主席,足以见其在行业的代表性。我们知道,行业标准一旦设立,大模型在教育领域的应用进一步得到规范,行业发展水平将提升到全新的水平。

过去一年,可以看到大模型在教育领域落地百花齐放。如今随着落地的深入,松鼠Ai的进展或许值得关注。

松鼠Ai智适应教育大模型

据介绍,整个松鼠Ai智适应教育大模型主要分为三层:底层的数据层、模型层、应用层,并由此体现了它的三大特点。

教育大模型迎来新玩家:十年深耕剑指智适应,25道题能测1000个知识点

首先是数据层面。

松鼠Ai在教育场景的多年积累,构成了丰富的底层数据层。包括全学科纳米级知识图谱、海量学习资料、视频讲解以及测评和题库,以及学生学习历史数据。

值得一提的是,此处学生学习历史数据是松鼠Ai过去积累的2400万学生100亿学习行为全流程,比如学习进度、学习效果、学习路径,甚至学习过程中发呆的时间都有记录。

有了个人学习数据,一方面可以对每个学生用户画像精准把握,另一方面了解了同龄学生学习的情况,也有助于对学科整体知识点的规划和安排。

这也就决定了松鼠Ai大模型同其他传统大语言模型,比如GPT系列,有着本质的不同,他们将更加个性化,针对学生学习情况对症下药。

然后在模型层,以往谈到大模型,无非有多模态、LLM、Agent这些技术和应用,但松鼠Ai此处结合大模型的知识图谱(KG)&检索增强生成 (RAG),却值得说道说道。

简单来说,结合大模型的KG和RAG增强技术能快速找到知识点和知识点之间,知识点和题目之间,题目和孩子能力之间的关系。

若给孩子练习的题目,其与知识点的关联更高,孩子学习效率也会更高。而不同的学生对知识点的掌握也有所不同,那么具体到哪一个知识点,就需要推送与该知识点强关联的题目。

栗浩洋给出了一个具象化的形容,目前他们能实现25道题测1000个知识点,而市面上最高也只能实现25道题100个知识点,并且还能具体拆解到每个解题步骤当中去进行逐步讲解。

教育大模型迎来新玩家:十年深耕剑指智适应,25道题能测1000个知识点

此外,栗浩洋还强调,但松鼠Ai的LAM(Large Adaptive Model)智适应大模型应用了MoE(Mixture of Experts)混合专家系统,通过将多个模型结合在一起,以获得更好的预测性能,同时降低模型的推理成本。

而在应用层,覆盖学习推荐、学习兴趣启发、习惯培养、情感干预、学习路径规划等多个场景。

比如在给学生提供辅导时,能够覆盖预习、复习、备考、作业辅导等多场景,并给予学生更多准确的回应与激励。

此外,还可以根据孩子在学习过程中反应,给予其正面的反馈与激励改善学生的情绪,帮助解决孩子的一些心理问题

可以说,其他大模型产品有的它有,没有的它也有。

如何评价?

总结来看,从数据到应用层,其实都围绕一个共同点:个性化。

再看产品功能上,松鼠Ai智适应教育大模型该有的功能都有,并且相较于大语言大模型,技术实现更为复杂。在应用场景上面,也更能把握学生个人的学习情况实现个性化应用。

至于为何能实现这样的效果,松鼠Ai的三大布局和选择值得关注:

纳米级知识拆分、MCM系统、大模型吞吐数据类型。

首先是纳米级知识点拆分。比如在数学场景中,单独针对「求加减法中的未知项」这一大知识点,就能拆分出「同分母分数两步方程-未知数为减数」、「异分母分数两步方程-未知数为加数」这种程度的知识点。

这就相当于在整个学习系统构建一个庞大的知识网络,这样能更精准地帮助学生定位学习情况,更精细的规划学习路经。

第二是MCM系统。第一个M是Model of thinking,就是思维模式,第二个C是Capacity,是学习能力,第三个M是Methodology,是学习方法论。MCM系统针对学习思维、能力、方法构建模型,这样能更科学地实时评价学生的学习状态和能力水平。

而负载了大模型能力之后,就能预测学生在未学过知识点上的能力水平、所花时间等,以推出个性化解决方案。

第三则是大模型吞吐数据类型不同。正如前文所述,数据类型更为复杂,大模型所能提供的能力更为多样。

说了那么多,其实不论是技术融合还是数据的选择,背后还有更为底层原因。

那就是智适应教育的选择,这也是整场发布会谈及最多的关键词。

什么是智适应教育?简单来说就是基于AI、大数据、物联网等技术,结合大量用户数据,针对个体学习过程差异提供适合的教育形式,以此实现个性化教育,做到因材施教。

当前包括培生教育、麦格劳希尔、Wiley、HMH这样的传统巨头也都在布局。

作为国内较早推行这一概念的企业,松鼠Ai早已开发出核心的智适应学习引擎架构。

据此前松鼠Ai联合创始人兼CEO周伟介绍,松鼠Ai智适应教育是用了三层式的架构,去构建知识地图、学习策略架构、内容地图、教学流程,进行数据的分析、推荐、算法,到最后形成完整的教学闭环。

随着大模型到来,实现个性化教育本身就是难得的契机,那么同智适应技术的融合也就成了应时之义。

按照松鼠Ai的理解,智适应技术全自动标准能按照自动驾驶那一套评价体系进行拆分。

教育大模型迎来新玩家:十年深耕剑指智适应,25道题能测1000个知识点

△智适应教育按智能化水平L1-L5分级图

栗浩洋认为,目前业内大多数主流玩家仍处于L2发展阶段。即根据学生学习情况,实现题目数据量智适应、题目难度智适应,也就是辅助驾驶。而他们在L5即完全自动驾驶阶段,已经实现40%的水平。

在谈及AI变革教育最终形态,他们最终目标是实现虚拟老师,有助于生成更多视频讲解,助力社会需求的创新人才培养。这样一来,在个性化教育追求的同时,真正实现了教育普惠。

至少现在来看,也并非那么遥不可及。

发布会上松鼠Ai介绍,2023年松鼠Ai已经完成2000家线下智能学习机门店业务布局,是全国零售店规模最大的AI学习机品牌之一。

而随着大模型进一步部署,上线在他们的学习机产品上,就能快速带来产业价值。

大模型给教育带来怎样的变革?

过去一年,大模型技术快速迭代,AI应用可能性不断拓宽。尤其教育领域,被认为是大模型最应该落地的场景之一。

教育大模型迎来新玩家:十年深耕剑指智适应,25道题能测1000个知识点

不少企业围绕着该场景进行布局,代表的有「可汗学院」推出的人工智能助教Khanmigo;多邻国推出的内嵌GPT-4的Duolingo Max。

总结来看,大模型落地教育主要有这样几条路径。

一种是类ChatGPT,在网页端/APP侧解决学生或老师的问题。大模型通过自然语言交互充当学习助手的角色。这在语言学习场景中最为常见,比如Duolingo、以及最近备受关注初创公司Speak。

另一种则是大模型部署在原有学习硬件之上。这种自带天然交互场景,也有用户和数据基础,应用迭代速度可能更快,但对技术要求更高,已有形态包括学习机、教育机器人、词典笔等。

百花齐放的发展现状之下,不难看出,硬件形态和软件功能容易千篇一律,并逐渐趋于同质化。

企业的创新本质还是得在于AI的赋能。这也是新一波技术浪潮企业保持竞争力的核心所在。一旦完成大模型部署,可以实现更多创新应用,用户数据带来的迭代速度更快,边际成本会逐渐降低。

不过在用户侧,除了对话这种显性功能外,大模型更多核心能力内嵌于产品中,比如根据用户习惯、学习进度制定学习计划等等,但用户往往在短时间内感知不到。

这也是当前教育场景一个主要挑战。

这就需要企业,一方面进行消费者教育,另一方面则是坚持长期且持续的技术投入,构筑企业壁垒,才能抵挡外界风云诡谲。等新技术来时结合已有场景快速利用,服务于用户。

有着近十年技术部署的松鼠Ai,就是一个范例。

不过最后不管大模型在教育怎么应用,总的方向已经确定。

那就是个性化教育、因材施教。

事实上这本身也是教育行业被广泛接受且一直以来想要实现的目标,早在上世纪八十年代,著名教育心理学家Benjamin Bloom在其教育实验中提出”two sigma”理论证明了其正确性——

接受一对一辅导的教学组平均表现要明显优于传统的1:30教学方式。

教育大模型迎来新玩家:十年深耕剑指智适应,25道题能测1000个知识点

如今大模型本身个性化的技术特性,也就给教育行业变革带来了全新的可能性。

毫无疑问的是,随着大模型布局的深入,更多细分标准的确立,教育行业发展已经来到了关键的历史节点。

版权所有,未经授权不得以任何形式转载及使用,违者必究。