Claude加速上新：基础版数学编程双提升，「幻觉」也更少，CEO：两三年内AI将成高知人类

西风 2023-08-10 14:49:53 来源：量子位

Claude Instant推出1.2版

西风发自凹非寺

量子位 | 公众号 QbitAI

“ChatGPT最强竞品”Claude基础版上新——

更轻、更快、价格只要Claude 2六分之一的Claude Instant推出1.2版本。

在这次更新中，官方提到基础版Claude Instant吸纳了高性能型号Claude 2的优势，编码、数学能力经测试比原来提升近六个百分点。

是加量不加价的感觉了（手动狗头）。

目前，全新Claude Instant 1.2已可申请通过API部署，一起来康康都做了哪些更新。

更快，更便宜

具体来说，Claude Instant 1.2在编码、推理等方面的能力有所提升。不仅能生成更长、结构更好的回复，还能更好地遵循格式化指令，在引用提取、多语言能力和问答方面也有了一些改进。

在Codex评估（编码性能测试）中，Claude Instant 1.2达到58.7%，而1.1版本为52.8%。

在GSM8K基准测试（数学能力测试）中，同样提高了近六个百分点，1.2版本得分为86.7%，1.1版本的得分为80.9%。

△Claude Instant 1.1和1.2的性能比较

此外，Claude Instant 1.2还提高了安全性，产生“幻觉”更少，对“越狱”的抵抗力更强。

△Claude不同模型安全性评估，越低越好

在上下文窗口长度上，Claude Instant 1.2与Claude 2相同，都是10万token，相当于75000个单词，差不多是一本《了不起的盖茨比》的长度。

再来看看买下这些功能要花多少钱，Claude Instant系列定价比Claude 2便宜，但都是分输入和输出两部分定价。

Claude Instant的Prompt定价是每100万token 1.63美元，Completion定价是每100万token 5.51美元：

挑战OpenAI

Claude背后公司为Anthropic，想必大家也不陌生了。

Anthropic由OpenAI前研究副总裁Dario Amodei带头于2021年成立。

离开OpenAI时，Dario Amodei可谓带走了一批核心人才，这里面就包括GPT-3首席工程师Tom Brown，也有OpenAI安全和政策副总裁Daniela Amodei（Dario的姐姐）。

眼下，Anthropic曾表示目标是建立一个“前沿模型”，会比当今最强的AI再强10倍，并认为这是“AI自学的下一代算法”（next-gen algorithm for AI self-teaching）。这个前沿模型可用于构建虚拟助手，回复电子邮件，进行研究，生成艺术品、书籍等。

目前Anthropic已融资14.5亿美元，但这还远远不够，他们预计未来两年内需要50亿美元用于AI研发。

最近Dario Amodei也公开表示：

让模型像一个受过良好教育的人，可能离我们并不遥远，我认为在两三年内就有可能实现。

外媒TechCrunch认为，Anthropic现在推出新版Claude Instant是为了与OpenAI以及Cohere、AI21 Labs等初创公司提供的类似基础产品竞争。

Anthropic目前拥有众多客户和合作伙伴，其中就包括“美国知乎”Quora。

虽然，Claude Instant 1.2目前只有API版本，但在Quora旗下的Poe.com上大家可以免费试用Claude Instant。

参考链接：
[1]https://twitter.com/karinanguyen_/status/1689318903670063104
[2]https://twitter.com/_akhaliq/status/1689334269137543173
[3]https://techcrunch.com/2023/08/09/anthropic-launches-improved-version-of-its-entry-level-llm/

西风

o3来了！编程能力跻身人类全球前200，破解陶哲轩说难的数学测试，北大校友任泓宇现身直播间2024-12-21
AI已经在直播间狂刷KPI了2024-12-20
AI风暴席卷达摩院青橙奖，六成获奖者用AI搞科研，平均年龄34岁2024-12-20
Kimi版o1实装上线，这里是我们的一手测试↑2024-12-16

Claude加速上新：基础版数学编程双提升，「幻觉」也更少，CEO：两三年内AI将成高知人类

更快，更便宜

挑战OpenAI

相关阅读

442个作者100页论文！谷歌耗时2年发布大模型新基准BIG-Bench | 开源

40亿美元！Anthropic再获亚马逊新投资，双方正合作开发AI芯片

「ChatGPT最强竞品」爆火：不限量不要钱免注册！一手实测体验在此

Claude编程支持一键共享，第一批网友已经开始晒作品了

套壳丑闻让斯坦福AI Lab主任怒了！抄袭团队2人甩锅1人失踪、前科经历被扒，网友：重新认识中国开源模型

Claude化身服务器连一切！AI代码自己发Github，程序员只配动嘴了

热门文章

开源Llama版o1来了，3B小模型反超80B，逆向工程复现OpenAI新Scaling Law

GPT-4o数学能力跑分直掉50%，上海AI Lab开始给大模型重新出题了

大模型是新的数据库！蚂蚁开源负责人王旭：应用开发新范式，新一代LAMP正在形成 | MEET 2025

宇树机器人强化学习代码全面开源，训练到仿真和实操手把手教学

腾讯版Sora开源后，被提速8倍！官方点赞并预告：下月上新图生视频