Claude加速上新:基础版数学编程双提升,「幻觉」也更少,CEO:两三年内AI将成高知人类
Claude Instant推出1.2版
西风 发自 凹非寺
量子位 | 公众号 QbitAI
“ChatGPT最强竞品”Claude基础版上新——
更轻、更快、价格只要Claude 2六分之一的Claude Instant推出1.2版本。
在这次更新中,官方提到基础版Claude Instant吸纳了高性能型号Claude 2的优势,编码、数学能力经测试比原来提升近六个百分点。
是加量不加价的感觉了(手动狗头)。
目前,全新Claude Instant 1.2已可申请通过API部署,一起来康康都做了哪些更新。
更快,更便宜
具体来说,Claude Instant 1.2在编码、推理等方面的能力有所提升。不仅能生成更长、结构更好的回复,还能更好地遵循格式化指令,在引用提取、多语言能力和问答方面也有了一些改进。
在Codex评估(编码性能测试)中,Claude Instant 1.2达到58.7%,而1.1版本为52.8%。
在GSM8K基准测试(数学能力测试)中,同样提高了近六个百分点,1.2版本得分为86.7%,1.1版本的得分为80.9%。
此外,Claude Instant 1.2还提高了安全性,产生“幻觉”更少,对“越狱”的抵抗力更强。
在上下文窗口长度上,Claude Instant 1.2与Claude 2相同,都是10万token,相当于75000个单词,差不多是一本《了不起的盖茨比》的长度。
再来看看买下这些功能要花多少钱,Claude Instant系列定价比Claude 2便宜,但都是分输入和输出两部分定价。
Claude Instant的Prompt定价是每100万token 1.63美元,Completion定价是每100万token 5.51美元:
挑战OpenAI
Claude背后公司为Anthropic,想必大家也不陌生了。
Anthropic由OpenAI前研究副总裁Dario Amodei带头于2021年成立。
离开OpenAI时,Dario Amodei可谓带走了一批核心人才,这里面就包括GPT-3首席工程师Tom Brown,也有OpenAI安全和政策副总裁Daniela Amodei(Dario的姐姐)。
眼下,Anthropic曾表示目标是建立一个“前沿模型”,会比当今最强的AI再强10倍,并认为这是“AI自学的下一代算法”(next-gen algorithm for AI self-teaching)。这个前沿模型可用于构建虚拟助手,回复电子邮件,进行研究,生成艺术品、书籍等。
目前Anthropic已融资14.5亿美元,但这还远远不够,他们预计未来两年内需要50亿美元用于AI研发。
最近Dario Amodei也公开表示:
让模型像一个受过良好教育的人,可能离我们并不遥远,我认为在两三年内就有可能实现。
外媒TechCrunch认为,Anthropic现在推出新版Claude Instant是为了与OpenAI以及Cohere、AI21 Labs等初创公司提供的类似基础产品竞争。
Anthropic目前拥有众多客户和合作伙伴,其中就包括“美国知乎”Quora。
虽然,Claude Instant 1.2目前只有API版本,但在Quora旗下的Poe.com上大家可以免费试用Claude Instant。
参考链接:
[1]https://twitter.com/karinanguyen_/status/1689318903670063104
[2]https://twitter.com/_akhaliq/status/1689334269137543173
[3]https://techcrunch.com/2023/08/09/anthropic-launches-improved-version-of-its-entry-level-llm/
- o3来了!编程能力跻身人类全球前200,破解陶哲轩说难的数学测试,北大校友任泓宇现身直播间2024-12-21
- AI已经在直播间狂刷KPI了2024-12-20
- AI风暴席卷达摩院青橙奖,六成获奖者用AI搞科研,平均年龄34岁2024-12-20
- Kimi版o1实装上线,这里是我们的一手测试↑2024-12-16