Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

白交 2024-02-21 16:17:06 来源：量子位

谷歌の“反击”来了

白交发自凹非寺

量子位 | 公众号 QbitAI

谷歌の“反击”来了！

Gemini被Sora抢走的风头，现在有抢回来的势头了。

在最新实测中，Gemini 1.5能分析Sora视频是否AI生成。

是直接给出当中关键因素的那种。

比如这个经典的猫猫视频，Gemini 1.5直言：

它的眼睛和毛都看起来都不像是真的。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

还有像这段生成视频，Gemini 1.5都能说出个一二三造假细节来~

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

都说魔法打败魔法，结果Sora发布这才没几天，就火速被Gemini 1.5“抓出现行”。

对于Gemini 1.5第一波实测结果，网友直呼：that’s scary good，并称其为“游戏规则的改变者”。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

Gemini 1.5第一波实测来了

Gemini 1.5版本突然发布，结果被对面Sora的光芒所掩盖。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

但即便如此，其模型性能的重大升级，尤其是支持100万token上下文窗口，仍让网友们印象深刻。

现在一些博主陆陆续续地拿到了访问资格，开始了第一波实测。

除了能鉴别生成视频真假之外，还有这些令人印象深刻的功能。

1、分解并理解长视频。

比如一场14分钟的NBA扣篮视频，Gemini 1.5能判断出哪个扣篮得分最高，并给出其中扣篮细节。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

整个响应过程大致只需要55秒左右。

2、理解长文本内容，进行比较分析。

博主投喂了《星际穿越》和《星际探索》两个完整的电影脚本，合起来接近10万tokens，要求Gemini 1.5分析比较，以帮助决定观看哪部电影为好。

结果只需三十几秒，就给出了完整详尽的分析报告。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

这样一看，分析其中的剧情台词也就显得小儿科了。

（分析电影中最鼓舞人心的三句话）

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

3、翻译小语种。

即便是那种只有2000人左右使用的语言也能搞定，比如将英语翻译成萨特兰语。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

除此之外，还有像分析理解论文中表格的细节。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

对于这波实测，网友们都表示惊叹：这是个巨大进步，想说可能得等GPT-5来对抗。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

尤其是能处理100万Tokens上下文，这对GenAI初创公司很有用。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

还有网友好奇谷歌是怎么解决上下文窗口大小问题的？

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

一定是发现或实现了什么新东西。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

网友：不太可能是巧合

不过对于谷歌这波“反击”，暂且还未有OpenAI的人出来回应。而此前Sora的发布，也少见有谷歌的人出来评价。

但两家同一天发布，早就有网友浮想联翩：

确实不太可能是巧合。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

奥特曼不想失去谷歌这样一个绝妙的炒作时机。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

有网友认为，Sora宣布显然是一种营销举措，它还没有准备好。相比而言，Gemini 1.5 才是真正的突破。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

但也有人认为，Sora才真正意想不到。

Gemini 1.5 非常棒，但并不令人惊讶。

我非常有信心 OpenAI 内部也有超过 100 万个模型。（Sora是一个副项目）。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

并且认为GPT-5出来之后，会击败所有的竞争对手。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

对于两家这样的操作，你怎么看呢？

One More Thing

两家激战，受伤的是Adobe这类聚光灯之外的玩家。

Gemini 1.5实测：我看Sora一眼假；还有更多惊艳功能

这两天股价简直是一跌再跌……

而此前备受关注的视频生成公司Runway，其联合创始人回应：游戏开始了。

值得一提的是，此次国内反应跟ChatGPT那时候有点不一样。

Sora出来之后，少见喊对标的人，比当时要安静多了…

参考链接：
https://twitter.com/rowancheung/status/1759280384930459941

版权所有，未经授权不得以任何形式转载及使用，违者必究。

Gemini 大模型谷歌

相关阅读

又一家科技公司宣布永久居家办公计划，「新冠纪元」真的来了？

既Facebook、Twitter、谷歌宣布可在家办公之后，富士通今天也宣布了永久居家办公计划

白交2020-07-07

Facebook Twitter 在家办公富士通疫情谷歌

保护大模型应用安全，现在不需要拿性能做代价了 | 最“in”大模型

LLM 与 TEE 的融合

十三2023-08-07

CPU 大模型英特尔

修Bug哪家强？谷歌：Linux，比我都修得好

谷歌最新报告：各家修Bug都越修越快，但我们倒退了

博雯2022-02-20

bug iOS linux 安卓谷歌

比AlphaFold2快一个数量级！蛋白质通用大模型来了，13个任务取得SOTA丨百图生科&清华

首个千亿参数蛋白质大模型

萧箫2023-07-08

大模型百图生科蛋白质

大模型挑选指南来了！涵盖六种情况下的选择方案，为你匹配最佳模型｜来自沃顿商学院教授

众多大模型该如何挑选？

西风2023-07-19

AIGC 大模型指南

谷歌推网页爬虫新标准，开源robots.txt解析器

来自谷歌的生日礼包

鱼羊2019-07-03

REP 谷歌

热门文章

数学家们仍在追赶天才拉马努金

7×24小时非人类科学家入场：当AI开始自主探索科学未知领域 | 多伦多大学

全栈AI基础设施支撑，跑出全球首个开放使用视频生成DiT模型

蔚来李斌：一年减少了数十亿英伟达芯片采购

不到2年，AI PPT赛道第一！像素绽放CEO赵充：今年是AI应用创业最佳时期 | 中国AIGC产业峰会