多模态

GPT-4o能拼好乐高吗?首个多步空间推理评测基准:闭源模型领跑

多模态大模型的真实“空间智商”究竟如何

OPPO 旗舰新机 Find X8 Ultra 首发“一键闪记”,阶跃星辰多模态提供技术支持

只需拍一张图,小布助手就可以精准识别并理解图像中蕴含的信息

“计算机视觉被GPT-4o终结了”(狗头)

GPT-4o原生多模态图像生成更多玩法被开发出来

梦晨 2025-03-29

仅1/70的数据量,多模态检索效果却更优! 智源发布BGE-VL,合成数据立大功

算法能够以极低成本持续生成多样化且高质量的多模态三元组

中科闻歌发布智川X-Agent平台、优雅音视频大模型更新

助力政企极速落地AI应用与创意灵感,让AI技术精细化满足真实业务场景,加速AI普惠落地。

明敏 2025-02-23

6天连发6模型,阶跃稳稳蝉联多模态卷王

视觉理解/视觉推理/语音/视频生成,通通来袭

值得买科技与人大高瓴人工智能学院首个多模态领域联合研究成果亮相CNCC2024

提升AIGC内容生成尤其是声音生成方面的质量和智能化水平

梦晨 2024-10-25