多模态

“计算机视觉被GPT-4o终结了”(狗头)

GPT-4o原生多模态图像生成更多玩法被开发出来

梦晨 11小时前

仅1/70的数据量,多模态检索效果却更优! 智源发布BGE-VL,合成数据立大功

算法能够以极低成本持续生成多样化且高质量的多模态三元组

中科闻歌发布智川X-Agent平台、优雅音视频大模型更新

助力政企极速落地AI应用与创意灵感,让AI技术精细化满足真实业务场景,加速AI普惠落地。

明敏 2025-02-23

6天连发6模型,阶跃稳稳蝉联多模态卷王

视觉理解/视觉推理/语音/视频生成,通通来袭

值得买科技与人大高瓴人工智能学院首个多模态领域联合研究成果亮相CNCC2024

提升AIGC内容生成尤其是声音生成方面的质量和智能化水平

梦晨 2024-10-25

视觉模型底座超越OpenAI,格灵深瞳开启多模态落地的Scaling Law

从“A股AI视觉第一股“到”多模态落地先行者”

多模态大模型的多语种文字理解能力还有很长的路要走,字节、华科联合发布MTVQA Bench

期待后续多模态大模型的研究和发展更加关注多语种场景

梦晨 2024-06-21