天问大模型再升级,不仅能“看”懂视频,更能快速实现小目标识别、场景关系理解

万象更新,共赢大模型新时代

允中 发自 凹非寺

量子位 | 公众号 QbitAI

时隔四个月,天问大模型再次升级。

最近“中国国际社会公共安全产品博览会”在北京中国国际展览中心开展。

依图科技以“天问大模型、智能新疆界”为主题,携最新的依图天问大模型4.5亮相本届安博会E1馆。

天问大模型再升级,不仅能“看”懂视频,更能快速实现小目标识别、场景关系理解

此次亮相的依图天问4.5,视频内容理解性能进一步提升,模型不仅能“看”懂视频,更能快速实现小目标识别、场景关系理解,在复杂场景下对目标细节的理解、精准布控能力大幅提升。

同时,支持基于无人机拍摄的小目标视频理解,能够在动态复杂的环境中实现快速响应和精准干预,极大地促进了城市交通管控和安全管理的智能化升级,为城市智能化管理提供了更高效、更准确的技术支持。

天问大模型还融合了自然语言与视觉搜索技术,可实现复杂语义理解与细微视频理解的深度结合。

以“用户”为主,深刻理解语境中的细微差别,快速实现对视频内容的的精细化检索。复杂语义理解的增强,可以解锁更多开放式的语义检索场景。基于自然语言的简单、便捷的交互体验,不仅提升了视频内容搜索效率,也显著加快了各类复杂业务的响应速度。

天问大模型再升级,不仅能“看”懂视频,更能快速实现小目标识别、场景关系理解

大模型落地应用的过程中,业务需求到算法任务编排的转换是关键环节。此次亮相的天问大模型4.5,正式发布小明智能体。

通过一句话的简单任务需求描述,小明智能体便可辅助自动拆解为多条件算法的布控任务,让组合算法的复杂编排从专家化迈向平民化。

在算法的训练及优化迭代方面,天问大模型4.5也进一步升级。

启动算法迭代训练最少正例样本数下降75%,在指标训练达到相同的效果前提下,总样本数据量大幅下降,算法迭代时间缩短到分钟级,实战水准的新算法上线时间缩短到天级。

这种算法的高效迭代能力对于应对突发事件等场景,提供了强大的支持与保障,使得城市管理决策更加智能化、灵活化。

天问赋能,万象新生

10月23日下午,依图在北京临空皇冠假日酒店举办2024依图业务战略发布会暨伙伴峰会。

依图表示,AI1.0时代,传统深度学习依赖训练数据量和场景覆盖度,数据获取难度大导致AI算法生产效率低,安防数智化挑战大。

AI进入2.0时代,跨领域的通用性和泛化性显著增强。基于自监督学习的大模型与多模态AI通过通用数据预训练和领域数据后训练驱动,可以实现跨领域智能,执行五花八门的任务。

AI 2.0技术革命,为行业数智化带来四大核心变化:

  • 自学习与后训练:预训练+领域内微调,提高跨场景、跨领域的适应能力;长尾新算法从月级到天级,提升AI生产效率
  • 情境理解与空间智能:在3D空间和4D时空中感知、定位、评估,全场景全要素感知;从基础安保防范
    到生产作业的智慧管理与运营,AI解锁场景
  • 多模态数据统一表征:跨模态数据融合、互检、交互,增强感知能力、带来交互革命;从“标签筛选”
    到自然语言交互,提升交互体验
  • Agent智能体:分析和理解因果关系,调用工具推理规划,从快思考到慢思考;从门槛高、落地难
    到人人都是算法工程师,创新平民化。

在依图看来,AI安防2.0时代的最本质的特征是:长尾算法生产的边际成本逐渐趋近于0。

天问大模型再升级,不仅能“看”懂视频,更能快速实现小目标识别、场景关系理解

在AI2.0时代,依图的业务战略是:

  • 选择场景,深耕行业垂类大模型:行业数智化 x AI2.0,场景解锁快、空间大;解决场景痛点和业务闭环,为用户创造价值
  • 聚焦核心,优先和伙伴联合构建完整方案:依图聚焦提供类似PaaS的大模型平台和能力;行业Know How+业务闭环 +持续运营。
  • 管用为王,打造极致性价比的AI产品:强调可落地 +“性价比”是规模应用的基础。
天问大模型再升级,不仅能“看”懂视频,更能快速实现小目标识别、场景关系理解

此外,依图万象品牌正式发布,且正式发布依图万象系列产品:

  • 零样本生成算法 : 一句话生成算法, 将用户需求转成算法任务
  • 自然语言编排组合算法:将复杂算法转为原子算法的组合
  • 少样板现场调优:内置AI数据推荐,可现场算法调优

依图表示将致力于搭建一个开放、多元的合作平台,汇聚各方资源,增强市场竞争力,推动创新,共同应对挑战,实现互利共赢。

版权所有,未经授权不得以任何形式转载及使用,违者必究。