天问大模型再升级，不仅能“看”懂视频，更能快速实现小目标识别、场景关系理解

西风 2024-10-24 13:03:25 来源：量子位

万象更新，共赢大模型新时代

允中发自凹非寺

量子位 | 公众号 QbitAI

时隔四个月，天问大模型再次升级。

最近“中国国际社会公共安全产品博览会”在北京中国国际展览中心开展。

依图科技以“天问大模型、智能新疆界”为主题，携最新的依图天问大模型4.5亮相本届安博会E1馆。

此次亮相的依图天问4.5，视频内容理解性能进一步提升，模型不仅能“看”懂视频，更能快速实现小目标识别、场景关系理解，在复杂场景下对目标细节的理解、精准布控能力大幅提升。

同时，支持基于无人机拍摄的小目标视频理解，能够在动态复杂的环境中实现快速响应和精准干预，极大地促进了城市交通管控和安全管理的智能化升级，为城市智能化管理提供了更高效、更准确的技术支持。

天问大模型还融合了自然语言与视觉搜索技术，可实现复杂语义理解与细微视频理解的深度结合。

以“用户”为主，深刻理解语境中的细微差别，快速实现对视频内容的的精细化检索。复杂语义理解的增强，可以解锁更多开放式的语义检索场景。基于自然语言的简单、便捷的交互体验，不仅提升了视频内容搜索效率，也显著加快了各类复杂业务的响应速度。

大模型落地应用的过程中，业务需求到算法任务编排的转换是关键环节。此次亮相的天问大模型4.5，正式发布小明智能体。

通过一句话的简单任务需求描述，小明智能体便可辅助自动拆解为多条件算法的布控任务，让组合算法的复杂编排从专家化迈向平民化。

在算法的训练及优化迭代方面，天问大模型4.5也进一步升级。

启动算法迭代训练最少正例样本数下降75%，在指标训练达到相同的效果前提下，总样本数据量大幅下降，算法迭代时间缩短到分钟级，实战水准的新算法上线时间缩短到天级。

这种算法的高效迭代能力对于应对突发事件等场景，提供了强大的支持与保障，使得城市管理决策更加智能化、灵活化。

天问赋能，万象新生

10月23日下午，依图在北京临空皇冠假日酒店举办2024依图业务战略发布会暨伙伴峰会。

依图表示，AI1.0时代，传统深度学习依赖训练数据量和场景覆盖度，数据获取难度大导致AI算法生产效率低，安防数智化挑战大。

AI进入2.0时代，跨领域的通用性和泛化性显著增强。基于自监督学习的大模型与多模态AI通过通用数据预训练和领域数据后训练驱动，可以实现跨领域智能，执行五花八门的任务。

AI 2.0技术革命，为行业数智化带来四大核心变化：

在依图看来，AI安防2.0时代的最本质的特征是：长尾算法生产的边际成本逐渐趋近于0。

在AI2.0时代，依图的业务战略是：

此外，依图万象品牌正式发布，且正式发布依图万象系列产品：

依图表示将致力于搭建一个开放、多元的合作平台，汇聚各方资源，增强市场竞争力，推动创新，共同应对挑战，实现互利共赢。