天问大模型再升级,不仅能“看”懂视频,更能快速实现小目标识别、场景关系理解
万象更新,共赢大模型新时代
允中 发自 凹非寺
量子位 | 公众号 QbitAI
时隔四个月,天问大模型再次升级。
最近“中国国际社会公共安全产品博览会”在北京中国国际展览中心开展。
依图科技以“天问大模型、智能新疆界”为主题,携最新的依图天问大模型4.5亮相本届安博会E1馆。
此次亮相的依图天问4.5,视频内容理解性能进一步提升,模型不仅能“看”懂视频,更能快速实现小目标识别、场景关系理解,在复杂场景下对目标细节的理解、精准布控能力大幅提升。
同时,支持基于无人机拍摄的小目标视频理解,能够在动态复杂的环境中实现快速响应和精准干预,极大地促进了城市交通管控和安全管理的智能化升级,为城市智能化管理提供了更高效、更准确的技术支持。
天问大模型还融合了自然语言与视觉搜索技术,可实现复杂语义理解与细微视频理解的深度结合。
以“用户”为主,深刻理解语境中的细微差别,快速实现对视频内容的的精细化检索。复杂语义理解的增强,可以解锁更多开放式的语义检索场景。基于自然语言的简单、便捷的交互体验,不仅提升了视频内容搜索效率,也显著加快了各类复杂业务的响应速度。
大模型落地应用的过程中,业务需求到算法任务编排的转换是关键环节。此次亮相的天问大模型4.5,正式发布小明智能体。
通过一句话的简单任务需求描述,小明智能体便可辅助自动拆解为多条件算法的布控任务,让组合算法的复杂编排从专家化迈向平民化。
在算法的训练及优化迭代方面,天问大模型4.5也进一步升级。
启动算法迭代训练最少正例样本数下降75%,在指标训练达到相同的效果前提下,总样本数据量大幅下降,算法迭代时间缩短到分钟级,实战水准的新算法上线时间缩短到天级。
这种算法的高效迭代能力对于应对突发事件等场景,提供了强大的支持与保障,使得城市管理决策更加智能化、灵活化。
天问赋能,万象新生
10月23日下午,依图在北京临空皇冠假日酒店举办2024依图业务战略发布会暨伙伴峰会。
依图表示,AI1.0时代,传统深度学习依赖训练数据量和场景覆盖度,数据获取难度大导致AI算法生产效率低,安防数智化挑战大。
AI进入2.0时代,跨领域的通用性和泛化性显著增强。基于自监督学习的大模型与多模态AI通过通用数据预训练和领域数据后训练驱动,可以实现跨领域智能,执行五花八门的任务。
AI 2.0技术革命,为行业数智化带来四大核心变化:
- 自学习与后训练:预训练+领域内微调,提高跨场景、跨领域的适应能力;长尾新算法从月级到天级,提升AI生产效率
- 情境理解与空间智能:在3D空间和4D时空中感知、定位、评估,全场景全要素感知;从基础安保防范
到生产作业的智慧管理与运营,AI解锁场景 - 多模态数据统一表征:跨模态数据融合、互检、交互,增强感知能力、带来交互革命;从“标签筛选”
到自然语言交互,提升交互体验 - Agent智能体:分析和理解因果关系,调用工具推理规划,从快思考到慢思考;从门槛高、落地难
到人人都是算法工程师,创新平民化。
在依图看来,AI安防2.0时代的最本质的特征是:长尾算法生产的边际成本逐渐趋近于0。
在AI2.0时代,依图的业务战略是:
- 选择场景,深耕行业垂类大模型:行业数智化 x AI2.0,场景解锁快、空间大;解决场景痛点和业务闭环,为用户创造价值
- 聚焦核心,优先和伙伴联合构建完整方案:依图聚焦提供类似PaaS的大模型平台和能力;行业Know How+业务闭环 +持续运营。
- 管用为王,打造极致性价比的AI产品:强调可落地 +“性价比”是规模应用的基础。
此外,依图万象品牌正式发布,且正式发布依图万象系列产品:
- 零样本生成算法 : 一句话生成算法, 将用户需求转成算法任务
- 自然语言编排组合算法:将复杂算法转为原子算法的组合
- 少样板现场调优:内置AI数据推荐,可现场算法调优
依图表示将致力于搭建一个开放、多元的合作平台,汇聚各方资源,增强市场竞争力,推动创新,共同应对挑战,实现互利共赢。
- 猫猫运动方程,首次被物理学家破解! |《美国物理学杂志》正经研究2024-11-18
- AI一键解析九大生物医学成像模式,用户只需文字prompt交互,微软UW等新研究登Nature Methods2024-11-21
- DeepSeek版o1炸场,数学代码超越OpenAI,每天免费玩50次,后续将开源2024-11-21
- 马斯克新官上任再起诉OpenAI!新证据称Ilya七年前就不放心奥特曼2024-11-16