百度的云智一体,让视频变得“硬核性感”
百度智能视频云3.0全景图重磅发布
金磊 发自 凹非寺
量子位 报道 | 公众号 QbitAI
这是一个视频无处不在的大时代。
-
娱乐,靠视频。
-
学习,看视频。
-
甚至图文工作,也在视频化。
-
……
视频,已然逐步成为了信息传递的主要载体和介质。
如果非要给它加一个定语,那或许应该就是“硬核性感”。
(咳咳,不是“你以为你以为的就是你以为”的那种性感。)
为什么?又该如何走?
视频,应该走“硬核性感”路线
全视频时代之下,各行业对视频有了一个新的需求,主要体现在体验、应用和效能三方面。
整体来看,这种需求的升级,归结为一句话便是:
视频技术要够硬核,视频体验要够性感。
从直观感受角度,视频的“硬核性感”应该是怎样的?
首先,是体验超清化。
简而言之,就是将低清视频转超清,卡顿变流畅。
例如人人都爱的经典老电影,若是用更清晰的方式打开,岂不美哉?
利用去噪、去划痕等技术,便可以实现让经典超清再现。
除此之外,SDR向HDR的过渡,可以让视频细节展现的更加丰富。
包括色泽、光线、光感等,让体验沉浸化。
最后,则是理解+分析+生成+交互智能化。
这种“硬核性感”的背后,体现出的实则是视频的智能。
而归结智能的背后,则是AI与云计算不断发展所带来的驱动力。
“硬核性感”,也是需要实力的
在智能视频时代下,体验超清化、体验沉浸化、分析智能化,这是偏向消费者的新需求。
而面向视频产业,随即而来的新难题则是海量视频采集接入、数据分析、视频处理存储等。
此局又该如何破解?
云智一体,了解一下。
云,顾名思义,不仅是指云计算这个强有力的输出载体,还包括云边端一体技术,能够保障视频的高扩展、高稳定、高性能、高效率。
智,则是智能视频云中的AI技术,可以通过视频中的图像、人物、声音等信息进行多模态分析和理解,实现视频的智能理解分析、生产与交互生成。
云智一体,是百度智能云的独特竞争优势,也是百度智能视频云3.0“全景图”中的关键核心。
整体来看,此次升级的百度智能视频云3.0,包含三大方面,即一个一体化、两个平台和三大场景。
△百度智能视频云3.0全景图
先来看看应用到视频领域,“云”和“智”分别担任何种角色?
在云方面,云边端一体的基础技术架构,是此次智能视频云3.0的底座。
在此基础之上,云能力的输出体现在了五大方面:
视频转码处理:自研的BD265编码器,可以通过深度学习网络来提取视频特征,从而生成自适应编码参数;具有60多种优化算法,使码率节省30%、速度提升2倍。
实时音视频通讯:也是基于自研的多种算法,实现超低延时的交互体验。
低延时直播:则采用的是全链路SRT协议技术,并与mpegTS封装结合,千万级的并发直播也能hold得住。
内容分发加速CDN:在全球范围内,拥有1000多个节点,带宽存储达到了100T之多,提高了视频分发体验和效率。
智能视频SDK:针对视频的不同场景提供All in one的矩阵能力,涵盖视频特效、短视频、互动直播、播放器、增强超分等。
而在云的基础之上,智的能力让视频变得更加“聪明”。
以视频理解分析为例,百度拥有业界最大的多元异构知识图谱,量级达到了5500亿。
通过这样的知识图谱能力,可以根据视频中人物、场景等特征,更好地理解其背后所蕴含的知识,从而提高了视频编目的效率,也在视频分析、审核、检索等方面得到了广泛应用。
再如视频生产方面,也是基于知识图谱的能力,可以根据已有的图文咨询、数据等内容进行向短视频的转换;也可以理解事件的脉络,生成新的视频内容。
还有在视频交互与生成方面,可以根据元学习-迁移学习的视频生成技术,按照需求快速定制不同风格的高质量视频;也可以低成本生成虚拟人物形象进行交互。
例如今年两会期间担任直播主持的“小C”,虽说是个虚拟人,但不难看出,发丝、肌肤毛孔等细节清晰可见。
不仅如此,“小C”与参会人员还进行了实时顺畅的独家对话,为采访增添了不少的趣味性。
△数字人虚拟主播“小C”
OK,视频硬核的能力有了,接下来的一个问题,便是如何用起来?
这就是此次全景图中的所涵盖的两个平台:视频创作分发平台和视联网感知平台。
视频创作分发平台,是百度智能云的音视频统一入口,所涵盖的服务包括音视频上传存储、生产处理、媒资管理等。
例如在泛互联网应用场景中,内容和用户是两大核心要素,通过视频创作分化平台,内容创作者可以轻松降低码率、提升画质,而且分发方面还是低成本的那种。
而视联网感知平台,将全场景深度理解视频、优化视频质量等服务接入进来,满足产业对安全生产、视频监控等需求。
例如在产业界,往往需要将业务对接系统和数据进行平台化处理,而通过视联网感知平台具有通过信息获取对多种业务进行决策的特性,可以通过EasyDL算子生产技术,与云边端深度融合,让平台形成模块化,并开放接口服务,实现快速对接构建。
由此可见,智能视频所体现出的“硬核性感”,靠的便是背后云智一体的强实力,以及平台化的便捷、全面。
哪里来的底气?
在百度智能视频云的这张全景图中,还涉及到一层,便是三大场景:
泛互联网:点播/直播、编解码优化、推荐/搜索
广电媒体:策/采/编/发、媒资管理、营销
政企/工业/交通:会议培训、安全生产、智慧园区/交通
不难看出,所涉及的场景,近乎是视频能够涉足的所有领域。
真实落地的应用案例正是写照。
例如百度智能云与央视网合作打造的“人工智能编辑部”,以新闻视频智能媒资建设作为切入口,不仅完成了超过200万小时的视频结构化处理,还打造了统一的媒体AI中台,能够根据不同业务场景生产岀不同的新闻内容。
宜昌市点军区积极拥抱人工智能、视联网与物联网,在百度智能视频云的参与和助力下,在公共卫生、乡村振兴、基层医疗、环境保护等方面为民生带来更多便捷、智能的服务,让百姓有安全感、获得感、幸福感。
杭州星犀科技有限公司联合百度智能视频云为零售直播进行数字化智能化赋能,通过百度智能视频云PaaS能力与云犀直播SaaS应用的的结合,解决零售品牌自播执行门槛高、门店直播运营力缺乏的关键问题。
众所周知,视频所涵盖的形式、结构、内容纷繁多杂,要想吃下这块“大饼”,定是需要精通十八般武艺之大能。
而除了自身因素,还有外界条件。
单是在短视频领域,抖音、快手的迅速崛起,就让视频市场的竞争变得格外激烈。
在这种“两面夹击”的冲击之下,百度此次在视频中的举动,不免让人产生一个疑问:
哪里来的底气?
在今年百度赴港二次上市之际,对其自身所具备的AI能力,灼识咨询报告中总结道:
百度是迄今唯一已开发全栈AI能力(从芯片设计到深度学习框架及应用层面AI能力)的中国公司。
同时,百度持有最多中国AI专利申请,按开发者数目计,百度AI开放平台于中国排名第一。
云计算方面,全球权威咨询机构IDC的报告中显示,百度智能云在整体调用量、市场份额方面均名列第一。
再具体到视频领域,国际比赛获奖情况也是“拿到手软”。
例如智感超清方面,在计算机视觉顶会ECCV 2020中,便以自研“图像超分辨技术”,包揽了AIM 2020 Real Image Super-Resolution Challenge全部3项冠军。
百度智能视频技术能力,由此可见一斑。
而除了AI公司,百度从另外一个层面对自身的定位,便是平台公司。
在视频这一大场景、大领域中,各行各业所涉及业务的需求可谓是“千变万化”,通用性自然成了一大难点。
因为视频本身就是具有“重数据”的属性,除了需要强悍的智能分析与处理能力之外,在采集、存储、传输和分发等方面也有极高的要求。
虽说云智一体在一定程度上能够很好解决这方面的需求,但面对具体业务的万变,还是需要另外一个能力的助攻——生态伙伴的合作。
以算法为例,端上的算法与云上的算法需要协同,而视频处理算法依旧是处于不断完善、发展阶段。
因此,百度智能云在云智一体的能力基础上,还需要渗入到产业、厂商的细节过程当中去,与生态伙伴共同合作。
一言蔽之,云智一体,便是百度在视频领域发力的底气。
而之于智能视频的未来,应当是百度在AI深耕的生态能量与视频应用场景的结合。
这便是智能视频“硬核性感”路线的一种正解。
- 豆包升级了“眼睛”,看APP截图就能写代码了!超低价让多模态AI普惠2024-12-19
- 云计算一哥的生成式AI之道:Choice Matters2024-12-18
- 这届AI创业:不敲一行代码,营收突破百万级2024-12-20
- 挑战高考数学完胜!商汤日日新多模态大模型权威评测第一2024-12-19