合合信息亮相2021世界人工智能大会,带你“看见”数据,“读懂”文字
发布“数字政务大脑”平台
7月7日—10日,以“智联世界 众智成城”为主题的2021世界人工智能大会在上海举行。中国领先的人工智能及大数据科技企业合合信息在本次大会上展示了能“读懂”甲骨文的智能文字识别技术,并重磅发布“数字政务大脑”平台,吸引了来自全球五大洲的观众、商界领袖及科技界大咖驻足参观体验,成为全场最受关注的 “黑科技”产品。
能“读懂”甲骨文的智能文字识别技术
合合信息的智能文字识别技术主要包含了智能图像处理,基于深度学习的复杂场景文字识别,自然语言处理三个核心技术层。智能图像处理技术主要对用户拍摄的复杂文档图像进行预处理,使得文档图像质量得到大幅度提升。基于深度学习的复杂场景文字识别技术,主要利用合合信息自研的手写印刷混排识别,抗强干扰识别,扭曲文字识别,复杂印章和手写识别等一系列先进深度学习识别技术来解决各种不同复杂场景下的文字识别问题。而自然语言处理技术,则是对识别出的结果进行进一步的语义理解。
此次在世界人工智能大会上展示智能文字识别技术,能对3600年前中华文明的古老文字——甲骨文进行识别。将形象丰富的甲骨文复刻在龟甲上再进行重新排列组合后,“单身狗”“白富美”“买它买它”等网络热词被一一识别出来,令人忍俊不禁。
出土于商代的甲骨文是中国发现最早的文字,其图案种类十分丰富,寓意表达明晰,同时又透露着东方文化的神秘。可是由于所处年代过于久远,漫长的历史尘迹,为甲骨文披上了一层朦胧的面纱。现在的甲骨文多在出版物上以图片形式出现,给文字检索带来困难,如今的年轻人对甲骨文的意义更是知之甚少。
合合信息相关技术负责人表示,“甲骨文识别的难点在于甲骨残缺严重、素材难获取、拓片清晰度低等难点,这些都是需要通过技术来解决。例如样本素材少,从技术层面上,我们需要解决少样本训练的问题。目前我们主要是初步研究,更多的工作还在路上。”
目前合合信息的智能文字识别技术支持中、英、俄等56种语言的文档图像、100+种证件的快读智能分类,以及全球不同国家、不同行业的卡证、票据、定制识别等多个AI场景的产品和解决方案。
发布“数字政务大脑”,助推城市治理数字化
除了智能文字识别技术以外,合合信息在此次世界人工智能大会上还发布了“数字政务大脑”平台。该平台基于合合信息商业大数据平台,对全量企业、全产业链和区域经济进行多维度政企数据融合、分析、挖掘。
“数字政务大脑”由四个主要部分构成:区域经济数字监测大脑、产业链数字招商大脑、辖区企业数字监管服务大脑、精准政策数字服务大脑。这背后离不开合合信息的大数据库,其有超过2.3亿企业及组织机构实时数据、1000亿条企业全景信息、1000多个数据维度向外输出数字化风控方案。
区别于普通政务平台简单的数字罗列,“数字政务大脑”可以将城市产业数据进行汇聚、融合、建模,打破城市数据孤岛,拓宽招商通道,优选招商企业。通过对重点产业发展分析与研判,发现本地优势企业,寻找区域产业发力点。
如何把智能文字识别技术和大数据服务更好地应用于数字社会的美好生活场景,是合合信息一直努力的方向。在AI带动数字化、智能化的今天,合合信息将发挥大数据和智能识别技术所长,为智能政务搭建数字化转型“底座”;为各行业提供更多场景化、数智化的大数据解决方案和智能识别服务。让AI引领人类进步,让大数据推动经济、社会和人类的发展,合合信息将推动行业技术创新,探索科技行业的广深空间。
- 昆仑万维重磅发布天工AI高级搜索功能,做最懂金融投资、科研学术的AI搜索2024-11-05
- 豆包大模型团队开源RLHF框架,训练吞吐量最高提升20倍2024-11-01
- 百川智能发布一站式解决方案,助力企业“多、快、好、省”落地大模型2024-10-31
- 开启原生办公新时代 汉王科技发布全新MOUNTAIN系列手写办公本2024-10-31