AI反诈骗,识别关键字就能秒破犯罪陷阱 | CCF C³-08
“网络安全离不开人工智能”
明敏 发自 凹非寺
量子位 报道 | 公众号 QbitAI
上一秒收到“XX信贷”的诈骗短信,下一秒警察蜀黍的温馨提醒就到了。
如此迅速的出警速度,这背后其实还有AI默默助力。
只要NLP识别到用户短信中的“客户、拖欠、信贷”等关键字,手机中的反诈预警系统就会被触发,用户此时就能收到风险提醒。
维护网络安全,AI已经成为了非常重要的角色之一。
该如何更好利用AI,是网安人员们现在更加关注的话题。
在CCF C³第八次活动中,来自学术界和工业界的科技大咖们就深入探讨了这个问题。
这一次,他们齐聚绿盟科技,就知识图谱与语义分析的关键技术及应用实践,做了细致的分享交流。
让网安知识沉淀下来
在数字化变革越来越快的今天,网络安全也显得愈发重要。
从前,维护网络安全依赖人工攻防对抗演练、依赖专家,专业知识没有沉淀下来,技术发展也相对缓慢。
随着网络发展越来越快,数据量飞速增长、攻防对抗越来越频繁,依靠人力显然变得不再可行。
CCF CTO Club成员、绿盟科技集团首席技术官叶晓虎博士就表示:
在今天,网络安全必须依赖人工智能技术!
而利用AI的关键,是对整个网络环境中的知识整理。
由此,多源异构数据融合需求也变得非常迫切。
数据融合有助于数据的统一消费和利用,关联复杂且随时空演化的数据,找出隐藏在数据下的知识。
与此同时,还要从数据融合走向知识融合。
这将不同于传统主要基于字符串的检索,而是真正理解数据资源背后的知识。
如何做到这一点呢?
这就要依靠知识图谱技术。
它可以自下而上自动挖掘知识,根据不同语义关系进行融合,一改从前过分依赖专家、应用封闭的局面。
让知识真正沉淀下来,加速技术发展的速度,解决网络安全人才的巨大缺口。
不仅如此,它还能让安全分析变得更加智能,通过语义理解、动态关联、智能检索、机器推理等技术,自动获取知识构建流程和技术。
从海量异构文件中三元组自动抽取,基于规则匹配或自然语言,根据模式库、实体库、安全语料库作出判断。
这在实际网络安全中已经有了应用:
UC伯克利和清华大学就已经从GPT等预训练模型中无监督地构建出知识图谱。
无需人工进行额外训练,只需语料和预训练好的模型,就可以从头建立出知识图谱,甚至挖掘出人类发现不了的新关系。
事实上,用知识图谱+人工智能构建新型网络信息体系,在国外也早已经有相关项目。
美国已经启动“深绿(Deep Green)”计划以及Insight、XDATA等基础智能技术研究项目,探索从文本、图像、声音、视频等不同类型多源数据中自主获取、处理信息、提取关键特征、挖掘关联信息的相关技术,加速人工智能在军事领域的应用。
具体到实际应用上,叶晓虎表示,我们可以通过半自动结合人工方式提升知识图谱的自动化构建水平,助力安全分析实现认知智能,满足语义理解、动态关联、智能检索和机器推理的业务需求。
只看一个日志就能解决问题
事实上,攻防对抗变得更加高频、激烈并不是危言耸听。
今年5月,美国最大输油管道被黑客攻击中断,17州陷入紧急状态;
同月,比利时政府网站遭到大规模DDoS攻击瘫痪。
面对这样的恶意攻击,除了做好防卫,事件后续溯源、取证和分析也至关重要。
但还是老问题,现在的网络数据量太庞大了,每天都能生成百万量级的日志。
靠人力肉眼来看?
非常不现实。
北京航空航天大学网络空间安全信息学院信息对抗系系主任毛剑博士就表示:
通过系统,自动提取日志中的高阶行为语义,并对语义进行量化聚类,提取表征性行为,可以大幅减少工作量。
通过语义提取,安全人员只需要在一个大类中看一个日志文件,有效避免了大量重复的查找工作。
虽然知识图谱和语义分析能够让网络安全维护变得更加智能,但在实际应用中还有很多亟需解决的问题。
活动现场,各位科技大咖就这些相关问题进行了深入探讨。
如何应对碎片化知识给构建知识图谱带来的挑战?这是知识图谱的一个大难点。
中科院自动化所研究员、博士生导师赵军就表示:
在信息表达层面来说,知识超越一切。
因此,在各个模块上信息或许存在差异,但是知识不会。
知识图谱本来的工作就是整合不同模块、来源的信息,但是在具体情况中,如果来源信息有问题,那么在自动抽取过程中也会存在错误,知识图谱的可信度就会大大降低。
面对这一问题,选择合适的表示方式、图谱算法,以及对应的技术和平台非常重要。
而对于知识图谱的实际应用,毛剑表示基于公开数据集构建的知识图谱,实际的模型有时并不好用。因此生成图谱后,再融合新的知识至关重要。
赵军认为,必须补充新知识、淘汰旧知识。保持大的知识框架不变,不断进行增量式学习,让知识图谱不仅仅是一个知识仓,也要进行自主进化。
浙江大学计算机科学与技术学院教授/博导陈华钧则认为,知识图谱在应用上很难有共性。很多工作和所在领域密切相关,必须要根据领域的特点来选定适合的图谱,这是使用知识图谱的一个准则。
CCF C³
以上精彩内容,全部出自CCF C³的第8期活动,主题为“知识图谱与语义分析”,由绿盟科技承办。
C³活动是由中国计算机学会CCF CTO Club发起的,旨在联结企业CTO及高级技术人才和资深学者,每次以一个技术话题为核心,走进一家技术领先企业。
目前为止已经举办7期,承办企业与主题分别是:
京东-智能客服;小米-智能家居;搜狗-深度语义学习与网络搜索;百度-AI+开源;亚马逊云科技-云计算;阿里巴巴淘系技术-内容化驱动;知乎-如何拥抱开源。
下一次活动将移步上海,由联想上海承办,具体时间是8月13日周五下午14:00-17:30。
— 完 —
- Ilya宣判后GPT-5被曝屡训屡败,一次训数月,数据要人工从头构建2024-12-22
- Sora开服被挤爆!支持中文/编剧模式/作品分享,145块就能玩2024-12-10
- 华为云又一数据中心开服:让算力像水电一样通用,青岛这步棋走对了2024-12-07
- 第一个国产中文o1来了,直接数学竞赛题伺候!2024-11-27