清华阿里RealAI联合发布首个AI安全评估平台，模型防御力如何？一测便知

白交 2021-06-04 18:17:04 来源：量子位

平台能够对AI防御和攻击算法进行自动化、科学的评估

白交发自凹非寺
量子位报道 | 公众号 QbitAI

AI的创新发展，带来了新一轮的产业变革。

一方面，是落地于传统行业，提升产业效率；另一方面，则是催生了新的产业，比如智能交通、智慧医疗。

但与此同时，AI所带来的新的风险和安全隐患，也同样不容小觑。

想象一下这些场景。

街道上自动驾驶的汽，车因AI视觉系统受到AI算法诱导攻击，那么行驶轨迹发生改变。

有人通过AI技术模仿出跟你熟悉的亲朋好友一模一样的声音，找你借钱。

……

虽然AI技术已经有了长足进步，但是没有安全性的保障，也很难取得有效发展。

最近，清华大学联合阿里安全、Real AI发布了首个公平、全面的AI攻防对抗基准平台。

平台能够对AI防御和攻击算法进行自动化、科学的评估，并实时生成一个AI安全排行榜单。

AI模型是否安全？一测便知。

AI攻防对抗基准平台

不同于之前只包含零散攻防模型的对抗攻防基准，此次推出AI对抗安全基准基本上包括了目前主流的人工智能对抗攻防模型，涵盖了数十种典型的攻防算法。

不同算法比测的过程中尽量采用了相同的实验设定和一致的度量标准，从而在最大限度上保证了比较的公平性。

清华大学计算机系教授、RealAI首席科学家朱军介绍道：

通过对AI算法的攻击结果和防御结果进行排名、比较不同算法的性能，建立AI安全基准具有重要学术意义，可以更加公平、全面地衡量不同算法的效果。”

此外，评测标准则是依托清华大学人工智能研究院研发的人工智能对抗安全算法平台ARES（Adversarial Robustness Evaluation for Safety）建立。

ARES作为古希腊神话中的战神，双手持矛和盾是攻防合一的化身，集中体现了AI安全算法攻防博弈的特点。

阿里安全高级算法专家越丰，参与了此次评测基准平台的设计，他表示：

就像打仗一样，攻击者可能用水攻，也可能火攻，还可能偷偷挖条地道来攻打一座城，守城的人不能只考虑一种可能性，必须布防应对许多的攻击可能性。

“创新治理两手抓”

因此，我们不光要致力于AI的创新发展，还有专注于AI的治理。

正如张钹院士所说：

既要抓AI的创新发展，又要抓AI的治理，两手都要抓。

张钹院士还谈到，为何AI的发展没有像信息科技发展异常迅猛，反而却缓慢曲折，安全问题层出不穷。

究其关键，还是基础理论的局限性。

从信息革命一开始，信息的三大理论就已经建立：图灵机理论、信息论、控制论。

有了坚实的理论基础，从而引导信息技术健康地发展。

AI则相反，它的理论基础至今没有建立。

尽管经历了尽管经历了第一代AI的符号主义模型（知识驱动），和第二代AI的亚符号（连接）主义模型（数据驱动）。

但由于它们均具有很大的局限性，不能构成AI的理论基础。

因此，建立AI的理论基础，也就成为张钹院士团队提出“第三代人工智能”的初衷。

“第三代人工智能”，简单来说，是利用知识、数据、算法和算力4个要素，建立新的可解释和鲁棒的AI理论和方法，从而发展安全、可信、可靠和可扩展的AI技术。

最后，张钹院士呼吁：全世界应该团结起来，共同来发展安全可控的第三代人工智能，让人工智能真正造福于人类。

平台网站：
http://ml.cs.tsinghua.edu.cn/adv-bench/

RealAI 清华阿里

白交

首个AI科学家发论文进ICLR！得分6/7/6，从选题到实验全程零人工2025-04-09
AI应用突围，中小企业的新周期已至2025-04-11
商汤大装置发放“1亿代金券”，全栈赋能场景落地2025-04-10
米哈游蔡浩宇新作iPhone实机演示：10分钟就被AI小美撩到脸红，她的命运由我掌控2025-04-07

清华阿里RealAI联合发布首个AI安全评估平台，模型防御力如何？一测便知

AI攻防对抗基准平台

“创新治理两手抓”

相关阅读

3600万中国人在抖音“上清华”

阿里大模型春节大礼包：代码可执行率超GPT4，1.5版本全系列开源

互联网大厂造富榜：阿里系27人、小米9人、腾讯6人登上胡润百富榜

Search版o1：推理过程会主动查资料，整体性能优于人类专家，清华人大出品

我是清华新任教授张亚勤，现在只想做成这一件事 | 量子位专访

达摩院突破冯·诺依曼架构性能瓶颈，新型AI芯片性能提升10倍

热门文章

AI应用突围，中小企业的新周期已至

全球首个Linux开发本：50TOPS算力，DeepSeek都配好了，可随地大小开发

SOTA自动绑骨开源框架来了！3D版DeepSeek开源月大礼包持续开箱ing

又一上海人形机器人加入开源！全套图纸+代码，来自傅利叶

手机实现GPT级智能，比MoE更极致的稀疏技术：省内存效果不减｜对话面壁&清华肖朝军