LeCun之后Jeff Dean离奇躺枪,哥大黑人女博士:你们得引用我!
「种族主义」大棒学术届乱舞
金磊 贾浩楠 发自 凹非寺
量子位 报道 | 公众号 QbitAI
这几天的Twitter,真是有够乱的。
先是深度学习三巨头之一的Yann LeCun,因被指责为有种族歧视嫌疑的PULSE算法辩护,在经历长达2周的唇枪舌战后,宣布退出推特。
就在近日,谷歌 AI 掌门人 Jeff Dean 也被拖下水——因为他关注了一名与种族歧视相关的博主。
指控者是哥伦比亚大学的一位黑人女性研究员、PresGAN 作者,Adji B. Dieng (以下简称A姐)。
Jeff Dean这次中枪,真的很冤
与LeCun主动对PULSE事件发表观点引来炮轰不同,可怜的Jeff Dean未置一词,甚至都没有围观这次的事件,但还是逃不过被所谓「种族主义」拖下水。
首先认识一下事件的主角:
Adji B. Dieng,来自非洲国家塞内加尔,在哥伦比亚大学读书。主要研究方向是概率图形建模和深度学习结合,为结构化的高维数据(如文本)设计模型。
从2017年起,Adji连续几年在ICLR、NeurIPS等顶会参与组织workshop,主要方向是深度生成模型和结构化数据。
2018年,Adji在Facebook AI 的LeCun小组中做实习生。
2019年她获得了谷歌AI博士奖学金。
此外,她的个人主页上还详细列举了她作为女性科研人员获得的专项荣誉和参加过的各种研讨会。
那么她又是怎么跟Jeff Dean扯上关系的?
快速了解一下这个美国特色学术圈的争议事件。
北京时间6月29日晚8点左右,DeepMind官方发了一条推特,预告了由DeepMind两位科学家Mihaela Rosca和Jeff Donahue带来GAN的普及课程。
这是一系列很基础的科普课,主要内容是深度学习中的最常见的GAN模型,包括GAN的发展、优势、常见GAN的不同衍生模型、和相关前沿创新。
这本身是一个再普通不过的小事,但是DeepMind随后发布的课程Note,却引火烧身。
课程Note是晚上8:57发布。
不到一小时,事件的主角A姐就发推@DeepMind,责问他们:
为什么GAN的课程中没有提到她在DeepMind的研究成果PresGAN。
她毫不客气地指出:「难道因为我是黑人女性吗?」、「引用我!」
这个理由着实让中国读者哭笑不得,事件本身根本不是有关论文抄袭不注明引用的学术不端。
而是一节科普课没有提到她的成果,让A姐不高兴了。
随后她又加入推特上已有的话题#CiteBlackWomen#(引用黑人女性),试图引起更多关注。
她说自己的这篇论文,去年就公布在arXiv上,9个月来只有区区4次引用(其中一次还是她自己),就是因为她是黑人女性。假如主要研究者是一个白人男性,情况肯定大不相同。
至此,这件事还和Jeff Dean毫无关系。
但情况变化之快,转折之突然,让人错愕。
加入讨论的网友中有人支持她的立场,认为她的论文很有价值,不应该被遗漏;
但另一半网友认为她纯属碰瓷,研读她的PresGAN论文,成果一般般,每天在arXiv上都有大量这样的论文挂出来,根本没有重要到非介绍不可的程度。
就是这个@Gwern的网友回复,引起了Adji Bousso Dieng的强烈不满。
但是,她没有用PresGAN本身的学术价值去反驳。她选择揪出Gwern的「黑料」。
她翻出了一篇Gwern之前撰写的,有关试管婴儿技术中智力基因性状选择的成本研究文章,以此,她指控Gwern是一个优生主义者,所以她拒绝与Gwern进行任何对话。
解释一下,“优生主义”是一种试图挑选优秀遗传性状、改良人种的运动,希特勒领导的纳粹德国尤其热衷,并犯下了很多反人类罪行。
这个词在西方语境下极其敏感,提出这样的指控甚至比「种族主义」更加严重。
但优生学是一门正规的学科,没有任何负面含义,这一点要弄清楚。
而这篇文章是否确定是“优生主义”,还没有任何专家或机构评价,A姐自己也没给出证据。
关键转折出现了,A姐随后在Gwern的关注者列表中,发现了Jeff Dean。
于是,她立刻主动@Jeff Dean,并意味深长地对Jeff Dean喊话:
你也关注了这个人,但我相信你不知道他是一个优生主义者。
这种喊话,给人一种强行要求Jeff Dean“没病出来走两步”的感觉……
可怜Jeff Dean,一没发声,二没关注事件,三不是GAN发明者,就这样挨了来路不明的一枪。
顺便一说,GAN之父Goodfellow也关注了Gwern,A姐在「followers you know」中肯定能看到他,但她却没有@Goodfellow 。
目前,Jeff Dean和DeepMind都没有回应。
但是,Jeff Dean被A姐人为置于了一个进退两难的局面:支持她,很多同行不认可;
保持沉默或不支持,会被政治正确围攻;
如实表达个人看法,有可能面临和LeCun一样的局面。
Jeff本人可能还在发愁怎么回复,但推特网友已经吵翻了天。
截止发稿,A姐发推约40个小时左右,推特下面大概有1/3留言表示支持她,认为这是对女性对黑人严重的歧视。
约1/5的留言认为她论文没价值,在碰瓷搏出位,其中一个重要观点是,这篇PresGAN的论文仍然未经同行评审,而业内较少或不引用这样的文章并没有错,不是啥事都跟种族、性别有关。
剩下的人大部分是骑墙态度,两边都不得罪,说一些不犯错但没有实质内容的话。
但确实有个别人指出了关键,建议A姐应该用论文本身说话,详细说明为什么不应该遗漏她的PresGAN,但Adji Bousso至今没有回复。
A姐自己随后又发推补充,她认为DeepMind可能不是故意漏掉她的成果,但这说明人们潜意识中的歧视问题更加严重。
同时对于Reddit锁帖,她表示不在乎,自己也根本不是什么racial blur(淡化种族),她本人作为黑人女性很骄傲。
但是她一直没就PresGAN本身做任何说明。
A姐主动拉业界大佬下水的举动对错先不论,她的关于PresGAN的研究到底价值几何?
什么是PresGAN?
那么,PresGAN 到底是一个怎样的研究呢?
方法的全称叫做 Prescribed Generative Adversarial Networks,直译过来就是「规定的GAN」。
这项研究于去年10月11日在 arXiv 上发表,时间已经长达9个月。
PresGAN 核心改良内容包括两点:
- 将噪声添加到密度网络的输出中,并优化了熵调节的对抗损失。
- 增加的噪声使预测的对数似然性易于处理,并稳定了训练过程。
在不同数据集上评估后,发现可以减轻模式崩溃并生成具有高感知质量的样本。
从上表的数据中可以看到,FID指标,也就是计算真实图像和生成图像的特征向量之间距离的一种度量,与其它方法相比,性能是最好的。
就传统GAN与变分自编码器(VAE)之间的预测对数似然性而言,PresGAN缩小了性能差距,如下表所示。
圈里人如何看待PresGAN?
在各种数据集上性能表现都到了SOTA,生成图像效果也不错,为什么圈内人对这项工作不买账呢?
Reddit 网友们,从纯学术角度给出了一些见解。
首先是对PresGAN的技术本身,有网友认为:
问题出在它就是直接沿袭GAN,所以看起确实有点奇怪。
有人还po出了一个GAN大杂烩的 GitHub 项目,提出了大大疑问:
项目里有这么多的GAN,(你觉得)有多少就应该被引用?
然后非常犀利地评论道:
关键是她的论文在任何方面都不突出。我看不出这篇论文为什么就该被引用。
对A姐提出的质疑——为什么后出现的 BigBIGAN 会在演讲中被提及,而 PresGAN 却没有?
有网友给出了三个理由:
- BigBIGAN的结果更令人印象深刻;
- 已被同行评议并发表在NeurIPS;
- 是Jeff Donahue写的,他是演讲的人之一。
我认为这三个都是非常合理的理由,来解释为什么会在演讲中提到BigBIGAN,而不是PresGAN,这与种族/性别无关。
至于A姐对她论文引用量方面的抱怨,也有网友跳出来评论道:
如果大多数研究人员更关心新的研究,而不是担心他们以前的工作有多少被引用,那他们的情况会好得多。
「This needs to stop!」
或许是随着BLM活动的愈演愈烈,社交网络中的机器学习圈子,最近也是弥漫了一些别样的味道。
有网友便「直击七寸」地指出了这个问题。
包括Yann LeCun的事情,这种「有毒」的行为正充斥着 ML 社区。
每天都会产出大量的ML论文(难道篇篇都得被引用不成)。
而最为精辟的便是最后一句话:
不要把问题直接归咎于种族主义和性别歧视!
网友情绪一天后爆发
就A姐事件发生一天后,广大普通从业者们终于忍无可忍了。
一位名为yusuf-bengio的网友在Reddit的机器学习社区发帖,批驳当下机器学习圈子的8大毒瘤(toxicity problem)。帖子发出5小时,热度已经1.2k。
这8个问题全都一针见血,毫不留情。
这其中既包括论文投稿的潜规则,也有动辄对别人群起攻之的怪像,总之这些8个问题搞得机器学习社区乌烟瘴气,其中4条直指「政治正确」。
在他看来:
LeCun只是理性讨论,但对他的攻击超出了合理的范围。封杀别人、道德绑架,迫使别人沉默解决不了任何问题。
计算机领域少数族裔和女性比例低的问题一直存在,但是缺乏多样性一直被当做借口滥用,导致很多人不敢谈论,怕被扣上种族主义和性别歧视的帽子,反而不利于解决问题。
道德标准的设定其实是美国标准,对之外地区没有意义。
讨论失去理性,变成了咒骂。Schmidhuber指责Hinton是小偷,Gebru说LeCun搞白人至上,Anandkumar称Marcus性别歧视……
那么,你觉得这些问题都是确实存在的吗,它们又会把机器学习引向何方?
参考链接:
Reddit讨论:
https://www.reddit.com/r/MachineLearning/comments/hi83sr/d_adji_bousso_dieng_calls_out_deepmind_lecture_by/
论文地址:
https://arxiv.org/pdf/1910.04302.pdf
- 华为智驾首次上车比亚迪!38万元硬派越野车标配端到端2024-11-12
- 小鹏也背叛纯电了!增程首秀续航1400公里,自研智驾芯片亮相,还给老用户搞硬件升级2024-11-07
- 奥迪确认用华为智驾:问界阿维塔同款,纯燃油实现「有路就能开」2024-11-04
- 苏州L4独角兽被投数亿:无人小巴成名,L2+上车超40万台2024-10-28