30出头成为复旦博导,陈思明:敲代码和写诗,我两样都要

选择了喜欢的事情,更要努力去做

AMiner × 量子位 联合出品

编者按:

陈思明,现为复旦大学青年研究员,博士生导师。

从复旦出发,到北京大学,再到德国,最后回到复旦任教。

他曾远走见识天高海阔,也不忘初心,落叶归根。

一路走来,无论是在数据可视化领域的学术追求,还是在生活上对人文兴趣的探索,他一直用热爱温养时间,步步向前。

今年1月,在AMiner团队推出的AI 2000榜单中,陈思明入选2022年全球可视化领域最具影响力学者。

我们有幸和他进行了一次深入对话。

电脑、旅行和诗歌

陈思明的主页上写着这样一句话:“我喜欢电脑、旅行和诗歌。”

作为一个在数据可视化领域卓有成就的青年研究员,他热爱着这些基于电脑的学术探索,同时,他在生活中,也喜欢用脚步丈量世界各处的角落,用诗歌文字表达自己的无限思绪。

电脑、旅行和诗歌,造就了今天这样一个儒雅多元的他。

陈思明本科就读于复旦大学,在他看来,复旦大学是“一个非常多元的地方”,而他也在本科期间,创造了自己的多元身份。

首先是在专业方面,那时他攻读的是信息安全方向,成绩一直名列前茅,并在大三暑期就由导师推荐进入北京大学机器感知重点实验室实习。

这也为他毕业后选择继续在该实验室完成硕博连读的学业奠定了基础。

此外,陈思明还对经济学非常感兴趣,大二时他就开始辅修经济学的第二学位,“大二到大四的三年中,相当于是把所有晚上的时间都贡献给经济学的专业课了。”

所谓“少年心事当拿云”,凭借一颗求知的心,陈思明同时兼顾计算机与经济学的学习,并均取得了优异的成绩。

虽然辛苦,但扎实的学习也为他后来开展数据科学研究提供了不一样的视角:

一开始我是希望了解一些基本的经济学常识,但到后面做数据可视化研究时,发现自己能够很快地去跟经济相关的数据展开合作,现在我也会带一些金融的硕士。而且具备了这种学科交叉的特点,我后来还有做包括经济学、社会学、历史人文等的数据研究。

或许正是这种“无心插柳柳成荫”的心态,让陈思明得以在多个领域走得更高更远,例如诗歌的创作。

从小他就喜欢写古诗、写对联,兴趣爱好激发了他无限的热情,高中时创建社团,慢慢地能够出去参加对联夏令营,到了大三,他还入选了中国青年诗联组织。

直到现在,诗歌也是他生活中不可或缺的一部分,“平时程序码多了,有自己的兴趣爱好去换一种心情,是非常幸福的。”

而说到旅行,不得不提到他在德国留学的那段“幸福时光”。

2011年,陈思明以优异的成绩从复旦大学毕业,并顺利直博到北京大学深造,2017年,已经在数据可视化领域崭露头角的他决心去往更大的平台。

进入德国波恩大学担任博士后研究员,他同时还被聘为Fraunhofer Institute for Intelligent Analysis and Information Systems(IAIS)的Research Scientist,并得到该领域大牛Gennady Andrienko和Natalia Andrienko教授的指导。

留学期间,陈思明经常去往不同国家参与会议,丰富的参会经验也让他总结出了一套“从会议中汲取养分”的方法:每次参加会议前,他会事先做大量功课,提前阅读相关文章,会议过程中,也一定会将议程研究透彻,并和⼩伙伴们共享⾏程,互相交流。

此外他还建议,听取报告时要注意与自己的工作相关联,与其他科研工作者交流时要学会展示自己的成果。

30出头成为复旦博导,陈思明:敲代码和写诗,我两样都要

△陈思明在欧洲边开会边旅行

会议之余,陈思明总有一双发现美的眼睛,他被各种各样的美景所吸引,从此爱上“边开会边旅行”。“开会和风景是可以兼得的。我以前还年终总结过,每年去了四五十个城市!”

无论是冰岛的极光、爱沙尼亚的运输机还是北欧人蒸完桑拿跳进冰湖里的奇特习俗,都成为他在学术之旅上的“小确幸”。

30出头成为复旦博导,陈思明:敲代码和写诗,我两样都要

△陈思明旅行途中拍摄的美景

D-Map 与E-Map

除了生活上的兴趣,在学术研究中,陈思明也早早确立了自己的科研兴趣,进入数据可视化领域时,他就坚信:“信息可以通过可视化得到广泛的传播。”

实际上,数据可视化与可视分析是一个比较新的学科,旨在把数据转化为图形图像,通过灵活的人机交互,充分结合人的认知能力和机器的计算能力,提供对复杂数据的分析。

以陈思明的博士论文“Social Media Visual Analytics”为例,在诸如微博、Twitter等社交网络平台上,用户之间存在着千丝万缕的联系,如何以让人更容易理解的方式去展现出其中的联系?

这就需要数据可视分析研究,陈思明等人将社交媒体大数据可视化为三大类:社会网络可视化(用户之间的联系)、时空信息可视化和文本分析。

有了这些技术,社交媒体分析就可以同时应用于多个学科的可视化分析中。

30出头成为复旦博导,陈思明:敲代码和写诗,我两样都要

(图:社交媒体中的实体包括三个类别,每个类别又有三个子类别。作为网络实体,用户的社交网络包括关注者网络和转发网络,信息的扩散过程则记录在扩散网络中。对于地理信息,分析人员需要确定信息的转发位置,以便分析时空信息扩散、检测事件分布和分析人的轨迹。文本分析中,关键词、主题和情感则是社交媒体信息的重要特征。)

这项工作的顺利产出,其实也得益于陈思明此前发表的两项重要成果——名为“D-Map”的语义地图以及名为“E-Map”的空间演变地图。

流行的社交媒体平台可以通过社交网络在大量人群中快速传播重要信息,而陈思明等人提出了D-Map作为一种新的可视化方法,能够通过地图隐喻来对典型社交媒体信息扩散和传播过程中的社会行为进行探索和分析。

在D-Map中,首先收集“转发”信息的用户并根据其行为相似性和转发的时间顺序映射为六边形网格,再加上额外的交互和链接,D-Map就能够生成有影响力用户的视觉肖像,并描述他们的社交行为。

利用D-Map方法,可以可视化确定社交网络中的关键参与者、重要信息的传播途径和社交社区之间的互动。

30出头成为复旦博导,陈思明:敲代码和写诗,我两样都要

(图:D-Map系统界面,包括(a)源微博列表图、(b)源微博分布视图、(c)D-Map社交互动图、(d)社区雷达视图、(e)分层视图、(f)时间轴视图、(g)微型多视图)

而在社交网络中,重大事件的传播往往更加迅速和显著,用户的转载和评论则提供了了解事件演变的良机。

因此,陈思明等人提出E-Map的视觉分析方法,使用类似地图的可视化工具,帮助对重大事件的社交媒体数据进行多维分析。

E-Map能够根据提取到的关键词、消息和转发行为转换为城市、城镇和河流等地图特征,从而揭示重大事件演变的区域地理特征。

30出头成为复旦博导,陈思明:敲代码和写诗,我两样都要

(图:在由非结构化社交媒体消息构建的E-Map中,(a)城市由从事件中提取到的关键字表示,颜色变化梯度表示事件的时间演化;(b)城市周围的城镇是由特定关键词的信息塑造的,Rivers代表了社交媒体用户的转载行为(例如转发)。地图上的用户轨迹和联系编码了用户讨论不同主题的行为(黑色曲线)和信息扩散方向(灰色直线);(c)E-Map还支持多层次的时空探索。)

厚积而薄发,直冲上青云。正是这几项进入数据可视化研究时的扎实积淀,让陈思明此后的学术之旅愈加精彩:社交媒体、时空数据与网络安全、用户行为可视分析、故事叙述和语义地图可视分析等等,都见证了他前行的足迹。

此外,六次IEEE VAST Challenge数据挑战赛一等奖、ChinaVis最佳论文奖等多项荣誉,也是对他科研成绩的最大肯定。

喜欢的事情,更要努力去做

尽管一路走来,陈思明累积下不少优异成果,但不可避免地也曾遇到不得不放弃的研究

刚进入博士学习时,他花了整整两年时间做一个地震可视化的项目:

当时的设想是将地震的震源、震区等进行时空可视化预测,看了很多地震相关的书籍,也非常投入。

30出头成为复旦博导,陈思明:敲代码和写诗,我两样都要

△地震可视化示意图

但遗憾的是,直到博三该项目也未能顺利产出成果,陈思明因此面临着改换方向的问题,他开始思考:“我还对哪些领域非常感兴趣?”

最终,他选择了社交媒体这一载体,但此前所作的投入在他眼中,意义仍然非常深远:

虽然表面上看,在第一个项目上投入了很多时间结果却差强人意,但其实反过来想,我通过那个项目把科研的一些基本东西训练好了,虽然没有发出文章,但是该学到的知识都学到了,打下的基础也是比较扎实的。

而谈到三十出头成为名校博导的“秘诀”,他认为自己和许多科研从业者一样,都是“选择了喜欢的事情,然后更加努力地去做!”这也是他希望能够教会学生们的一种科研态度。

2020年,陈思明回到母校复旦大学任教,到现在,他的实验室已经组成了几十人的队伍,面对更加年轻的血液的加入,他叫他们“小朋友”,也非常享受融入大家的感觉:

还记得带第一届学生时,我和学生们其实是一起在摸索和磨合,我喜欢和大家“一起玩儿”。

30出头成为复旦博导,陈思明:敲代码和写诗,我两样都要

△陈思明与实验室学生

不过在学业上,陈思明还是希望能够带领学生一起向前走。

开组会时,他首先会帮助学生定位出必读论文,有时还会帮着搜索相关信息。此外,他还着重训练学生从审稿人的角度读论文:

我经常问小朋友们:假设你是审稿人,你看到文章主题,会想提什么样的问题来质疑它,或者说你认同其中什么观点?

通过这种反思,学生能够更快更精准地发现自己文章中存在的问题,敏感度提高了,今后自己产出文章或者学习别人的文章时,效率也就提高了。

不过另一方面,陈思明也常常站在学生的角度思考问题,发现并理解他们的困境。例如面临就业选择时,他发现学生们常常迷茫:

我以前第一届的小朋友,经常来我办公室集体迷茫,其实我非常理解大家的处境,越往前走,有时候竞争会变得比较激烈,对自己以后做什么事情也不一定很清楚。

这时候我就教他们说,你可能不知道自己想做什么,但你大概率能知道自己不想做什么。那么反过来,可以先把那些不想做的排除掉,然后剩下的可以归类为自己还比较喜欢的,这时候就还是那句话——喜欢的事情,努力去做就好

而对于希望潜心科研的学生,他也在采访中提到了三个必需的品质:

第一是培养独立做科研的能力。

进行科学研究的过程中,固然需要导师、同伴、学者们的帮助,但只有亲身经历过每一个阶段和环节,才能将必要的能力掌握在自己手中。

因此陈思明建议,在第一轮的科研尝试中,应该把一项工作的方方面面都尝试一遍,亲身完成,学会独立操作。

第二是找出明确的研究问题。

陈思明说:

科研,其实就像是在针尖上舞蹈,这个针尖,指的就是research question必须足够明确、精准到像一个针点一样小,只有这样后续的研究才不会偏离轨道。

对idea要有品味,怎么样去找到这样准确的科学问题,这个能力是最重要的。

第三是保持批判精神。

无论是在确定研究问题之前还是确定之后,科研从业者始终需要不断地看论文、汲取新的养分。

哪些内容逻辑严密、基石牢固,哪些领域还有待进一步深究,这些都要从批判的角度才能辨别出来,因此始终保持批判精神,你才能够在科研道路上一直往前走。

关于陈思明

陈思明,现为复旦大学大数据学院青年研究员,博士生导师,复旦大学可视分析与智能决策研究组负责人。

30出头成为复旦博导,陈思明:敲代码和写诗,我两样都要

主要研究方向为大数据可视化与可视分析和混合人机智能,具体包括:社交媒体、时空数据与网络安全与用户行为可视分析,故事叙述和语义地图可视分析等。

2011年本科毕业于复旦大学,2017年获得北京大学博士学位,之后在德国波恩大学任博士后研究员,以及德国弗劳恩霍夫智能分析和信息系统研究所(Fraunhofer IAIS)任研究科学家(2017-2020)

其研究成果发表在IEEE TVCG, CGF, IEEE VIS和EuroVis等顶级期刊和会议上,并担任多个国际会议的程序主席、组织委员会和程序委员会成员。

陈思明的工作曾获得6次IEEE VAST Challenge数据挑战赛一等奖,以及多个会议最佳论文/海报(提名)奖,包括IEEE VIS最佳海报提名奖、EuroVA最佳论文奖、Agile最佳海报奖、ChinaVis最佳论文奖等。

个人主页:

https://www.aminer.cn/profile/siming-chen/562cde9845cedb3398ceb5fa

复旦大学可视分析与智能决策实验室(FDU-VIS):

http://fduvis.net/

关于AI 2000榜单:

今年1月,AMiner 团队推出 AI 2000榜单,旨在通过AMiner学术数据在全球范围内遴选过去十年间,人工智能学科最有影响力、最具活力的顶级学者,赞扬他们对于人工智能研究领域的卓越贡献。

版权所有,未经授权不得以任何形式转载及使用,违者必究。