清华“天眸芯”登Nature封面！全球首款类脑互补视觉芯片，施路平团队最新成果

西风 2024-05-31 14:28:39 来源：量子位

继“天机芯”后，第二次登Nature封面

西风发自凹非寺

量子位 | 公众号 QbitAI

清华类脑计算研究中心施路平团队新成果，登上最新一期Nature封面。

团队研发出世界首款类脑互补视觉芯片——“天眸芯”。

“天眸芯”实现了一种基于视觉原语的互补双通路类脑视觉感知新范式，模仿了人类视觉系统特征。

性能上，“天眸芯”能够以每秒10000帧的高速、10bit的高精度、130dB的高动态范围进行视觉信息采集，并大幅减少带宽需求。

△图源：清华大学官方公众号

将“天眸芯”集成到自动驾驶系统中，即使面对突然闪光干扰、隧道等高动态范围场景、异常物体移动等复杂情况，配合互补多通路算法，系统也能实现精准认知和快速响应。

这回是真开“眸”了～

“天眸芯”长啥样？

随着自动驾驶、机器人、AI等开放世界应用的发展，现有图像传感器面临诸多挑战，难以处理超出其传感范围的动态、多样化和不可预测的情况。

比如快速骑自行车的人、意外行为、光线从明亮到阴暗的快速变化……

然鹅，图像传感器要向高速度、高分辨率、大动态范围和高精度发展，还受功率和带宽限制。

反观人类视觉系统（HVS），具有超强的适应能力和鲁棒性。

人类视觉系统将视觉刺激解析为多种视觉原语，比如颜色、方向、动作等，并以互补的方式将它们分配到腹侧路径（what）和背侧路径（where、how）这两条神经通路，有效地提供了视觉场景的统一表征。

受此启发，清华类脑计算研究中心团队提出了一种基于视觉原语的互补双通路类脑视觉感知范式。

如下图所示，此范式中的原语包括颜色、精度、灵敏度、空间分辨率、速度、绝对强度、空间差分（SD）和时序差分（TD）。

两条互补的视觉路径（CVP）为面向认知的路径（COP）和面向行动的路径（AOP），对应人类视觉系统的腹侧和背侧路径。

COP使用颜色、强度、高空间分辨率和高精度的原语来实现准确的认知，最小化空间混叠和量化错误；AOP使用SD、TD和高速度的原语来实现快速响应。

为实现上述范式，研究团队设计了视觉芯片“天眸芯”。

“天眸芯”整体架构设计如下图所示，包含两个核心组件：

混合像素阵列（Hybrid Pixel Array），用于将光学信息转换为电信号；
并行异构读出架构（parallel-and-heterogeneous readout architecture），用于构建两条互补视觉路径。

其中，混合像素阵列由锥状像素和杆状像素组成，具有不同的颜色、响应模式、分辨率和灵敏度特性。

这些像素可以将视觉信息解析为特定颜色（红、绿和蓝）和白光谱，作为颜色对立原语，还可以通过使用高增益或低增益的电荷转换模式来调节灵敏度，扩展动态范围。

锥状像素采用4μm的细粒度间距实现绝对强度感测，杆状像素有两种不同的8μm和16μm的感受野（指一个神经元或神经元集群能够响应的特定区域内的刺激），用于检测时序差分和空间差分。

此外，杆状像素内嵌高密度存储器，使用“乒乓行为”（ping-pong behaviour）缓冲历史电压，以连续计算时序差分。

再来看并行异构读出架构。

其中，COP采用单斜率模数转换器，对密集的绝对强度信号进行高精度编码。

AOP使用专门的读出架构，通过可编程阈值滤波器（programmable threshold filter）来最小化冗余和噪声，同时保留关键信息；采用具有可配精度的快速自适应数模转换器（fast polarity-adaptive digital-to-analog converter）进行信号量化；使用数据打包器（data packetizer）实现稀疏可变精度时序差分和空间差分信号的无损压缩，以统一协议进行打包。

并行读出电路分别对应COP和AOP，COP使用高精度并行ADC,AOP使用多精度自适应ADC和稀疏编码器,支持可重构速度/精度并减少带宽需求。