![]()
由于光线追踪的计算强度过高和当前电子平台的性能限制,实时、物理逼真的渲染是空间计算系统中的一个重大挑战。近日,华中科技大学武汉光电国家研究中心董建绩教授、夏金松教授团队联合华为伽利略先进技术实验室,成功研制全球首款用于光线追踪加速的光子计算芯片(PRTC)。此芯片基于薄膜铌酸锂(TFLN)的高带宽、高线性和卓越效率等优点,实现了每次操作326毫焦耳(fJ/OP)的能量效率,证明了使用光子芯片进行光线追踪的可行性,有效地克服了光学计算系统的ADC瓶颈。具体内容以“Thin-film lithium niobate photonic circuit for ray tracing acceleration”为题发布在《Nature Communications》上。
文章链接:https://doi.org/10.1038/s41467-025-61234-x 空间计算通过将数字信息与物理世界无缝集成,正在彻底改变各个领域。其关键方面之一是实现实时、物理逼真的渲染,这对于提供视觉上准确和交互式的体验至关重要。光线追踪是这方面的一项关键技术,通过精确建模反射、折射和阴影来模拟光线的行为,以产生逼真的图像或视频。 然而,光线跟踪中最大的计算负担是确定光线是否与场景中的对象相交。这些计算中的大多数涉及边界体积层次结构(BVH)中的射线盒相交测试,然而,传统计算硬件在处理实时应用所需的大量射线箱相交测试方面面临着重大挑战。为克服现有硬件架构的局限性,实现更高效的实时渲染。光学计算已成为下一代计算硬件平台的有前景的候选者。但是,现有的光学计算系统面临着两大挑战,限制了它们的实用性和广泛采用。 首先,硅光子学由于其基于自由载流子的调制机制,导致非线性电光响应、载流子吸收损耗和有限的响应速度,影响信号传递性、功耗和工作带宽;其次,将光学计算与电子处理系统连接所需的模数转换器(ADC),在模拟光学计算架构时通常会遭受巨大的功耗。 因此,该研究团队提出了一种基于薄膜铌酸锂(TFLN)光子学的光子射线追踪核心(PRTC)来解决光线追踪硬件的速度和能耗等关键问题。此PRTC旨在在光学域内进行射线箱交叉测试,利用光子学的固有优势来加速这项计算密集型任务。通过利用TFLN光子学,PRTC克服了与硅光子学相关的性能权衡,在CMOS兼容电压和100GHz电光带宽下实现了线性光场响应,大大超过了传统硅基光子器件的能力。此外,PRTC通过降低射线追踪任务中的ADC位宽要求来解决ADC功耗挑战。研究人员能够将ADC位宽减小到单个位,有效地最大限度地减少了与模数转换相关的功耗,并实现了326 fJ/OP的能量效率。 所研究的PRTC与TFLN平台的特征如图1所示。所制造的PRTC芯片的整体结构如图1a所示,具有四个推挽式MZM调制器,每个调制器的长度为6mm。图1b显示了波导侧壁的扫描电子显微镜图像,展示了制造质量。芯片的射频封装如图1c所示,其中行波电极的一端连接到射频输入连接器,另一端连接到匹配电阻器,以获得最佳的射频性能。
图1 PRTC的TFLN平台。a PRTC芯片整体结构的照片。b 波导侧壁的扫描电子显微镜图像。c 芯片的RF封装。d 用于监测的芯片光电探测器。e MZM的归一化光传输是施加电压的函数。f 光场对驱动电压的响应、线性响应(蓝线)、测量结果(橙线)。g PRTC芯片中MZM的电光响应。 TFLN平台的电光性能如图1e-g所示。光场对驱动电压的响应如图1f所示,其中蓝线表示理想的线性响应,橙线表示测量结果。由于铌酸锂的高线性度,测量的响应与线性响应显示出极好的一致性,在1Vpp操作下实现了优于99.3%的线性度,在2Vpp操作下达到了97.9%的线性度。这种出色的线性特性使输入电压能够直接映射到光场,而不需要查找表电路,从而显著降低了外围电路的复杂性。图1g显示了MZM的电光响应,显示了约100GHz的3dB带宽,表明与现有硬件系统相比,计算速度可能提高近两个数量级。这种高带宽,再加上TFLN平台出色的线性和CMOS兼容性,使其特别适合高速光学计算应用。 图2a为PRTC的实验演示,以评估计算精度。工作在1550nm波长的连续波(CW)激光器用作光源,其输出被引导到PRTC芯片中。在输出端口进行相干光束组合之前,光信号由四个片上TFLN调制器进行调制。然后,输出光功率通过光电探测器(PD)转换为电信号,并使用示波器记录以供分析。四个TFLN调制器的调制信号是使用四信道高速任意波形发生器(AWG)生成的。数据速率设置为16GS/s(每秒64千兆采样,每个数据点4个采样)。通过使用应用于TFLN调制器的四组10000个随机值进行测试,验证了PRTC的计算精度(图2a)。对测量结果分析发现,实验测量值与地面真实值之间的误差在16GS/s时的标准偏差为2.21%,对应于5.57位的计算精度(图2b-e)。
图2 PRTC计算精度的实验特征。a PRTC演示的实验装置。b,c 16GS/s随机输入的实验输出结果。d 用于计算4组10000个随机输入的精度测量的散点图。e 10000个数据样本的计算误差直方图。 为了系统地评估PRTC的计算能力,首先使用综合验证框架进行了广泛的射线箱相交测试。此PRTC以16 GS/s的数据速率运行,在交叉口检测方面取得了94.6%的总体准确率。图3a显示了100个测试用例的代表性子集的二进制分类结果。为了深入了解PRTC的辨别能力,图3b展示了九个特征测试用例及其相应的几何配置和计算输出。当所有六个值都为正时,满足相交标准,从数学上证明光线相对于整个边缘环保持一致的侧向性。
图3 射线箱交会测试PRTC的实验变化。a 对100组16GS/s数据速率的射线箱交会测试的实验结果。b 100组交集测试结果中的9组,其中每个子图的左侧显示交集的输出,右侧显示相应射线和框的可视化。 在光线盒截面测试中验证了PRTC的准确性后,进一步评估了其在完整光线追踪渲染应用中的性能。研究人员构建了三个具有不同材料特性和几何配置的测试场景。质量指标显示,PRTC实现了与传统计算相当的高精度渲染结果,如图4所示。这些指标表明,PRTC不仅保留了整体视觉外观,而且准确地捕捉了细节和材料属性,证明了此光学计算方法在真实渲染应用中的鲁棒性。
图4 光线追踪渲染结果。a 渲染前的三个测试场景。b 由传统计算机渲染的参考图像。c PRTC渲染的图像. 总之,该团队所设计的PRTC作为光线追踪加速的光子对应物,可以大大加速光线交叉过程,减轻电气元件的负担。如表1所示,与现有的电子和光学平台相比,此PRTC在计算速度和能源效率方面都有了实质性的提高。
表1 PRTC与最先进的电子和光学计算平台的性能比较 PRTC的成功突显了光学计算系统设计中的一个关键原则:将计算架构与特定应用需求相匹配的重要性。通过专注于射线盒交叉测试并利用其二进制特性,通过单比特ADC实现了实质性的性能提升。这种方法展示了特定于应用程序的优化如何释放光学计算平台的全部潜力。 展望未来,这项工作出现了几个有前景的研究方向。首先,在降低工作电压和提高集成密度方面有了进步,可以进一步提高基于PRTC的系统的性能和效率。其次,通过采用具有二进制驱动能力的分段TFLN调制器,可以消除外部DAC开销,实现PRTC和数字电子芯片之间的无缝接口。最后,PRTC技术与新兴增强现实系统的整合为开发将高性能与能源效率相结合的下一代空间计算平台提供了机会。通过共同设计电子管道和光子接口以最大限度地提高并行性,PRTC可以在这些应用中充分发挥其潜力。 转自:恒元光电 注:文章版权归原作者所有,本文内容、图片、视频来自网络,仅供交流学习之用,如涉及版权等问题,请您告知,我们将及时处理。
版权声明: 《激光世界》网站的一切内容及解释权皆归《激光世界》杂志社版权所有,未经书面同意不得转载,违者必究! 《激光世界》杂志社。 |
||||||||||
![]() |
友情链接 |
