“光子”加持,“太极”探索智能计算新路径

□ 方 璐 徐智昊 薛智威

  • 来源:科普时报
  • 作者:
  • 2025-04-25 10:30

当前,以大模型为代表的人工智能技术迅猛发展,复杂大模型在执行智能计算任务时更是需要高算力支撑。光,作为一种兼具传播速度快、表征维度多、计算功耗低等物理特性的媒介,用光子替代电子作为计算载体,以光的受控传播实现计算,可能对当前计算范式带来颠覆性的突破,智能光计算也因此成为新一代人工智能发展的国际前沿。

太极-Ⅰ:拥有高通量并行计算能力

光计算的起源可以追溯到20世纪60年代。经过几十年的发展,它的现实情况是,传统光计算还局限于小规模网络的应用,执行特定的简单智能任务,同时精度也不够高。如何有效提升光计算的处理规模?如何将光计算应用至现实生活中复杂的智能计算场景?这些问题逐渐成为当下阻碍高性能光计算进一步发展的“瓶颈”。

针对这些难题,我们团队根据光学计算独特的“全连接”与“高并行”计算属性,跳出深度计算的框架,首创了分布式广度光计算架构。这一架构是一种深度浅但宽度广的光神经网络,功能可重构、规模可扩展。

此次研制的国际首款大规模通用智能光计算芯片太极-Ⅰ,可实现每焦耳160万亿次运算的系统级能量效率,可让光计算实现自然场景千类对象识别、跨模态内容生成等通用人工智能任务。

这款智能光计算芯片之所以取名“太极-Ⅰ”,主要受《周易》典籍的“易有太极,是生两仪”理念启发。光计算中有一组互补的模态:光学衍射与干涉。衍射计算拥有更高的神经元密度,干涉计算具有更强的重构灵活性。

在太极-Ⅰ中,它们被集成在了同一块芯片上,发挥各自优势的同时,通过硬件资源复用协作,使得太极光芯片不仅具备通用计算能力,还拥有高通量并行计算能力,真正实现了“1+1>2”的效果。

通用大规模光计算从无极至太极,以致万物化生。希望在如今大模型通用人工智能蓬勃发展的时代,太极-Ⅰ可以以光子之道,为高性能计算探索带来切实可行的新方向。

太极-Ⅱ:提升复杂场景下系统能效

训练和推理是人工智能大模型核心能力的两大基石,缺一不可。相较于模型推理而言,模型训练更需要大规模算力。传统上,光子神经网络的训练通常采取离线建模的方式,先对网络系统进行精细建模,再以目标为导向优化模型参数,最后将优化过的参数部署到物理系统中。这种方法虽然能够实现有效的网络参数训练,但对电子计算的依赖较为严重。

为了解决与数值建模相关的问题,我们团队另辟蹊径地提出了一种全新的全前向智能光计算训练架构,在此基础上研制了智能光训练芯片太极-Ⅱ。

太极-Ⅱ能够对多种不同光学系统进行训练,并在各种任务下均表现出了卓越性能。在大规模学习领域,太极-Ⅱ突破了计算精度与效率的矛盾,将数百万参数的光网络训练速度提升了1个数量级,代表性智能分类任务的准确率提升40%。

在复杂场景智能成像领域,太极-Ⅱ在弱光环境下系统级能效提升6个数量级。在非视域场景下实现了千赫兹帧率的智能成像,效率提升2个数量级。

在拓扑光子学领域,太极-Ⅱ支持在不依赖任何预先设定的模型下自动搜索非厄米奇异点——就像两位舞者原本各自旋转,但当旋转速度达到某个临界值时,他们的动作突然同步成一个联合螺旋,此时任何微小推力都会导致动作剧烈变化,这为高效精准解析复杂拓扑系统提供了新思路。

法国科学院纳米科学技术中心主任Damien Querlioz评价道,太极-Ⅱ“架构优雅、巧妙,可广泛应用于各种物理神经网络与机器学习硬件系统”。太极-Ⅱ的提出,为光学系统的无模型高性能自设计与自学习物理系统开辟了新路径,揭示了在后摩尔定律时代实现高效自我训练物理人工智能的潜在可能性。

应用前景值得期待

值得一提的是,太极系列光芯片相较于国际先进GPU,可将系统级能效提升2个数量级,且仅需百纳米级工艺制程,相较于其他芯片具备全国产自主可控的优势。

目前,在原理样片的基础上,我们团队正积极地向智能光芯片产业化迈进,在多种端侧智能系统上进行了应用部署。可以预见,太极系列光计算芯片以全新的计算范式,为人工智能大模型、通用人工智能及复杂智能系统等注入“光子”算力,以更低的资源消耗和更小的边际成本,为后摩尔时代高速、高能效的智能计算,探索一条全新路径。

(作者方璐系清华大学电子工程系教授,徐智昊、薛智威系清华大学电子工程系博士生)

相关新闻

  • TEL:010-58884104
  • E-Mail:kepu@kepu.gov.cn
  • 如果您有任何意见或建议,请联系我们!