中国的科学家设计了一个微小的模块化芯片,该芯片由光而不是电力提供动力。他们想使用它来训练并运行未来的人工通用智能(AGI)模型。
新的chiplet被称为“陶奇”,是由许多单独的chiplet(包括Taichi模块)组成的更广泛的拼图,它们共同形成了一个复杂而强大的计算系统。科学家在论文中辩称,如果足够扩展,这将足够强大,可以在未来训练和运行AGI。 科学。
AGI是人工智能(AI)的一种假设的高级形式,从理论上讲,就其认知推理能力而言,它将像人类一样聪明。AGI可以在许多学科中应用,而当今的AI系统只能非常狭窄。
一些专家认为,这种系统已经有很多年了,计算能力的瓶颈是关键阻挡器,而其他人则认为我们会在2027年就会建立AGI代理。
近年来,科学家已经开始达到常规电子设备组件的局限性,尤其是考虑到AI的增长以及为这些越来越苛刻的系统服务所需的巨大功率。
有关的: 轻型计算机芯片可以比电力供电的组件快得多
图形处理单元(GPU)已成为训练AI系统中的关键组件,因为它们比中央处理单元(CPU)更好地执行并行计算。科学家认为,随着系统变得更大,所需的能量水平变得不可持续。
基于光的组件可能是克服常规电子局限性&Mdash;包括能源效率问题。
科学家以前概述了 2月的新型光子微芯片,它使用光子或光颗粒,而不是电子操作晶体管—施加电压时打开或关闭的微型电开关。一般而言,芯片拥有的晶体管越多,它拥有的计算能力就越多,并且运行所需的功率就越多。基于光的芯片的能源密集型要比传统芯片的速度要快得多,因为它们可以并行进行计算。
AI模型的当前光子芯片体系结构由数百或数千个参数或训练变量组成。这使它们足以适应模式识别之类的基本任务,但是使用数十亿甚至数万亿个参数训练了大型语言模型(LLM)。
AGI代理可能需要更大的数量级;作为更广泛的AI架构网络的一部分。如今,不存在用于构建AGI系统的蓝图。
在新研究中,科学家们设计了泰奇的工作方式与其他基于光基芯片相同,但可以比竞争设计更好。这是因为它结合了现有光子芯片的几个优势;包括“光学衍射和干扰”,这是操纵组件中光的方式。
为了测试设计,研究人员将几个田chi芯片缝合在一起,并将其建筑与关键区域的其他基于光的芯片进行了比较。
他们的架构达到了1396万人工神经元的网络量表;相比之下,在第二大竞争设计中,有147万每瓦的能源效率度量为160.82万亿美元(TOPS/W)。他们在论文中强调的下一个最佳结果来自 研究于2022年发表,其中光子芯片达到了2.9个顶部/w。许多常规的神经加工单元(NPU)和其他芯片实现 低于10个上衣/W。
研究人员还声称,他们的基于陶奇的建筑的功能是其他光子系统的两倍,但他们没有直接引用它们。同时,在测试中,他们使用分布式陶氏网络执行包括图像分类和分类以及图像内容生成在内的任务,作为概念证明,而不是基准性能。
科学家说:“泰奇(Taichi)表示,片上光子计算的巨大潜力是通过大型网络模型处理各种复杂的任务,这可以实现光学计算的现实应用。”“我们预计,泰奇将加速更强大的光学解决方案,作为对基础模型和AGI的新时代的关键支持。”