来源:内容来自「悦智网」,作者 Anthony F.J. Levi,谢谢。
━━━━
如果你认为当今时代正处于技术革命的风口浪尖,那么请回想一下20世纪80年代中期,那时硅片使用的是微米级晶体管,光纤系统在世界各地以每秒钟数万亿比特的速度传送数据。
综合硅数字逻辑、光电子学以及光纤通信技术的潜力,一切似乎皆有可能。
按照当时工程师们的设想,这些技术将持续发展和融合,直到光子技术与电子技术相结合,并最终取代电子技术。光子技术不仅可以实现跨国数据传输,还可以在数据中心之间甚至是计算机之间传输数据。工程师们认为,通过光纤可以在芯片间传输数据,甚至设想出了光子芯片:很多人都期待将来有一天极速逻辑芯片可以利用光子而非电子。
但是,这样的设想并未实现。企业和政府曾投入亿万美元用于研究新型光器件和系统,利用光纤将数据中心内部计算机服务器的机架连接起来。诚然,很多现代数据中心的机架都利用这些光设备进行连接。然而光子技术也就到此为止了。在机架内部,单个服务器板仍然使用廉价的铜缆和高速电子器件相互连接。当然,在电路板上,连接处理器的都是金属导线。
将光子技术推向服务器本身、用光纤直接连接处理器的尝试,因经济原因触礁而失败了。根据市场调研公司光计数公司(Light Counting)的调查,以太网光收发设备市场规模已达到年均40亿美元,到2020年这个市场将扩大到近45亿美元和5000万套器件,这不可否认。但是时至今日,光子技术仍未解决数据中心计算机机架与处理器芯片间最后几米的问题。
不过,光子技术的巨大潜力意味着仍有希望。虽然技术挑战仍十分巨大,但数据中心设计的新思路为大数据时代的光子技术革命提供了一条看似可行的道路。
━━━━
在当今的数字化世界中,无论是上网、观看网络电视,还是做任何其他事情,人们所使用的数据流都会经过光电收发器。光电收发器的作用是实现光电信号的相互转换。在各大云服务提供商及社交媒体公司的数据中心内部,这些收发器就位于用于在数据中心之间传输数据的光纤的端点处。收发器与每个服务器机架顶部的交换设备相连接,将光信号转化为电信号并传输到该机架中的服务器组。收发器也会将来自服务器的数据转化为光信号并传输到其他机架,或者通过网络交换机上传到互联网。
每个光电收发器包括3种主要部件:包含一个或多个光调制器的发送装置;包含一个或多个光电二极管的接收装置;以及进行数据编解码的互补金属氧化物半导体(CMOS)逻辑芯片。由于普通的硅不适于发光,因此光子来源于从硅芯片分离出来的激光器(不过激光器可以与硅芯片封装在一起)。这样,就可以不再通过开关激光器来表示比特,而是激光器保持开启状态,通过光调制器将电子比特编码到激光中。
光调制器是发送装置的核心,种类颇多。有一种特别小巧的调制器,被称为马赫-曾德尔(Mach-Zehnder)调制器。这种调制器通过一根狭窄的硅波导管传输激光。波导管一分为二,在几毫米之后又合二为一。一般来说,这样的分流与合流不会影响光输出,因为波导的两个分支是等长的。当分支合二为一时,两束光波的相位依然相同。但是,在某一分支上施加电压会改变其折射率,从而有效降低或提高光波传输速度。这样一来,当两束光波再次相遇时,彼此产生相消干扰,从而抑制信号。因此,改变某一分支的电压,实际上就是在利用电信号调制光信号。
接收装置的构造就简单多了,包括一个光电二极管还有一些支持电路。光信号经由光纤传输到达接收装置的锗二极管或硅锗二极管,二极管在每一个光脉冲的作用下产生电压。
发送装置和接收装置均设有电路,通过电路进行信号放大、数据包处理、纠错,执行缓存及其他任务,使光纤符合千兆以太网的标准。这些装置与光元件是否位于同一芯片或同一封装中,随供应商的不同而有所不同。但是大多数电子逻辑与光元件是分离的。
━━━━
随着硅集成电路上光学元件的应用逐渐增加,也许你会认为将光技术与处理器芯片直接结合是必然趋势。确实,有一段时间的确看似如此。
但事实上,人们完全轻视乃至忽略了一个事实:电子逻辑芯片的最小特征尺寸缩小的速度,与光子技术与其保持同步的能力之间,存在越来越大的差距。如今晶体管的特征尺寸仅为几纳米。利用7纳米CMOS技术,在芯片上1平方微米的区域可集成100多个通用逻辑晶体管,这还不包括晶体管上迷宫般复杂的铜连接线。在每个芯片上,除了数几十亿个晶体管,还需要十几层金属连线将这些晶体管连接起来,形成寄存器、放大器、算术逻辑单元,以及构成处理器核心和其他重要电路的复杂单元。
问题是,一个标准光组件,比如调制器,其尺寸不得小于所传输光的波长,这将尺寸限制在约1微米宽。摩尔定律无法解决这个问题,越来越先进的光刻技术也无能为力。这仅仅是因为电子非常“瘦”,波长仅为几纳米,而光子相对较“胖”。
既然如此,芯片制造商就不能干脆集成调制器,减少晶体管数量吗?毕竟现在芯片上有数十亿个晶体管。答案是:不可以。硅电子芯片每平方微米的面积承载着庞大的系统功能,即便仅用较低功能的元件(比如光元件)来替换少量的晶体管,造价也会十分昂贵。
具体计算方式是这样的。假如每平方微米的芯片上平均有100个晶体管,一个光调制器所占的面积为10微米×10微米,那么它取代的将是包含1万个晶体管的电路!还记得吧,一个标准的光调制器只是一个简单的开关装置,负责开启或关闭光束,而每个晶体管都可以作为开关来开关电流。因此粗略估算,光子元件与电子元件相比,这一基础开关功能的机会成本是10000:1,因为相对于前者的一个光调制器,系统设计人员在面对后者时至少有1万个电子开关可以选择。即使调制器与处理器直接集成可以改善性能和效率,也没有芯片制造商会接受如此高昂的成本。
用光子元件替换芯片上的电子元件还存在其他障碍,比如,光子元件并不能够提供芯片所需的某些关键功能(比如存储)。结论是光子元件与基本计算机芯片功能不兼容。即使不是这样,用光子代替发挥同等功能的电子也毫无意义。
━━━━
这并不是说光子技术无法进一步接近处理器、存储器以及其他重要芯片。目前,装有光收发模块的架顶(TOR)交换机正在引起数据中心光互联技术市场的关注,架顶交换机装在2米高的机架顶部,机架内有服务器芯片、存储器和其他设备资源。光纤通过单独的交换层与其他TOR交换机相互连接。这些交换机再与另外一组数据中心网关交换机相连,接到互联网。
通过嵌有收发模块的典型TOR面板可了解其传输的数据量。每个TOR交换机连接一个收发模块,每个收发模块与两条光纤相连(一条用于发送,一条用于接收)。每个45毫米高的TOR面板上可以嵌入32个模块,每个模块每个方向的数据传输速度可达每秒40千兆比特。这样,两个机架之间的数据传输速度就可达每秒2.56太比特。
但是机架内部以及服务器内部的数据流传输依旧使用铜线。很遗憾,这成为建立更快、更节能系统的一个障碍。采用光子技术方案解决服务器或是处理器连接的最后一米(或两米)问题,可能是开发大规模光器件市场的最佳机遇。但是在此之前,还需要攻克价格和性能方面的一些难题。
光纤接入处理器(fiber to the processor)方案并不新奇。过去有很多尝试,在成本、可靠性、功率以及带宽密度等方面留下了不少经验教训。例如,大约15年前,我曾参与设计建造一台试验性宽带收发器。试验希望将12根光纤宽的平行光纤条带连接入处理器。每根光纤都传输数字信号,信号分别由4个垂直腔面发射激光器(VCSEL)产生。这种激光器是一种由芯片表面发射激光的二极管,激光产生密度比边发射激光器(edge-emitting lasers)更大。4个垂直腔面发射激光器通过开关光输出对信息进行编码,并且它们在同一条光纤中以不同的波长进行传输,这种粗波分复用技术可使光纤的容量翻两番。因此,每个垂直腔面发射激光器的数据传输速度可达到每秒25千兆比特,系统总带宽可达到每秒1.2太比特。根据目前的工业标准,12根光纤并排排列,相邻两根光纤的间隙宽为0.25毫米,因此带宽密度约为0.4太比特/秒/毫米。也就是说,1毫米宽的光纤100秒内可以处理美国国会图书馆网络档案小组一个月所存储的信息。
目前光纤接入处理器应用所需的数据速度比这还要高,但是这已经是一个很好的开端。那么为何这项技术当时没有得到应用呢?部分原因是制造的系统既不可靠又不可行。那时还很难制造出收发器所需的48个垂直腔面激光器,也很难保证收发器在使用寿命期内不出现故障。事实上,一个重要教训就是,设计配用多台调制器的单个激光器要比48个激光器更可靠。
而如今,垂直腔面发射激光器的性能已有所改善,基于这项技术的收发器能够有效提供适合数据中心的短距离解决方案。此外,可以用多芯光纤代替光纤条带。多芯光纤可将等量的数据分流到主光纤内嵌的多根光纤芯中。最近的另一项进展是发布更复杂的数字传输标准,如PAM4通过四级光强度而不是两级光强度对信息进行编码,提高了数据传输速度。还有一些科研项目(例如麻省理工学院的Shine项目)正在努力提升光纤接入处理器示范系统的带宽密度,使之达到我们15年前获得的数值的17倍。
但是这些进展加起来仍不足以使光技术在处理器上的应用更进一步。不过我认为,随着日渐兴起的数据中心系统架构改造,这一步迟早会实现。
目前,数据中心机架中的刀片服务器中有处理器、内存以及存储器。其实不必如此,内存可不与服务器芯片放在一起,而是单独放在一个机架上,甚至放在不同的机架上。人们认为机柜架构(RSA)能够更有效地使用计算机资源,使硬件管理和更换的任务得到简化,尤其适用于脸书这样的大型社交媒体公司,在这类公司中,特殊应用所需的计算量和内存会随着时间的推移不断增长。
为何这一架构可帮助光子技术取得突破呢?因为新一代高效、廉价、速度可达每秒太比特的光开关技术刚好可以实现那种动态资源配置和可重构性。
━━━━
这种数据中心重建方式的主要障碍是器件的价格以及生产成本。硅光子技术已经具备一项成本优势,即可利用现成的芯片生产线,利用硅的庞大基础设施及可靠性。但硅与光的结合并非完美:硅发射光的效率低,硅的光损耗也很严重。通过对光输入和输出进行测量,一个标准的硅光子收发器至少会产生10分贝(90%)的光损耗。但这种低效率并不影响TOR交换机之间的短距离连接,因为至少在目前,硅潜在的低成本优势胜过了存在的问题。
硅光模块的一项主要成本源自不起眼却又十分重要的光连接器。光连接不仅包括光纤与接送装置芯片之间的连接,还包括光纤之间的连接。每年必须生产数亿个极高精度的光纤连接器才能满足需求。具体精度有多高呢?用于光连接器的单模硅玻璃纤维直径为125微米,略大于一根头发的直径。而连接器中这种单模光纤必须达到的精确度是100纳米,仅为一根头发直径的1/1000,否则信号就会被大大削弱。光纤之间以及光纤与收发器之间光连接器的生产方式仍需进一步创新,以满足客户对精确度与低成本的需求。但是,几乎没有生产技术能够满足这种物美价廉的需求。
降低成本的方式之一当然是降低光学模块中芯片的价格。生产芯片的方法有许多种,一种称为硅片集成(wafer-scale lntegration)的技术有助于降低成本。硅片集成技术是在一个硅片上制造光子,在另一个硅片上制造电子,然后将两个硅片粘在一起。随后,将成对的硅片切成芯片,再制造成几乎完整的模块。(由非硅半导体制作的激光器保持单独放置。)这个方法可以做到组装与生产并行,从而降低成本。
降低成本的另一个因素当然是生产规模。假设光千兆以太网市场的总规模为每年5000万个收发器,而每个光收发器芯片的面积为25平方毫米;再假设工厂使用直径为200毫米的硅片进行生产,且产出率达到100%,那么所需的硅片数量为4.2万。
听起来很多,但是这个数字还不及一家标准工厂两周的生产量。事实上,一个收发器生产商即使拥有1/4的市场占有率,也只能维持几天的生产。要降低成本,就需要提高生产量。要做到这一点,唯一的办法是将光技术应用到架顶交换机下面服务器内部的处理器中。
━━━━
硅光技术要在现有全电子系统中抢占机遇,必须要有技术和商业两方面的强大优势。这种器件必须能够解决一个重大难题,并显著改善整个系统。它还必须小巧、节能,拥有超高的可靠性,并必须以极快的速度传输数据。
目前尚未有满足上述这些要求的解决方案,因此电子技术仍会继续发展,而不必与光子紧密结合。如果没有重大突破,在由“瘦”电子主宰的功能系统中,“胖”光子仍无一席之地。但是,如果能大量、低成本地可靠生产光器件,那么数十年来对于光纤接入处理器技术及相关架构的设想就能够成为现实。
在过去的15年中我们已取得了很多进展。我们对光子技术有了更好的理解,对于它在数据中心哪里可用、哪里不可用有了更深刻的认识。此外,一个可持续的、每年可达数十亿美元的光器件商业市场已经形成。光连接已经成为全球信息基础设施的重要部分。但是目前,在现有电子系统核心部分中应用大量光器件的设想尚不可行。
那么未来会一直如此吗?我想不会。
学习园地