MESO器件电路设计:超低功耗自旋逻辑的时序与组合电路实现
1. 项目概述为什么我们需要超越CMOS的MESO器件如果你和我一样在芯片设计行业里摸爬滚打了十几年那你一定对“摩尔定律的黄昏”这个话题感到既熟悉又焦虑。我们眼看着CMOS工艺节点从28nm一路狂奔到3nm、2nm但每一次制程的微缩带来的性能提升越来越有限而功耗和漏电问题却像滚雪球一样越滚越大。问题的核心就卡在电压上。传统晶体管的开关需要一个高于阈值电压Vth的电压差来驱动为了确保晶体管在关闭时能有足够低的漏电流这个阈值电压不能无限制地降低。这就形成了一个死结为了维持性能我们无法将供电电压VDD降到足够低而高电压又直接导致了功耗的飙升。系统能效的提升仿佛撞上了一堵无形的墙。正是在这样的背景下整个行业都在寻找“超越CMOS”的下一代逻辑器件。自旋电子学Spintronics就是其中一个备受瞩目的方向。它的思路很巧妙既然电子的电荷运动是功耗的主要来源那我们能不能换一个“赛道”用电子自旋这个内禀属性来承载和传递信息呢理论上基于磁化状态或自旋的逻辑运算不仅能在超低电压下工作还能实现非易失性——也就是断电后信息不丢失。这听起来简直是低功耗计算的“圣杯”既能大幅降低动态功耗又能消除待机时的静态功耗。然而理想很丰满现实却很骨感。早期的自旋逻辑器件比如自旋转移矩磁随机存储器STT-MRAM的逻辑扩展版本面临一个根本性的效率瓶颈电荷与自旋之间的转换太“费劲”了。要把电荷流高效地转换成可控的自旋流往往需要很大的驱动电流微安级别这直接导致了高功耗和慢速的开关纳秒级别。这就像你想用一根细水管给一个巨大的水车提供动力效率自然低下。磁电自旋轨道Magnetoelectric Spin-Orbit, MESO器件的出现就是为了解决这个“转换效率”的痛点。它不再单纯依赖传统的自旋注入而是引入了一种创新的“两步走”机制首先利用一种特殊的多铁性材料同时具有铁电性和反铁磁性的氧化物通过电压电荷来高效地控制其界面处的磁性自旋极化方向这一步称为磁电ME转换然后再利用自旋轨道耦合SOC效应将自旋流高效地转换回电荷流输出。这个“电荷→磁化/自旋→电荷”的闭环在一个器件内部就完成了而且转换效率理论上可以非常高。这篇论文的核心工作就是为MESO器件“搭建舞台”让它从实验室里的一个物理原型变成一个能在数字电路世界里真正“干活”的演员。具体来说就是设计出基于MESO的同步时序电路如寄存器和组合逻辑电路如反相器链并让它们能在100毫伏mV的超低电压下稳定工作。这不仅仅是验证一个器件的功能更是为构建完整的MESO逻辑家族、探索全新的超低功耗计算架构迈出了关键的第一步。对于从事低功耗芯片设计、新型计算架构研究或是对后摩尔时代器件技术感兴趣的工程师和研究者来说理解MESO的电路实现思路就如同拿到了打开未来低功耗芯片设计大门的一把钥匙。2. MESO器件的工作原理与建模从物理机制到电路模型要设计电路首先得吃透器件。MESO器件的精妙之处在于它巧妙地串联了两个物理效应构建了一个高效的信息转换通道。我们得先把这个通道的每个环节拆解清楚。2.1 器件结构与物理机制拆解一个基础的MESO器件可以看作由前后两个“栈”构成如图1(a)所示磁电ME栈输入转换层由金属互连线、多铁性材料层和铁磁层组成。多铁性材料是这里的“魔术师”它同时具有铁电性FE和反铁磁性。当我们从输入端口b‘注入一个电流或施加电压时电荷会在铁电层积累改变其极化方向。关键的一步来了由于多铁性材料中铁电性与反铁磁性的强耦合铁电极化方向的改变会直接、高效地翻转与之相邻的铁磁层FM的磁化方向。这一步完成了电荷电压到磁化自旋极化的转换效率远高于传统的自旋注入。自旋轨道SO栈输出生成层由铁磁层和具有强自旋轨道耦合效应的材料层如重金属Pt、W或拓扑绝缘体组成。铁磁层的磁化方向即自旋极化方向决定了注入到SOC层中的自旋流方向。SOC层则扮演“翻译官”的角色通过逆自旋霍尔效应ISHE或类似的逆自旋轨道耦合效应将自旋流的方向信息“翻译”成一个二维平面内的电荷电流I_ISOC的方向。如果铁磁层磁化向上输出电流向左磁化向下输出电流向右。这一步完成了自旋到电荷的转换。于是一个完整的信息流就形成了输入电荷电流 → 改变铁电极化 → 翻转铁磁层磁化 → 产生特定方向的自旋流 → 通过SOC层转换为输出电荷电流。值得注意的是由于物理过程的对称性输出电流I_OUT的方向总是与输入电流I_IN相反。因此一个孤立的MESO器件其行为本质上是一个电流反相器。注意这里有一个非常重要的电路特性——级联能力。因为MESO的输入和输出都是电荷电流这就像CMOS反相器一样一个MESO的输出可以直接驱动下一个MESO的输入而无需复杂的接口电路。这是它能构建复杂逻辑电路的基础也是相比一些输入输出物理量不同的器件如纯自旋器件的巨大优势。2.2 核心模型铁电开关的朗道-栗弗席兹方程在电路仿真中我们不能直接模拟复杂的量子力学过程所以需要建立等效的宏模型。论文中MESO器件的建模有两个核心部分其中铁电层的开关行为是最关键且非线性的部分。作者采用了基于朗道-栗弗席兹Landau-Khalatnikov, LK方程的Verilog-A模型来描述铁电体的极化动力学。这个方程本质上描述了铁电体中极化强度随外加电场变化的滞后行为即电滞回线。简单来说铁电体的极化电荷Q_FE与两端电压V_int的关系不是简单的线性电容而是一个包含高次项的非线性函数V_int 2α * Q_FE 4β * Q_FE^3 6γ * Q_FE^5其中α、β、γ是与材料特性相关的LK参数。这个方程刻画了铁电体的两个稳定态Q_r和 -Q_r代表逻辑“1”和“0”以及中间的开关过程。矫顽电压V_c大约65 mV是一个关键参数只有当施加的电压V_FE绝对值超过V_c时铁电极化状态才会发生翻转。在电路仿真中这个Verilog-A模型被实例化为一个非线性电容C_FE其容值随Q_FE动态变化。这个模型准确地捕捉了MESO器件开关的能量阈值和速度是后续所有电路设计仿真的基石。2.3 电路宏模型与仿真设置将物理模型嵌入电路就得到了图3(c)所示的MESO宏电路模型。它主要包括铁电电容C_FE用上述Verilog-A模型描述。自旋轨道栈等效电路被建模为两个串联电阻R_S1,R_S2和一个受控电流源。这个电流源产生的电流I_ISOC其大小正比于流经R_S1的电流I_RS1方向则由铁磁层的归一化极化电荷Q_FE_NORM1或-1决定即I_ISOC -η * Q_FE_NORM * I_RS1。其中η是自旋-电荷转换率在理想仿真中设为100%。外围CMOS晶体管一个NMOS管连接在电源和SO栈之间用于提供开关所需的电源电流I_supply并受栅极电压V_G控制。整个仿真基于Cadence Virtuoso Spectre平台采用14nm工艺的晶体管模型。为了凸显MESO的优势供电电压V_DD被设定为极低的100 mV而NMOS的栅压V_G为了提供足够的过驱动电流设为0.8 V。这个电压域的分隔核心逻辑超低电压控制信号较高电压在超低功耗设计中是很常见的思路。3. MESO时序电路设计攻克状态传播的难题有了能工作的单器件接下来就要把它们连起来干活。对于数字电路尤其是处理器时序电路寄存器、锁存器是构建同步系统、协调数据流的核心。但把多个MESO器件级联起来实现时序功能立刻遇到了几个棘手的电路设计挑战。3.1 单一时钟的困境方向性与穿透问题最直观的想法是像CMOS寄存器一样用一个时钟信号控制所有MESO的开关管。但如图4所示当三个MESO器件MESO1, MESO2, MESO3级联并共用同一个时钟CLK时会出大问题。假设初始状态为 MESO11, MESO20, MESO31。当CLK变高I_supply接通MESO1状态翻转产生输出电流IO1去驱动MESO2。问题A方向性问题IO1在试图改变MESO2的铁电极化C_FE2时这个电流路径也可能通过MESO2的SO栈反向影响到MESO1自身的铁磁状态造成干扰。问题B穿透问题更严重的是MESO2在被IO1驱动的过程中其内部状态变化可能还未来得及稳定就会立刻产生一个输出电流IO2去驱动MESO3。这就导致MESO3的状态被一个“中间态”或“过渡态”错误地改变而不是被MESO2的最终稳定状态驱动。逻辑链的透明传递破坏了时序电路的基本要求——状态在每个时钟边沿被清晰地采样和传递。3.2 创新方案三相时钟控制论文的核心创新之一就是提出了一个三相时钟方案来解决上述问题。其核心思想是在任何时刻只让逻辑上相邻的两个MESO器件同时导通并与其它器件隔离。我们先从最简单的两级级联看起。如图5所示每个MESO器件配备了两个头尾开关管M1, M2和M3, M4。MESO1的开关管由CLK1控制MESO2的由CLK2控制。CLK1和CLK2是三相时钟中的前两相它们不是简单的互补时钟而是有1/3时钟周期200 ps的重叠区。状态传播机制当CLK1和CLK2都未重叠时两个MESO器件都处于高阻态状态保持。当CLK1和CLK2重叠时I_supply同时提供给MESO1和MESO2。此时从MESO1输出到MESO2输入再到MESO2的虚拟地形成了一个完整的瞬态电流通路。MESO1的输出电流IO1得以注入MESO2的C_FE2使其充电并翻转状态。关键点在于由于MESO2的尾端开关管M4仅在CLK2有效时导通当CLK1单独有效而CLK2无效时MESO2的尾端是断开的IO1无法形成回路因此MESO1无法驱动MESO2。这确保了状态传播的单向性。图6的仿真波形清晰地展示了这一过程。无论是从“0”到“1”还是从“1”到“0”的翻转都只在两相时钟重叠的窗口内发生且前一级状态保持不变完美实现了可控的状态传递。3.3 扩展到多级三相时钟的普适性对于三级及以上的级联两相时钟仍可能产生穿透问题。论文将其扩展为完整的三相时钟CLK1, CLK2, CLK3每相时钟依次相差120度且相邻两相之间有1/3周期的重叠。如图7所示的七级MESO链时钟分配规则是第1、4、7...级用CLK1第2、5、8...级用CLK2第3、6、9...级用CLK3。这样在任何重叠窗口如CLK1CLK2只有像MESO1, MESO2、MESO4, MESO5这样的配对能导通并传递状态。而像MESO3这样的器件因其时钟CLK3处于低电平其尾端开关管关闭从而在CLK1CLK2重叠时将MESO2和MESO4有效地隔离开防止了状态穿透。仿真结果图7c显示初始状态“0,0,1,0,1,0,1”在时钟控制下像波浪一样逐级向后传递经过两个时钟周期后MESO1的初始状态“0”被传递到了MESO7。这证明了三相时钟方案能可靠地实现多级移位寄存器的功能。3.4 电路实例环形移位寄存器为了展示时序电路的功能论文设计了一个三阶环形移位寄存器图8。它将三个MESO时序单元每个相当于一个D触发器首尾相连。在三相时钟的控制下这三个单元的状态会循环移位。仿真波形显示三个输出端IO1、IO2、IO3依次在CLK1-CLK2、CLK2-CLK3、CLK3-CLK1的重叠期间产生脉冲形成“001” - “010” - “100” - “001”的周期性3位输出模式。这个简单的例子验证了利用MESO和三相时钟构建基本时序模块的可行性。实操心得时钟设计的权衡三相时钟虽然解决了MESO时序电路的关键难题但也带来了额外的时钟分布网络复杂性和功耗。在实际芯片设计中需要精细设计时钟树确保各相时钟的偏斜Skew远小于重叠窗口200 ps否则会导致状态传递失败。此外这种方案需要每个MESO单元配备两个晶体管作为开关虽然比一个CMOS触发器通常需12个晶体管的晶体管数量少但时钟控制逻辑的 overhead 需要在系统级进行评估。4. MESO组合逻辑电路设计共享晶体管与门控技术时序电路负责存储和同步组合逻辑电路则负责执行具体的逻辑运算如与、或、非。MESO组合电路的设计目标是在没有时钟控制的情况下实现输入到输出的即时逻辑功能同时还要解决静态功耗问题。4.1 基本组合操作两级反相器链MESO器件本身是一个反相器因此最简单的组合逻辑就是将它们级联。但如何控制其开关论文提出了一个巧妙的共享晶体管设计如图9(a)所示。与时序电路不同组合电路不需要时钟控制状态传递的时序。因此可以将多个MESO器件的SO栈的顶端n1和底端n2分别并联起来。然后只用两个共享的NMOS晶体管M1, M2连接在电源VDD和地GND之间作为整个组合逻辑块的统一电源门控开关。这两个晶体管的栅极共同连接到一个使能信号V_G。工作原理当V_G为高使能M1和M2导通为所有并联的MESO器件提供I_supply通路。此时如果在输入端o0注入一个放电电流负电流它会触发第一个MESOMESO1的状态翻转。MESO1翻转产生的输出电流IO1会立即驱动下一个MESOMESO2的输入导致其状态也随之翻转。这个过程会像多米诺骨牌一样沿着MESO链向后传播直到输出端。整个过程是自发的、组合的输出仅取决于当前输入。图9(a)的仿真展示了两种初始条件下输入电流触发整个链状态翻转的过程。关键在于状态传播只在输入变化时发生且传播速度由器件本身的开关速度和RC延迟决定而不受时钟控制。4.2 多级组合逻辑与功耗优势这种共享晶体管的设计可以轻扩展到多级。图9(b)展示了一个六级MESO反相器链仍然只使用两个共享的电源门控晶体管。当V_G开启时一个输入脉冲可以引发六级状态的连续翻转。当V_G关闭时所有MESO器件由于铁电/铁磁材料的非易失性其状态会被保持整个逻辑块与电源断开静态功耗几乎为零。这是MESO组合逻辑的一个巨大优势极低的晶体管开销和高效的功率门控。在CMOS设计中要实现一个复杂的多级逻辑门晶体管数量随逻辑深度增加而线性增长。而在MESO组合逻辑中无论逻辑深度如何电源门控晶体管的数量只需两个一个上拉一个下拉。这大幅减少了外围CMOS电路的面积和功耗开销特别适合用于构建深度逻辑路径。4.3 时序与组合电路的混合设计真正的数字系统是时序和组合电路的混合体。论文在图10中展示了一个将两者结合的示例四个MESO时序单元MESO_s1-s4被八级MESO组合逻辑MESO_c1-c8穿插连接模拟了一个包含不同逻辑深度的流水线级。工作流程所有组合逻辑共享一对电源门控晶体管V_G常开。时序单元由三相时钟CLK1,CLK2,CLK3控制。当CLK1有效时MESO_s1的输出驱动后续的组合逻辑链MESO_c1-c3。当CLK1和CLK2重叠时MESO_c3的输出被采样到MESO_s2中。接着MESO_s2的新状态又通过MESO_c4-c6传播在CLK2和CLK3重叠时被MESO_s3采样依此类推。仿真结果图10c完美展示了数据在时序单元和组合逻辑之间同步、有序地流动。这证明了所提出的三相时钟和共享晶体管技术能够协同工作构建出功能完整的同步逻辑系统。5. 性能评估、挑战与未来展望5.1 性能与能效初步评估论文中的所有电路仿真均在100 mV的超低电源电压和1.2 ns的时钟周期下成功运行并实现了正确的逻辑功能。这直接验证了MESO器件在超低电压下工作的潜力。关于能效论文进行了简要分析组合逻辑由于共享晶体管其CMOS开销不随逻辑深度线性增加且电源门控可几乎消除静态功耗能效优势显著。时序逻辑每个MESO时序单元需要两个CMOS晶体管。论文估算在一个包含10级组合逻辑的时序路径中时钟网络带来的能量开销约占总支出的5.7%假设时钟树完全平衡。这个开销相对于MESO器件本身极低的开关能量论文引用指出可比2018节点CMOS反相器降低10-100倍来说是相对较小的。MESO的主要能耗在于铁电翻转和自旋-电荷转换其理论极限可低至亚10aJ/bit。5.2 当前设计面临的挑战与应对思路尽管前景光明但将MESO推向实用化仍面临诸多挑战论文中的设计也隐含了一些需要解决的问题时钟方案复杂性三相时钟的生成、分布和同步是巨大的设计挑战。时钟偏斜管理、重叠窗口的精确控制在工艺角PVT变化下会变得非常困难。未来可能需要集成片上时钟生成电路或采用更鲁棒的时钟方案。驱动能力与扇出一个MESO器件的输出电流需要驱动后续多个MESO器件的输入电容。论文中的仿真更多是功能验证在实际设计中必须仔细分析驱动强度、布线电容和传播延迟可能需要引入“缓冲器”或调整器件尺寸。工艺集成与良率MESO器件涉及多铁性材料、铁磁材料与标准CMOS后道工艺BEOL的集成。这些新型材料的沉积、图案化以及与硅基电路的可靠连接是巨大的制造挑战。材料特性的一致性如矫顽电压V_c的波动将直接影响电路成品率和性能。建模与EDA工具支持目前依赖于Verilog-A和宏模型的仿真流程离成熟的数字设计流程RTL综合、自动布局布线还有很远距离。需要开发标准的MESO器件SPICE模型、单元库并整合到主流EDA工具链中。电路架构创新本文主要实现了反相器和寄存器。要构建完整的逻辑家族还需要设计基于MESO的与非、或非、多路选择器等基本门电路以及更复杂的多数门Majority Gate这可能需要不同的器件互联拓扑。5.3 未来发展方向与应用潜力MESO技术的探索远未止步。基于本文的基础未来的研究可能朝向以下几个方向异构集成与存内计算MESO的非易失性使其天然适合做存储。可以探索将MESO逻辑与MESO存储器直接集成实现真正的存内计算Processing-in-Memory彻底消除数据搬运的能耗瓶颈这对神经网络推理等数据密集型应用极具吸引力。近似计算与概率计算铁电等强关联材料的开关可能具有一定的随机性或模拟特性。或许可以借此开发新型的近似计算或随机计算电路用于对误差容忍度较高的应用如图像处理、机器学习推理。三维集成MESO器件可以在互连层中制作这为逻辑电路的三维堆叠提供了可能。通过在垂直方向堆叠多层MESO逻辑可以极大提高芯片功能密度缓解二维平面缩放的压力。与CMOS的混合设计在可预见的未来更现实的路径是MESO与CMOS的混合集成。利用CMOS处理复杂的控制逻辑和接口而将超低功耗、非易失的核心计算单元用MESO实现发挥各自优势。我个人在实际研究中的体会是超越CMOS器件的研究就像在迷雾中探索新大陆。MESO提供了一个非常清晰且有物理依据的技术路径。这篇论文的价值在于它没有停留在器件物理的层面而是勇敢地迈出了电路设计的关键一步用具体的电路方案三相时钟、共享晶体管回应了“这东西怎么用”的根本问题。它告诉我们新器件从物理原理走向电路应用中间隔着巨大的工程鸿沟而创新的电路设计正是跨越这道鸿沟的桥梁。虽然前路漫漫但每一步扎实的电路级探索都在为后摩尔时代计算的可能性添砖加瓦。对于芯片设计师而言保持对这类底层器件创新的关注理解其电路内涵或许就是在为未来十年的技术变革储备最重要的洞察力。