芯片AI领域有一个绕不开的困境公开的Verilog代码太少了。软件领域的AI能做到今天这个水平很大程度上靠的是GitHub上海量的开源代码。但芯片不一样——大量优质的RTL设计藏在公司内网里根本不会公开。开源的那些质量参差不齐覆盖的场景也有限。数据瓶颈卡在这里直接影响了AI在RTL生成上能走多远。所以有人开始想既然RTL数据不够能不能换个角度直接从电路层面训练反向的思路是怎么来的正向路径大家都熟悉功能描述 → RTL代码 → 网表 → 版图。有人提出既然综合工具已经在做RTL到网表的映射这个映射过程本身就包含大量结构化的知识。那能不能把这一段知识直接让AI学走跳过RTL建立功能意图到电路结构的直接映射# 传统路径 spec → [工程师写RTL] → verilog → [综合工具] → netlist # 反向电路训练的设想 大量已有netlist → [学习电路结构模式] → 模型 spec → [模型直接生成] → 电路结构网表本身就是一张图节点是逻辑门边是连线。图神经网络处理这种结构天然有优势学术界已经有一些工作在往这个方向走了。往下想问题开始变多表达空间的问题先不说光是同一个功能有几十种门级实现这一条就够让人头疼很久。更绕的是验证。生成RTL之后仿真、形式验证这条链还算完整。但直接生成电路结构怎么快速判断它的功能对不对验证链路得重新搭这个成本放在工程实践里不小。还有时序。电路不只是逻辑正确就够了还得在目标工艺下时序收敛。这个约束在RTL层是隐含处理的到了电路层就得显式面对模型怎么感知这件事目前还没有特别清晰的答案。这三个问题叠在一起方向的可行性就开始变得模糊了。但问题本身很有意思如果不急着找答案只是顺着这个思路往下想——电路逆向这件事学术界已经做了不少。给定一个网表推断它实现的是什么功能。这和给定功能生成电路其实是同一个问题的两面。研究逆向的方法论能不能反过来用再往外扩一点EDA工具里的技术映射、工艺映射这些环节本来就有很强的模式性——标准单元库就那么多常用的电路结构就那么几类规律是存在的。AI在这里能学到什么还是个开放的问题。甚至可以想得更野一点如果AI能直接在流片验证过的数据上训练跳过所有中间表示直接从功能到可流片的东西这条路在物理上有没有可能没人知道答案但这个问题本身值得放在那里。数据从哪里来也是个开放的问题反向电路训练的前提是有足够多的电路数据。网表数据比RTL更难获取这是现实。但也有另一种可能用综合工具批量生成。从已有的RTL出发跑综合得到大量网表再用这些网表做训练数据。这个路径在技术上是通的问题是生成出来的数据质量够不够、多样性够不够、能不能覆盖真实设计里的复杂场景。还有人在想另一个方向直接从芯片的物理版图反推。版图信息在某些渠道是可以获取的从版图到电路结构这条逆向路径本来是芯片安全领域研究的课题但用来做训练数据思路上没有硬伤。这些想法都还在有没有可能的阶段没有一个已经形成完整的工程方案。这件事打开了一些更大的问题如果AI能在电路层面工作EDA工具本身会变成什么综合、布局布线、时序优化这些流程现在还是规则驱动为主AI能渗透进去多深是辅助调参还是有一天能重写整个优化逻辑工艺迭代这么快每换一个节点EDA工具都要重新适配大量规则。如果AI能从数据里学到工艺的特性这个适配过程能不能变得更自动化这些问题现在都没有答案甚至还没到能严肃讨论的阶段。但它们确实是从反向电路训练这个思路自然延伸出来的值得放在脑子里留着。技术的走向有时候就是从一个看起来不靠谱的问题开始的。