本文探讨了AI工程领域的核心概念演变从基础的Prompt工程到高级的Harness工程、Loop工程及FDE。随着AI技术的发展工程师的角色已从简单的提示词编写者转变为系统设计者需要构建能够自主运行和优化的AI环境。文章详细解释了Harness工程如何为Agent提供运行环境Loop工程如何实现系统的自驱动能力以及FDE如何解决企业真实环境的落地问题。通过理解这些概念程序员可以更好地利用大模型提高工作效率实现AI技术的规模化应用。你还在手动喂Prompt先说一件2026年6月发生的事。OpenClaw的创始人Peter Steinberger发了一条十二个字的推文几天之内浏览量破五百万“You shouldn’t be prompting coding agents anymore. You should be designing loops that prompt your agents.”翻译过来是你不该再去提示编程Agent了你应该去设计那个替你提示Agent的循环系统。就在那几天前Claude Code的负责人Boris Cherny在一次演讲里说了几乎一模一样的话“我现在不提示Claude了我有一批Loop在跑它们在提示Claude决定接下来做什么。我的工作是写Loop。”很多人看到这两段话的第一反应是这在说什么Loop是什么这和我平时用Prompt有什么区别但如果你在AI工程领域待了一段时间你会意识到这两句话背后有一条完整的演化脉络。这条脉络从怎么写好一条提示词出发一路走到怎么设计一个能自己跑的系统——中间经历了好几次范式级别的跃迁。本文想把这条脉络完整拆开重点讲清楚三个当下最核心的概念Harness工程、Loop工程、以及FDE。它们是什么、解决什么问题、彼此之间是什么关系。一、被工程化的对象一直在往上移先从头说。︱Prompt工程解决的是怎么问的问题。给模型一个好角色、好格式、好示例输出质量会显著提升。这是AI工程的起点很多人在这个层面就已经产出了不少价值。但Prompt工程有一个根本局限它是无状态的。你写一条指令模型回一段内容这一轮就结束了。下一轮模型什么都不记得。对话是一次性的不存在上下文之间的工程管理这回事。于是出现了Context工程解决的是让模型看到什么的问题。RAG把外部知识拉进来记忆机制把历史状态保存下来工具描述让模型知道自己能干什么——这一层不再是优化一句话而是在管理模型的整个信息环境。这两层合在一起把AI的单次表现调到了相当高的水平。但随之而来的问题是当任务不再是单次的呢当你需要Agent跑一个持续多天的代码重构任务或者在收到PR就自动开始处理、处理完自动通知、失败了自动重试——这时候仅靠Prompt和Context已经不够用了。你需要给Agent搭一个真正能跑起来的环境。这就是Harness工程要做的事。二、Harness工程先把干活的地方建好Harness这个词来自英语里的挽具——套在马或耕牛身上、用来传递力量和控制方向的那套装备。引申到AI工程里Harness是Agent的运行外壳工具、约束、反馈回路全都在这里。有一个流传很广的公式Agent Model Harness。模型决定能不能做Harness决定在什么条件下做、怎么做才不出错。一个没有Harness的Agent就像一个有能力但没有工作规范、没有工具、没有反馈的员工——你不知道他会做出什么事。Harness工程大约在2026年初由Mitchell HashimotoHashiCorp和Terraform的联合创始人正式命名随后被OpenAI的Ryan Lopopolo用一篇文章推向更大的受众。Lopopolo写那篇文章的背景是他们团队用Agent交付了一个百万行量级的生产项目全程几乎零手写代码。他说当你的工程团队不再以写代码为主业而是以设计环境、定义意图、搭建反馈回路为主业的时候Harness就是那个核心产出。︱Harness的核心结构可以拆成三层。第一层是工具与执行层。Agent要能干活得先有手。读写文件、调用Bash、访问API、操作浏览器——这些工具的定义和授权是Harness最基础的部分。工具表面越清晰Agent的行为就越可预期。第二层是控制与验证层。这是Harness最关键的部分也是它区别于单纯Prompt工程的地方。有一个对比值得细说你告诉Agent请遵守我们的代码规范和你接入一个违反规范时直接阻断PR的Linter——这是两件本质不同的事。前者依赖Agent的概率性合规后者是确定性的结构约束。Harness工程做的就是把我希望它这样做变成它不可能那样做。测试套件、类型检查、权限边界、审批门控——这些东西接进来之后Agent犯错的概率不是降低了而是那类错误直接在结构上被关掉了。第三层是持久化与状态层。长周期任务的核心问题是AI失忆——上下文窗口一满之前的工作就丢失了。用文件系统和Git来持久化状态让Agent能从中断处续跑是Harness支撑长任务的基础。︱一个真实的规模化案例Stripe的Minions项目在Ruby代码库里围绕LLM编码Agent构建了一套完整的Harness。每周在无人值守的情况下合并超过一千个PR流程是Agent在隔离的devbox里运行pre-push阶段自动跑Linter从三百万个测试里精选CI执行任何失败直接反馈给Agent让它自我纠正通过了才提PR人工只负责审查。这就是Harness把概率性合规换成确定性约束之后规模化可以达到的样子。但Harness有一个天花板它是一个能干活但不会自己找活干的工人。Harness搭好了活还是需要你来分配。你告诉Agent干什么它干完等你下一条指令。整个流程里人仍然是那个不断喂Prompt的角色。这是Loop工程要解决的问题。三、Loop工程让系统自己驱动自己Loop工程的核心转变用一句话说把工程师从逐轮提示Agent的人替换成设计让系统自动提示Agent的系统的人。Loop比Harness高出一层——Harness是为单次Agent运行搭建的环境Loop是在Harness之上加装的自驱动能力。Addy OsmaniChrome DevTools负责人长期关注AI工程实践的比喻很准Harness是工厂的生产线Loop是工厂大脑它决定什么时候启动生产线、生产什么、检查结果是否合格、不合格怎么办。一个Agentic Loop只需要两个核心元素触发器让循环启动的条件和可验证目标Agent判断自己该不该停的标准。触发器可以是定时任务每天凌晨两点跑一次依赖更新检查可以是事件驱动有新PR就触发代码审查Agent也可以是目标驱动给它一个所有测试通过的终止条件让它一直跑直到达成。可验证目标是Loop能不能稳定运行的关键。所有CI通过是一个好目标——可验证有明确的通过/失败信号。帮我优化一下这个功能是一个坏目标——Agent没法判断什么时候算做完可能会无限循环也可能在没做好的时候停下来。Loop的五个核心构件缺一个都容易出问题︱自动化触发Loop的发动机。没有可靠的触发Loop就退化成手动运行的脚本失去了自治的意义。︱创作者与检验者分离这是Loop稳定性的关键设计。不能让同一个Agent既干活又给自己打分——那会产生模型同意自己的幻觉错误得不到纠正。独立的验证Agent负责评估结果只有它通过循环才算完成一轮。︱连接器打通GitHub、Jira、Slack等外部系统。Loop要能感知外部世界才能自主发现工作、汇报进度、响应反馈。没有连接器的Loop是个孤岛。︱隔离工作区Worktrees支持多个Agent并行操作同一个代码库而互不污染。这是Loop能规模化并行的前提。︱持久化记忆Loop跑的时间越长踩的坑越多如果每次都从零开始成本极高。把历史轨迹、失败记录、已完成任务写进可检索的存储让下一轮循环能站在上一轮的肩膀上。︱一个标杆案例Steve Yegge的Gas Town项目2026年1月上线。用一个Mayor Agent协调二三十个Claude Code实例一批巡逻Agent持续循环扫描代码库的健康状态发现问题就分配给工作Agent去修完成之后更新状态状态存在Git里崩溃重启之后能从断点续跑。整个系统基本不需要人介入人的角色是审查PR以及在系统卡住的时候去踢一脚。但这里有一些必须正视的现实代价。︱最开始是成本。单Agent的Loop消耗的token大约是普通对话的四倍多Agent系统大约是十五倍。大规模并行运行的团队月度token账单可以轻松进入七位数。这不是吓唬人是当下的事实。︱还有适用范围。Loop不是万能的。高频重复、结果可验证、工具链已接通——这三个条件缺一个Loop就容易失控。一个目标模糊、没有明确终止信号的Loop可以在几个小时内烧掉几百美元同时什么有用的东西都没生产出来。︱最后还有一个软性风险值得重视认知负债Cognitive Surrender。当Loop跑得越来越好工程师介入越来越少慢慢地你会开始不知道系统在干什么、为什么这样干。这是一种危险的状态。借用一个比喻你把一辆车调成自动驾驶不代表你可以在副驾睡觉。关键路径上的人工审查是系统没有出大问题之前你感知不到它的价值、但真出了问题你会后悔没做的那件事。四、FDE那个把系统搬进客户地盘的人前三层——Prompt、Context、Harness、Loop——解决的都是系统内部的问题模型表现、信息环境、运行可靠性、自治能力。但有一类问题这些层次都处理不了企业真实环境的落地摩擦。数据权限在哪个部门审批遗留的ERP系统怎么接监管合规要求怎么满足业务方对AI帮我们做了什么的认知怎么建立——这些问题不在任何一个技术层里但它们是AI项目从PoC走向生产的最大障碍。一份统计数据说企业AI项目有九成五卡在了落地阶段不是因为模型不够好而是因为这些系统性的摩擦没有人去解决。︱FDEForward Deployed Engineering前向部署工程 就是那个专门去解决这些摩擦的人。这个角色最早由Palantir在2003年前后发明当时叫Delta。他们把精英工程师派驻到军事基地和客户现场在碎片化的数据环境和复杂的组织政治里工作。Palantir建立这套模式不是因为产品不好而是因为他们早早发现再好的系统客户自己也装不上、用不了——不是技术问题是集成、认知、政治的问题。这个模式沉寂了将近二十年直到企业AI的浪潮让同样的问题在所有行业同时爆发。到2026年初OpenAI、Anthropic、Cohere、Databricks的FDE团队都已经是标配。︱2026年的FDE和传统的解决方案工程师或顾问不一样他们同时具备四种能力——而这四种能力很少在同一个人身上共存一是生产级工程能力。写真实代码建真实集成向生产环境交付不是做Demo不是出PPT。二是领域翻译能力。能坐在CFO旁边理解业务问题转身坐到DBA旁边理解数据约束在两者之间架桥。懂业务的工程师和懂工程的业务人分开来都不稀缺合在一个人身上才是FDE。三是Agent落地专项能力。RAG管道怎么建、Eval框架怎么设计、生产可观测性怎么搭——这些是2026年FDE的必考项。一个搞不清楚为什么管道在生产上幻觉频发的人还没到FDE的门槛。四是产品反哺能力。FDE不只是执行端他们也是产品信息的最前沿采集节点。每一个在客户现场发现的集成难题、每一个重复出现的部署模式最终都会反向影响产品路线图。最好的FDE同时也是最好的产品观察者。五、一张图把五层关系说清楚走到这里可以把整条链条收一下每一层都依赖内层但内层做到极致也替代不了外层。一个Harness再完善如果没有Loop系统就是被动的需要人来驱动。Loop设计得再精妙如果企业的数据权限没有打通它跑不起来。FDE能推进落地但如果底下的Harness不可靠他推进的速度越快出的问题越多。这是一个真正嵌套的系统不是可以跳着走的选项清单。最后Prompt没死它升职了我见过的对这件事最准确的判断来自一篇梳理2025-2026年Agentic工程实践的文章原话大概是Prompt从没离开这个房间它只是升职了。Loop不是Prompt的替代品它是Prompt的容器。所有那些被检视过的架构里每一个能稳定运行的Loop归根到底都锚定在某个人花时间亲手写下的文档上——一份CLAUDE.md一组SKILL.md一套系统提示。这件事的讽刺性在于越是追求自动化越依赖那些需要人深度思考才能写出来的东西。所以真正的AI工程师要做的是把执行环境建好Harness搭起自驱动的骨架Loop必要时亲自去客户现场把这一切装上去跑起来FDE——同时永远不忘自己还握着方向盘。最后如果说程序员已经是高薪职业那么干AI的程序员就是高薪中的高薪。现在的市场已经用数据给程序员指明了方向学AI大模型就是冲刺高薪的最优解看着身边越来越多的同行转型大模型、拿到高薪offer很多人心里都动了心但真正的难题来了零基础小白不知道从哪入门有基础的程序员找不到系统学习路径实战项目练手无门面试不知道考什么别慌今天就给大家整理了一份【2026年最新版】AI大模型免费学习资源包覆盖从入门到实战、从理论到面试、从基础到进阶的全流程所有资料均已整理归档无冗余、无套路免费分享给每一位想抓住AI风口的程序员和小白扫码免费领取全部内容1、大模型系统化学习路线2、大模型学习书籍文档3、AI大模型最新行业报告4、大模型项目实战配套源码5、大模型大厂面试真题四阶段精细化学习规划附时间节点可直接照做结合上述资源给大家整理了一份可直接落地的四阶段学习规划总时长约2个月小白可循序渐进程序员可根据自身基础调整节奏高效掌握大模型核心能力快速实现从“入门”到“能落地、能面试”的跨越。第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…扫码免费领取全部内容6、这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】