142、Few-shot 与上下文学习：示例选择策略、顺序效应、负面示例的价值

张

张建站

2026/7/5 17:47:24

10分钟阅读

142、Few-shot 与上下文学习：示例选择策略、顺序效应、负面示例的价值一个让我熬夜到凌晨三点的Bug去年秋天，我在做一个智能客服意图识别模块。模型用的是GPT-3.5，Few-shot prompt写得自认为很完美——每个意图给了3个正面示例，格式工整，标签清晰。上线第一天，准确率92%，我美滋滋地准备下班。结果第二天凌晨，监控告警响了。用户说“我要退款”，模型返回了“投诉”意图。我翻看日志，发现类似“退款”“退货”“取消订单”这类请求，模型总是莫名其妙地偏向“投诉”。更诡异的是，同样的prompt，换个示例顺序，准确率能差15个百分点。那晚我盯着屏幕，把示例顺序调了又调，终于发现：我把“投诉”类示例放在了最前面，而“退款”类示例排在最后。模型对开头的示例产生了“锚定效应”，对结尾的示例产生了“近因效应”。中间那些示例？模型几乎没怎么关注。这就是上下文学习中“顺序效应”的典型表现。从那以后，我花了整整两周时间，系统研究了Few-shot的示例选择策略。今天这篇笔记，就是那次踩坑后的沉淀。示例选择：不是越多越好，是越“像”越好很多人以为Few-shot就是随便扔几个例子进去。大错特错。示例选择的核心原则只有一条：让示例与待预测样本在语义空间上尽可能接近。基于嵌入的检索策略别手动选示例，用向量检索。我现在的标准做法是：

Wexflow快速入门：如何在5分钟内搭建你的第一个自动化工作流

Wexflow快速入门：如何在5分钟内搭建你的第一个自动化工作流【免费下载链接】wexflow Workflow Automation Engine 项目地址: https://gitcode.com/gh_mirrors/we/wexflow Wexflow是一款强大的工作流自动化引擎，支持从文件操作、系统进程到脚本编…...

2026/7/5 17:46:56 阅读更多 →

weixin_sogou反爬虫策略揭秘：如何绕过搜狗微信的SNUID验证

weixin_sogou反爬虫策略揭秘：如何绕过搜狗微信的SNUID验证【免费下载链接】weixin_sogou 爬取微信公众号文章项目地址: https://gitcode.com/gh_mirrors/we/weixin_sogou 在网络数据采集领域，微信公众号文章的爬取一直是许多开发者关注的焦点。…...

2026/7/5 17:46:17 阅读更多 →

Yt测试策略：单元测试与集成测试完整指南

Yt测试策略：单元测试与集成测试完整指南【免费下载链接】yt The reliable YouTube API Ruby client 项目地址: https://gitcode.com/gh_mirrors/yt/yt Yt作为可靠的YouTube API Ruby客户端，其测试策略确保了与YouTube API交互的稳定性和可靠性。…...

2026/7/5 17:46:05 阅读更多 →

从论文到实践：一维卷积神经网络在RUL预测中的复现与调优

1. 为什么选择一维卷积做RUL预测？我第一次接触RUL（剩余使用寿命）预测时，发现大多数论文都在用二维卷积处理传感器数据。直到实际处理CMAPSS航空发动机数据集时，才意识到一维卷积才是更自然的选择。想象一下&#xff0c…...

2026/7/5 0:01:14 阅读更多 →

STM32与SPI EEPROM高效数据存储与检索方案

1. 项目背景与核心需求在嵌入式系统开发中，快速精确的数据检索是一个常见但极具挑战性的需求。特别是在工业控制、医疗设备和物联网终端等场景下，系统往往需要在毫秒级时间内完成关键参数的读取和写入操作。传统基于Flash存储的方案存在擦写次数有限、操…...

2026/7/5 0:01:48 阅读更多 →

23-AGENTS.md高级用法

23 AGENTS.md 高级用法概述上一篇文章介绍了 AGENTS.md 的三层加载机制，这是 AGENTS.md 体系的基础。但在实际的大型项目中，三层结构往往不够灵活。团队经常面临这样的场景：同一个 Git 仓库中包含多个服务或模块，每个模块都有自己的独特规范，同时还要继承项目级的通用…...

2026/7/5 0:06:48 阅读更多 →