AI 常见面试问题及详细解答

张

张建站

2026/5/26 23:17:46

10分钟阅读

1. 什么是大语言模型它和传统 NLP 有什么区别回答要点大语言模型LLM是基于海量文本、多模态数据训练出来的通用生成模型核心能力是根据上下文预测下一个 Token并在这个过程中表现出理解、推理、生成、总结、翻译、代码生成等能力。和传统 NLP 的区别传统 NLP 通常是一个任务一个模型比如分类、分词、NER、情感分析。LLM 是通用模型通过 Prompt 就能适配很多任务。传统 NLP 依赖大量标注和特征工程LLM 更依赖预训练、指令微调和上下文学习。LLM 的输出是生成式的所以更强大也更不确定需要评测和约束。面试话术我会把 LLM 看成一种通用智能接口它不像传统系统那样完全确定而是概率生成。因此生产落地时要围绕它建立 Prompt、RAG、工具调用、结构化输出、评测、监控和兜底机制。2. Transformer 和 Attention 的核心思想是什么简明解释Transformer 是现代大模型的基础架构。它的关键是 Attention 机制让模型在处理一个 Token 时可以关注上下文中不同位置的信息。可以对小白这样解释读一句话时人不会平均看每个字而会重点关注和当前词最相关的词。Attention 就是让模型学会“哪些词更重要”。专业补充Self-Attention 让序列中每个 Token 与其他 Token 建立关系。Multi-Head Attention 让模型从多个角度理解上下文。Positional Encoding / RoPE 让模型感知顺序。Decoder-only Transformer 是很多生成式 LLM 的主流结构。面试话术我对 Transformer 的理解是它通过 Attention 解决长距离依赖和并行训练问题。工程上我们不一定自己训练模型但理解 Attention、上下文窗口和 Token 机制有助于设计 Prompt、控制成本和分析模型输出边界。3. Token 是什么为什么 AI 项目要关注 TokenToken 是模型处理文本的基本单位可能是一个字、一个词、一个子词或符号。为什么重要成本很多模型按输入/输出 Token 计费。延迟输出 Token 越多生成时间越长。上下文窗口模型一次能处理的 Token 有上限。Prompt 设计Prompt 太长会挤占业务上下文。面试话术我做 AI 系统会把 Token 当成核心资源管理就像传统系统里的 CPU、内存和带宽。需要做 Prompt 压缩、上下文裁剪、缓存、模型路由和输出长度控制。4. 什么是 EmbeddingEmbedding 是把文本、图片、商品、用户行为等信息映射成向量。向量之间的距离可以表示语义相似度。典型用途知识库检索。相似商品推荐。图片相似度匹配。用户意图聚类。RAG 召回。面试话术Embedding 的价值是把非结构化内容变成可计算的向量。比如用户问“怎么退款”系统可以检索到“退货政策”“售后流程”等语义相近的文档而不依赖完全相同的关键词。5. 什么是 RAG为什么需要 RAGRAG 是 Retrieval-Augmented Generation检索增强生成。流程用户提问。对问题做 Embedding。从向量库检索相关知识片段。可选关键词检索、混合检索、重排序。把检索结果拼进 Prompt。让模型基于资料回答。返回答案和引用来源。为什么需要大模型不知道企业私域知识。模型知识可能过时。直接微调成本高、更新慢。RAG 可解释性更好可以带引用。面试话术RAG 不是简单向量库搜索而是一套知识工程。关键点包括文档清洗、切片策略、元数据、混合检索、重排序、上下文压缩、引用溯源、权限过滤和离线评测。6. RAG 的难点有哪些常见难点文档质量差PDF、表格、图片、扫描件解析不准。切片不合理太短丢上下文太长影响召回。召回不准只用向量可能漏掉关键词精确匹配。权限问题用户不能看到无权限文档。答案幻觉模型没有严格基于检索内容回答。评测困难不知道答案错在召回、上下文还是生成。解决方案文档清洗和结构化。按标题、段落、语义层级切片。BM25 向量混合检索。Reranker 重排序。元数据过滤和 ACL 权限控制。答案必须带引用。使用 faithfulness、context precision、answer relevance 等指标评测。7. RAG 和微调怎么选RAG 适合知识经常变化。企业私有知识库。需要引用来源。不希望模型记住敏感数据。微调适合固化输出风格。特定任务格式。行业术语和表达习惯。小模型能力增强。组合方案很多生产系统是 RAG Prompt 少量微调组合。RAG 解决“知识从哪里来”微调解决“怎么表达和怎么执行任务”。面试话术我通常不会一上来就微调。先用 Prompt 和 RAG 快速验证如果发现问题是知识缺失用 RAG如果问题是输出风格、任务格式或领域行为不稳定再考虑微调。8. Prompt 工程的核心是什么Prompt 工程不是玄学而是把任务指令、上下文、约束、示例和输出格式清晰传给模型。常用结构角色你是资深客服/设计师/代码审查员。任务要完成什么。背景业务规则和输入数据。约束不能编造、必须引用、敏感内容拒答。示例Few-shot examples。输出格式JSON Schema、Markdown、表格。高级技巧Chain-of-Thought 不一定直接暴露给用户可让模型先内部分析再给结论。Self-Consistency 可多次采样取一致答案。Prompt Chaining 把复杂任务拆成多个步骤。Structured Output 用 Schema 保证可解析。9. 什么是 Function Calling / Tool Calling模型本身不能直接查数据库、调用接口或执行订单操作。Tool Calling 是让模型根据用户意图选择工具并生成结构化参数由系统执行。示例查订单getOrderStatus(orderId)退款createRefund(orderId, reason)生成图片generateImage(prompt, style, size)查询知识库searchDocs(query)关键点工具权限必须由系统控制。参数要校验。高风险操作要二次确认。所有调用要审计。面试话术Tool Calling 的本质是让模型做意图理解和参数生成让确定性系统做真正执行。模型不能直接拥有权限必须经过业务网关、权限校验和审计。10. 什么是多模态 AI多模态是同时处理文本、图片、语音、视频等信息。典型场景图生文识别商品图、装修图、票据。文生图营销图、海报、装修效果图。图生图换背景、换风格、局部重绘。语音对话客服、陪练、会议纪要。视频理解质检、安防、短视频分析。面试话术多模态的落地重点不是模型本身而是素材管理、版权、内容安全、异步生成、质量评估和业务指标闭环。比如电商图片最终要看点击率和转化率而不是只看图片好不好看。11. 文生图、图生图的基本原理是什么很多图像生成模型基于扩散模型或其变体。可以简化解释扩散模型训练时学习如何从噪声一步步还原图片生成时从随机噪声开始在文本条件或图片条件引导下逐步去噪最后得到符合描述的图片。关键概念Text Encoder把文本 Prompt 编成语义向量。U-Net / DiT生成过程主体。Latent Space在压缩空间里生成降低成本。ControlNet / Adapter用边缘、深度图、姿态等控制生成。Inpainting局部重绘。Upscale超分辨率放大。12. AI 评测怎么做AI 评测分为离线和在线离线评测建立标准问题集。人工标注标准答案。自动评分人工抽检。对比不同模型、Prompt、RAG 策略。在线评测用户点赞/点踩。转人工率。任务完成率。A/B 实验。延迟和成本。常见指标准确率、召回率。Faithfulness答案是否忠于上下文。Answer Relevance答案是否相关。Context Precision/Recall检索上下文质量。Hallucination Rate幻觉率。P95/P99 延迟。单次任务成本。13. 如何做 AI 成本治理成本来源模型输入/输出 Token。图片生成次数和分辨率。Embedding 计算。向量库和对象存储。GPU 推理。人工审核。治理手段模型分层复杂任务用强模型简单任务用便宜模型。Prompt 压缩和上下文裁剪。结果缓存和语义缓存。批处理和异步队列。限流、配额、套餐。失败重试次数控制。成本看板到用户、租户、场景、模型维度。面试话术AI 成本要像云资源一样精细化治理。研发经理不能只看效果还要看每个功能的单位经济模型比如生成一次图多少钱、带来多少点击或付费转化。14. AI 安全有哪些风险核心风险Prompt Injection用户诱导模型忽略系统指令。数据泄露把内部知识、密钥、隐私输出给无权限用户。越权工具调用模型调用不该调用的接口。内容安全涉黄、暴力、政治、仇恨、违法内容。版权风险生成图、文、代码可能侵权。幻觉误导模型编造事实。防护系统 Prompt 和用户 Prompt 隔离。工具白名单和权限校验。RAG 权限过滤。输出审核和敏感词检测。高风险操作二次确认。日志审计。Red Team 测试。15. 如何设计一个生产级 AI 平台参考架构用户入口Web、App、API、企业微信。API 网关鉴权、限流、租户识别。AI 应用层Prompt 模板、业务编排、Agent 工作流。模型网关多模型接入、路由、降级、成本统计。知识层文档解析、Embedding、向量库、检索、重排序。工具层业务 API、数据库查询、搜索、文件、支付、订单。异步层队列、任务状态、重试、回调。安全层内容审核、权限、审计。评测层离线评测、在线反馈、A/B 实验。可观测层Trace、日志、指标、告警。

别再手动输密码了！用Nginx反向代理+API Key，5分钟搞定Grafana免密访问

基于Nginx反向代理的Grafana免密访问实战指南在运维监控体系中，Grafana作为数据可视化的核心平台，每天需要被不同角色频繁访问。传统账号密码验证方式不仅增加操作摩擦，更在团队协作场景下造成效率瓶颈。本文将介绍如何通过Nginx反向代理配合…...

2026/5/26 23:17:31 阅读更多 →

大模型 RAG 技术演进图谱：2026 年 GEO 优化的核心技术路径解析——附5 家头部服务商

一、AI 搜索重构流量版图：GEO 优化成为企业数字战略核心2026年Q1数据显示，全球AI搜索渗透率已达78%，中国AI搜索营销市场规模突破320亿元人民币，同比增长150%。大模型检索增强生成（RAG）机制的全面应用&#…...

2026/5/26 23:16:52 阅读更多 →

、AI行业薪资迎来爆发！年入50万已是普遍水准

人工智能行业发展势头一路高歌猛进，产业布局不断完善，上下游相关职业迎来大规模扩招，越来越多优质高薪AI岗位涌入求职市场，成为当下职场人跳槽转行的热门首选。今年前四个月，市场内AI相关招聘岗位数量迎来爆发式增长&…...

2026/5/26 23:14:57 阅读更多 →

Oracle EBS R12 主 / 辅助分类帐（主 / 辅助帐套）

Oracle EBS R12 主 / 辅助分类帐（主 / 辅助帐套）落地全套文档包含：配置清单、科目映射规则模板、4 类典型调整分录、税会 / IFRS 案例分录，可直接用于实施、方案文档、上线配置。说明：R11 帐套 (SOB)、R12 分类帐 (Led…...

2026/5/26 9:09:40 阅读更多 →

Harness的配置漂移检测与自动修复

云原生时代的稳定性利器：Harness配置漂移检测与自动修复全指南引言痛点引入相信每一位DevOps工程师、SRE或者运维负责人都遇到过这样的噩梦： 测试环境验证了3天的功能，上线到生产10分钟就出现503错误，排查了2小时才发现&…...

2026/5/26 9:11:16 阅读更多 →

【工程实践】代码质量与测试策略：构建可靠的软件交付体系

【工程实践】代码质量与测试策略：构建可靠的软件交付体系引言代码质量是软件项目成功的关键因素之一。良好的代码质量不仅能提高开发效率，还能降低维护成本，提升系统的可靠性。本文将详细介绍代码质量保障和测试策略的最佳实践。一、代码质…...

2026/5/26 7:22:22 阅读更多 →

3分钟快速上手OBS多平台同步直播插件：告别重复配置，一键推流到多个平台

3分钟快速上手OBS多平台同步直播插件：告别重复配置，一键推流到多个平台【免费下载链接】obs-multi-rtmp OBS複数サイト同時配信プラグイン项目地址: https://gitcode.com/gh_mirrors/ob/obs-multi-rtmp 你是否曾经为在不同直播平台同步推流而烦…...

2026/5/25 17:59:32 阅读更多 →