一、第一章DeepSeek基础知识题目1、2、4、5、7、14题1题干关于DeepSeek长文本处理技术的原生可训练设计以下哪一项是正确的答案在训练初期就开始学习最优稀疏模式原文依据文档P11 NSA稀疏注意力机制原生可训练设计支持端到端学习稀疏模式避免传统方法「先训练后裁剪」的性能损失。考点DeepSeek NSA稀疏注意力三大核心设计之一——原生可训练机制的定义与特点区分传统注意力后置裁剪与NSA端到端同步学习稀疏模式的差异。题2题干DeepSeek-R1模型训练过程中以下哪一项是监督微调阶段的起点答案DeepSeek-v3-Base题目给答案描述“冷启动推理数据”为SFT训练数据源原文依据文档P8、P9 R1训练流程训练起点为DeepSeek-v3-BaseSFT监督微调阶段使用Reasoning推理冷启动数据R1-Zero可跳过SFT直接强化学习。考点DeepSeek-R1双阶段训练链路SFT监督微调通用强化学习、SFT阶段输入数据源与模型基座。题4题干以下哪一项不属于DeepSeek的NSA机制实现突破的关键技术架构答案静态特征映射原文依据文档P11 NSA三大核心突破智能信息分层、硬件级GPU Tensor Core优化、原生可训练设计无静态特征映射相关内容。考点NSA稀疏注意力三大核心技术清单反向排除不属于的干扰项。题5题干通用基准测试中DeepSeek NSA对比传统全注意力机制优点答案首次实现对传统全注意力机制的全面性能反超原文依据文档P11NSA不仅提升64k长文本处理速度更在通用基准测试中实现了对传统全注意力模型的性能反超。考点NSA稀疏注意力机制性能优势区分速度提升与通用任务效果反超两个核心卖点。NSA 的硬件级优化针对的是GPU算力架构、显存、解码流程做软件与指令层面优化不是物理增加 CPU 硬件核心不属于该机制的优化措施。题7题干开源基座大模型领域知识缺失描述正确的是答案大语言模型缺乏企业私有数据支持原文依据文档P27 无RAG原生LLM四大缺陷第三条领域知识缺失——缺乏企业私有数据内部文档、用户画像回答通用无针对性。考点原生大模型四大痛点幻觉、时效性不足、领域知识缺失、数据安全风险聚焦领域知识缺失的成因。题14题干NSA硬件级优化采取哪些措施答案设计内存访问优化器降低显存占用、重构指令流水线提升训练加速、采用解码预测器加快解码速度原文依据文档P11 NSA硬件级优化针对GPU Tensor Core设计高效计算内核64k文本最高9倍训练加速、11倍解码加速底层优化包含显存、计算流水线、解码流程优化。考点NSA三大模块中「硬件级优化」的底层技术细节区分硬件优化、文本分层、原生训练三类不同维度改进。二、第二章基于DeepSeek部署智能小助手题目8、9、10、6题6题干LangChain ChatOpenAI初始化配置哪项不属于答案文档分块大小原文依据文档P41 ChatOpenAI入参temperature、model_name、api_key、api_base文档分块大小是TextSplitter参数属于RAG数据预处理不属于LLM初始化配置。考点区分LLM模型初始化参数 vs RAG文本分块预处理参数理清LangChain各组件参数归属。题8题干DeepSeek部署显存不足解决措施答案7B降级1.5B、FP4量化、关闭显存占用后台程序原文依据文档P24 FAQ显存不足解决方案降级模型版本、启用FP4量化响应延迟优化也包含关闭占用显存程序、监控GPU资源。考点DeepSeek本地部署故障排查——显存不足的完整优化方案软硬件双层解决思路。题目问题是 ** 显存GPU 显卡的专用显存** 不足而电脑内存是 CPU 主存二者硬件独立增加普通内存无法扩充显存不能解决显存不够的问题。题9题干哪些属于昇腾服务器答案Atlas 500 Pro、Atlas 800、Atlas 900 A2 POD原文依据文档P19 昇腾服务器系列包含全系列Atlas算力硬件覆盖边缘Atlas500、推理Atlas800、集群Atlas900。考点华为昇腾服务器硬件产品线分类区分昇腾全系列算力机型。华为昇腾 Atlas 官方产品线里没有 Atlas 700 这个正式型号属于干扰项。题10题干哪些属于Atlas 800系列昇腾服务器答案Atlas 800I A2推理、Atlas 800推理、Atlas 800TA2训练服务器原文依据文档P18、P19 华为DeepSeek一体机蒸馏版基于Atlas800该系列细分推理、训练多型号硬件。考点Atlas 800子系列细分机型区分训练/推理硬件定位。华为官方 Atlas 800 系列没有这款 A3 推理的正式型号属于干扰虚构选项。三、第三章本地化RAG方案题目3、11题3题干RAG核心流程哪项不属于索引阶段题干描述“使用嵌入模型将文本块转化为向量表示”属于索引阶段为本题排除项原文依据文档P36 RAG三阶段索引数据分块→向量化→存入向量库嵌入转向量属于索引检索query向量化、相似度搜索生成注入上下文调用LLM。考点RAG完整三段式流程边界划分精准区分索引/检索/生成各自操作。题11题干ChromaDB向量数据库特点答案易于部署、轻量级原文依据文档P39 向量数据库工具介绍ChromaDB(轻量级)、FAISS(高性能)。考点主流开源向量数据库选型特征对比ChromaDB与FAISS定位差异。四、第四章构建RAG题目12、13、15题12题干RAG技术优势答案灵活更新知识、减少LLM幻觉、可使用最新知识回答原文依据文档P27原生LLM缺陷P28 RAG定义RAG外挂外部知识库动态加载最新文档无需重训大幅缓解幻觉、解决知识过时问题。考点RAG核心价值对比无RAG大模型四大痛点反向记忆优势。题13题干RAG Prompt模板减少幻觉的措施答案插入检索文档片段、指令约束模型仅依据资料作答原文依据文档P41 Prompt模板设计系统指令强制“基于资料回答禁止编造”上下文注入检索到的真实文档块作为约束。考点RAG提示词工程幻觉抑制方案掌握Prompt约束的两大核心手段。B 直接使用用户提问的问题 ❌仅保留用户原始提问没有给模型补充参考约束模型依然会依靠自身旧知识生成内容无法抑制幻觉。题15题干RAG技术不能解决LLM的知识时效性问题。判断错原文依据文档P27、P53对比原生LLM知识截止训练时间RAG可动态加载本地最新文档实时更新知识库完美解决时效性缺陷。考点RAG对知识时效性问题的解决能力区分原生LLM与RAG增强模型的知识更新差异。