Posts

2025-10-30 大模型微调（Fine-tuning）实战手册
SFT、LoRA、QLoRA… 哪种微调方式最适合你？一份保姆级的微调避坑指南。
2025-08-15 多模态大模型（LMM）前沿进展：视觉与语言的融合
GPT-4o 之后的视觉语言模型发展趋势，CLIP、BLIP 到 Emu 的技术演进。
2025-06-28 Agent 智能体开发：从 Demo 到生产环境
如何构建稳定可靠的 AI Agent？探讨规划、记忆、工具调用等核心组件的工程化落地。
2025-05-12 DeepSeek-V3 技术架构解析：国产大模型的崛起
深入拆解 DeepSeek-V3 的 MoE 架构创新与训练策略，探讨其在代码生成与数学推理上的突破。
2025-04-05 提示词工程（Prompt Engineering）最佳实践
如何写出高质量的 Prompt？掌握这几个技巧，让 AI 更懂你的需求。
2025-03-20 RAG 实战：如何构建基于私有知识库的问答系统
检索增强生成（RAG）技术详解，解决 LLM 的幻觉问题并补充私有领域知识。
2025-02-15 Transformer 架构详解：从 Attention 到 GPT
解析 Transformer 模型的核心机制：Self-Attention 自注意力机制与位置编码。
2025-01-10 大语言模型（LLM）基础概念解析
深入探讨大语言模型的基本定义、发展历程以及核心能力涌现的原理。