Posts
-
2025-10-30
大模型微调(Fine-tuning)实战手册
SFT、LoRA、QLoRA… 哪种微调方式最适合你?一份保姆级的微调避坑指南。
-
2025-08-15
多模态大模型(LMM)前沿进展:视觉与语言的融合
GPT-4o 之后的视觉语言模型发展趋势,CLIP、BLIP 到 Emu 的技术演进。
-
2025-06-28
Agent 智能体开发:从 Demo 到生产环境
如何构建稳定可靠的 AI Agent?探讨规划、记忆、工具调用等核心组件的工程化落地。
-
2025-05-12
DeepSeek-V3 技术架构解析:国产大模型的崛起
深入拆解 DeepSeek-V3 的 MoE 架构创新与训练策略,探讨其在代码生成与数学推理上的突破。
-
2025-04-05
提示词工程(Prompt Engineering)最佳实践
如何写出高质量的 Prompt?掌握这几个技巧,让 AI 更懂你的需求。
-
2025-03-20
RAG 实战:如何构建基于私有知识库的问答系统
检索增强生成(RAG)技术详解,解决 LLM 的幻觉问题并补充私有领域知识。
-
2025-02-15
Transformer 架构详解:从 Attention 到 GPT
解析 Transformer 模型的核心机制:Self-Attention 自注意力机制与位置编码。
-
2025-01-10
大语言模型(LLM)基础概念解析
深入探讨大语言模型的基本定义、发展历程以及核心能力涌现的原理。