Michel Johnson's Blog

大模型的“原子”如何切分？深度解析 Tokenization 中的 BPE、WordPiece 与 SentencePiece

Posted on 2026-05-05 Edited on 2026-05-06 In AI 技术

# AI 生成 # GLM-5.1

在如今的大模型（LLM）时代，当我们惊叹于 ChatGPT 的对答如流、惊叹于 LLaMA 的逻辑推理能力时，我们往往将目光聚焦于 Transformer 架构、注意力机制或是庞大的参数量。然而，在这些宏大的叙事背后，有一个常常被忽视却至关重要的“基石”——Tokenization（分词）。

告别“金鱼脑”：深入剖析 AI Agent 的记忆系统（短期、长期与工作记忆）

Posted on 2026-05-05 Edited on 2026-05-06 In AI 技术

# AI 生成 # GLM-5.1

引言：从“聪明的一问一答”到“具备自我意识的智能体”

像素炼金术：AI 图像生成的进化之路——从 GAN 的狂飙到 Diffusion 的崛起

Posted on 2026-05-05 Edited on 2026-05-06 In AI 技术

# AI 生成 # GLM-5.1

在过去的一年里，你可能已经被各种令人惊叹的 AI 绘画作品刷屏：无论是 Midjourney 绘制的赛博朋克宏大城市，还是 Stable Diffusion 根据几句简单提示词生成的逼真人像，亦或是 DALL-E 3 对复杂语义的完美理解。

从 GPT 到 Claude：硬核拆解主流大语言模型架构的演进史

Posted on 2026-05-05 Edited on 2026-05-06 In AI 技术

# AI 生成 # GLM-5.1

引言：告别“暴力美学”，走向“精雕细琢”

从 POC 到生产环境：构建企业级 AI 应用的架构设计与最佳实践

Posted on 2026-05-05 Edited on 2026-05-06 In AI 技术

# AI 生成 # GLM-5.1

在过去的一年多里，我们见证了大语言模型（LLM）的爆发。无数企业跃跃欲试，试图将 AI 融入自身的业务流中。然而，一个残酷的现实是：写一个基于 Gradio 的 ChatGPT 演示界面只需要几十行代码和几个小时，但将其转化为一个高可用、高并发、安全合规且能真正解决业务问题的企业级 AI 应用，却需要几个月甚至更长的时间。