Too Fast:快时代里的慢思考档案。

这里记录我对 RL 后训练、推理基础设施和私有化部署的长期拆解:读论文,做实验,复盘工程取舍,把快速变化里的问题沉淀成可回看的判断。