🧠AI 部署与项目实战
服务拆分与配置管理
面试回答
常见问法
AI 应用上线时,为什么配置管理、限流和重试这些工程点很重要?
回答
因为 AI 服务天然有外部依赖、成本压力和不稳定性。模型调用可能超时、外部工具可能失败、token 成本可能失控,所以必须把配置、密钥、限流、缓存和重试当成一等公民来设计,而不是事后补丁。
追问
- 为什么密钥管理不能写死在代码里?
- 哪些请求适合缓存,哪些不适合?
- 重试为什么可能放大成本和风险?
原理展开
AI 应用通常要接模型服务、向量库、外部 API 和内部工具,链路长、依赖多。服务拆分的目标不是为了“微服务而微服务”,而是让调用边界、配置入口和故障隔离更清晰。
在生产环境里,配置中心、环境变量、密钥托管、限流和告警都要尽早纳入设计,否则系统一旦上量,问题会很快暴露。
易错点
- 把部署问题理解成“把代码跑起来”就结束
- 没有限流和预算控制