GLOBAL AI API RELAY · 8-WEEK DELIVERY PLAN

全球 AI API 中转站技术落地研发计划

以 New API 快速二开为商业底座,以 LiteLLM Proxy 增强多模型路由,以 AI Coding 工程化提高研发效率,在 2 个月内交付可对外商用的 API 中转平台。

目标周期:6-8 周 团队规模:6-8 人核心组 交付口径:可商用 v1.0 方法:开源底座 + AI 开发 + 人工评审
8 周完成注册、充值、API Key、调用、扣费、代理、监控、文档
35-55%相对传统研发模式的成本节省预估
99.5%账本扣费准确率上线底线
97%+公测期 API 请求成功率目标
01

建设目标与交付边界

本项目第一阶段只做 API 中转站核心平台,不在 2 个月内追求完整 Agent 生态、算力租赁、白标私有化全部落地。目标是先形成“可注册、可充值、可调用、可计费、可运营、可风控”的商业闭环。

商业闭环目标

客户完成注册、充值、创建 API Key、调用模型、查询用量;平台完成扣费、成本统计、毛利查看和异常处理。

技术闭环目标

OpenAI-compatible API、流式响应、供应商路由、fallback、Token 统计、余额扣减、日志追踪、监控告警。

运营闭环目标

管理后台可配置模型、渠道、倍率、用户额度;代理商可邀请客户、查看消耗、统计佣金。

2 个月必须交付的能力

类别必须交付验收口径
用户侧注册登录、API Key、余额、充值记录、调用日志、模型价格、接入文档真实用户可自助完成 API 调用
API 侧OpenAI-compatible endpoint、流式透传、模型映射、错误码统一主流 SDK 修改 baseURL 和 key 即可接入
计费侧Token usage 归一化、模型倍率、余额扣减、消费流水、补账机制账本误差低于 0.5%,每笔扣费可追溯
管理侧用户、渠道、模型、价格、订单、充值、日志、风控、成本毛利运营人员不依赖研发即可日常管理
代理侧邀请码、客户归因、代理客户消耗、佣金统计、结算记录可支撑首批 5-10 个代理试运营
运维侧监控、告警、状态页、供应商健康、备份、发布回滚故障可发现、可定位、可切换
2 个月内不建议做完整 Agent 市场、算力租赁平台、复杂投资人系统、全量多区域部署。所有后续生态只预留接口和数据结构,不抢 v1.0 的工程资源。
02

全局产品路线图

路线图采用“中转站先行、Agent 拉消耗、自有算力提毛利、企业与白标做壁垒”的节奏。第一阶段必须克制,所有研发优先保证 API 中转主链路。

MVP 0-2月 Growth 3-4月 Agent 5-6月 Compute 7-9月 Global 10月+ API 中转站 v1.0 注册 / 充值 / Key / 调用 / 扣费 / 代理 / 监控 代理商与企业版 团队预算 / 白标雏形 / 毛利看板 / SLA Agent 消耗网络 客服 / 群运营 / 广告 / 开发者模板 自有算力供给层 推理池 / 租赁 / 企业专属 / 成本优化 全球化平台 多区域 / 合规 / 本地支付 / 私有化
03

全局技术架构

架构原则:底座复用、核心账本自控、业务后台 AI 辅助开发、生产安全人工把关。第一阶段不做过度微服务化,采用模块化单体 + 独立网关 + 独立账本的方式快速交付。

Client & Experience Layer 用户控制台Key / 余额 / 日志 / 账单 代理商后台客户 / 佣金 / 结算 管理后台渠道 / 用户 / 风控 文档与状态页API Docs / Status 企业客户Team / BYOK / SLA Access & Gateway Layer OpenAI-compatible API Chat / Responses / Embedding / Streaming Auth & Virtual Key 用户 Key / 团队 Key / 代理归因 Rate Limit & Policy QPS / 预算 / 模型权限 / 地区策略 Routing Engine 成本 / 延迟 / 健康 / fallback Business & Control Layer Billing Ledger Token / 余额 / 订单 / 流水 核心自研,人工主导 Payment Center Stripe / PayPal / 银行 / 人工入账 Reseller Engine 邀请 / 归因 / 佣金 / 结算 Cost Center 供应商成本 / 毛利 / 预警 Risk Control 盗刷 / 异常消耗 / 内容策略 Supply & Infrastructure Layer Official APIsOpenAI / Anthropic / Google Cloud APIsAzure / AWS / GCP AggregatorsOpenRouter / Together / DeepInfra Self-hostedM4 / 4090 / MI300X Data StoresPostgreSQL / Redis / Object ObservabilityGrafana / Loki

架构落地原则

底座优先

New API 承担中转商业底座,LiteLLM 承担多模型适配增强,减少重复造轮子。

账本独立

余额、扣费、订单、佣金必须独立建模,不完全依赖开源项目原有逻辑。

模块化单体

v1.0 不过度微服务化,服务边界清晰即可;后续按压力拆分。

可观测先行

所有请求从第一天就要有 traceId、usage、cost、provider、userKey 记录。

04

平台规划与页面/后台能力

平台规划按使用角色拆分:用户、代理商、管理员、运维、开发者。AI Coding 主要承担页面、CRUD、报表和文档生产,核心资金安全链路由人工主导。

用户控制台
注册/登录/邮箱验证
API Key 创建、禁用、重置
余额、充值、订单记录
调用日志、错误日志、Token 用量
模型价格、套餐权益、快速开始
管理后台
用户、团队、代理商管理
供应商、渠道、模型管理
倍率、成本、毛利配置
充值审核、订单、补账
风控、黑名单、异常冻结
代理商后台
邀请码、邀请链接、客户归因
客户列表、客户消耗、客户充值
折扣、佣金、返利统计
结算记录、对账单下载
代理专属价格与素材下载
平台v1.0 必须完成AI 可承担比例人工重点把关
用户控制台Key、余额、充值、日志、文档入口70%-85%权限、余额展示、敏感字段隐藏
管理后台用户、供应商、模型、倍率、订单、日志60%-75%高危操作权限、审计日志、补账流程
代理后台邀请、客户归因、佣金统计、结算记录65%-80%佣金算法、归因边界、结算审批
文档站快速开始、接口说明、SDK 示例、FAQ80%-90%接口准确性、价格口径、合规措辞
运维平台状态页、健康检查、告警列表、成本预警50%-65%告警阈值、事故流程、供应商切换
05

技术选型与开源底座二开策略

选型标准不是“哪个最酷”,而是“哪个能最快支持商业闭环,且后续不会把核心能力锁死”。结论是 New API 做主底座,LiteLLM Proxy 做增强层,自研账本/代理/成本/风控。

候选定位优势短板采用建议
New API 中转商业底座 模型渠道、用户额度、倍率、日志、兑换码等能力贴近中转站场景 企业治理、复杂路由、代理商商业体系仍需二开 主底座
LiteLLM Proxy 多模型网关增强 OpenAI 兼容、多 Provider、Virtual Key、预算、限流、路由能力强 商业后台和代理分销能力不是重点 增强层
One API 轻量中转底座 成熟、轻、容易部署 后续商业化和治理能力不如 New API 备选
Portkey 企业级 AI Gateway 对标 路由、缓存、fallback、观测、Guardrails 完整 如果直接商业化使用需评估成本和自控程度 对标/参考
纯自研 完全自控 长期灵活度最高 2 个月风险极高,流式、usage、渠道差异、账本都会拖慢 不建议 v1.0

推荐技术栈

网关底座

New API + LiteLLM Proxy,先独立部署,再按流量和能力逐步打通。

业务后端

Go 或 Python/FastAPI。若团队 Go 强,用 Go 做账本和高并发;若 AI 迭代快,用 FastAPI 做后台服务。

前端

Next.js + React + Tailwind/Ant Design Pro,AI 生成页面效率高。

数据

PostgreSQL 做主库,Redis 做限流/缓存,Loki/ClickHouse 后续承接日志分析。

二开边界

能力处理方式说明
模型转发、基础渠道、模型倍率复用 New API只做必要适配和界面调整
多 Provider 适配、复杂 fallback、BYOK引入 LiteLLM Proxy第 1 个月只接关键模型,第 2 个月增强
余额、订单、扣费、补账自研资金链路必须可审计、可回放、可修复
代理商归因和佣金自研决定分销体系,不能完全寄托开源项目
成本毛利和供应商台账自研商业决策核心数据,必须和账本打通
后台 CRUD 和报表AI 主写人工做 schema、权限、验收
06

核心系统数据流程与时序

API 中转站最关键的是“请求能转发”和“钱能算清楚”。下面两张图分别描述调用扣费数据流和支付充值时序。

API 调用与扣费数据流

ClientOpenAI SDK API Gateway鉴权 / traceId Policy Check余额 / 限流 / 权限 Router供应商 / fallback Provider官方 / 聚合 / 自有 Usage Normalizer统一 token / cost Billing Ledger扣费 / 流水 / 补账 Cost Center收入 / 成本 / 毛利 Logstrace / error / audit 1. 请求进入 2. 余额预检与限流 3. 路由供应商 4. usage 归一化 5. 后扣费和流水落账 6. 成本毛利统计 7. 全链路日志审计

充值与订单状态时序

User Console Order API Payment Ledger 选择套餐 / 充值金额 创建订单 pending 生成支付请求 webhook paid / failed 幂等入账,增加余额 返回余额和订单状态 展示充值成功
07

核心模块拆解与前后置关系

研发拆解不能按页面随意开工,必须围绕主链路依赖。下面的模块关系决定 8 周排期。

模块优先级依赖实现方式负责人验收标准
底座部署 New APIP0服务器、数据库开源部署 + 少量配置后端 + DevOps可完成基础模型调用
LiteLLM PoCP0供应商测试 Key独立部署验证架构师至少 3 个 Provider 可转发
用户与 API KeyP0底座用户体系复用 + 二开后端Key 可创建、禁用、鉴权
Provider/渠道管理P0New API 渠道能力复用 + 成本字段二开后端可配置成本、余额、健康状态
计费账本P0-A用户、模型、订单核心自研架构师 + 高级后端余额扣减、流水、补账准确
充值订单P0-A计费账本自研 + AI 辅助后端订单状态机和幂等入账通过测试
用户控制台P0-B用户、Key、账本 APIAI 主写前端用户可自助完成主链路
管理后台增强P0-B模型、渠道、账本AI 主写 + 人工验收前端 + 后端运营可配置模型和订单
监控告警P0网关日志、部署环境开源组件 + 配置DevOps错误率、延迟、供应商故障可告警
代理商系统P1用户、账本、订单自研 + AI 页面后端 + 前端邀请归因、佣金统计可跑
成本毛利看板P1usage、供应商成本、订单AI 页面 + 自研聚合后端 + 前端按模型/供应商/用户查看毛利
状态页与文档P1模型和监控 APIAI 主写前端 + 产品客户可按文档成功接入
08

AI Coding 工程化研发体系

AI 不是替代技术负责人,而是替代重复编码。越依赖 AI,越需要强架构、强测试、强评审、强门禁。

AI 可主导

后台 CRUD、表单、列表、报表、文档、SDK 示例、测试样板、部署脚本初稿、Mock 数据。

人工必须主导

账本、扣费、支付回调、佣金、密钥管理、权限、安全、路由策略、并发一致性。

AI + 人工协同

前端页面、管理后台、成本看板、代理后台、状态页、接口测试、运维手册。

AI 开发流水线

需求切片 验收标准 AI 生成 人工 Review 自动测试 合并发布 每个任务小于 0.5-1 天;没有验收标准不准让 AI 写代码;资金、安全、权限类代码必须逐行 review。

AI 代码合并门禁

门禁要求失败处理
代码规范lint、format、类型检查通过退回 AI 修复,禁止人工带病合并
单元测试账本、订单、佣金、限流等核心逻辑必须有测试没有测试不得合并
接口测试API 调用、充值、扣费、日志查询需自动化验证失败必须定位到具体模块
安全扫描Gitleaks、依赖漏洞、敏感配置扫描发现密钥或高危漏洞立刻阻断
人工评审核心链路至少 1 名高级工程师 review高风险逻辑需要技术负责人复核
09

研发资源投入、人员安排与成本

AI 辅助模式下,不建议靠人海战术。团队要小而强:1 个强架构师,2-3 个能驾驭 AI 的后端/全栈,1 个前端,1 个 DevOps,1 个产品测试。

推荐 6 人核心团队

岗位人数核心职责AI 使用方式月成本 RMB
技术负责人/架构师1架构、选型、数据模型、核心代码评审、上线把关拆任务、审代码、生成测试、辅助设计35,000-50,000
后端工程师2New API/LiteLLM 二开、账本、支付、代理、风控生成接口样板、迁移脚本、单测、后台 API50,000-80,000
前端工程师1用户台、管理台、代理台、官网、状态页生成页面、表单、图表、交互样板18,000-30,000
DevOps/SRE1部署、监控、日志、备份、安全、CI/CD生成脚本、配置、告警规则初稿25,000-40,000
产品/测试/交付1PRD、验收用例、测试、文档、客户反馈生成验收用例、文档、SOP、测试数据18,000-30,000
AI 工具与测试 API-Codex/Claude Code/Cursor、测试模型消耗研发效率基础设施5,000-20,000
云与监控成本-服务器、数据库、日志、CDN、安全测试与生产环境10,000-40,000
轻量 AI 版

6 人,月成本约 16.1-29 万 RMB;2 个月约 32.2-58 万 RMB。

标准加速版

7-8 人,加 1 名前端/全栈和 1 名 QA,2 个月约 44-76 万 RMB。

传统团队对比

10-12 人传统开发 2 个月成本更高,沟通和返工也更多;AI 模式预计节省 35%-55%。

用人硬要求

  • 技术负责人必须懂后端架构、账本一致性、API 网关、部署安全和 AI Coding 管理。
  • 后端工程师必须能读开源项目源码,不能只会从零写业务 CRUD。
  • 前端工程师必须能驾驭 AI 生成页面,但要能修复状态管理、权限和接口对接问题。
  • DevOps 必须第 1 周介入,不允许最后一周才部署。
  • 产品/测试必须懂 API 业务链路,能写出可自动化的验收用例。
10

建设优先级与依赖关系

优先级以“能否对外商用”为核心判断。P0-A 为人工主导的高风险核心链路,P0-B 为 AI 可大量参与的交付链路。

高商业价值
中商业价值
长期壁垒
高技术风险

P0-A 人工主导

  • 账本扣费
  • 支付回调
  • Key 加密
  • 权限隔离
  • 并发一致性

P1-A 人工设计

  • fallback 策略
  • 供应商成本
  • 异常冻结
  • 风控规则

P2 后续增强

  • 自研路由 DSL
  • 多区域调度
  • 企业私有化
中技术风险

P0-B AI 主写

  • 用户台
  • 管理台
  • 订单页面
  • 日志页面

P1 业务增强

  • 代理后台
  • 佣金看板
  • 毛利看板
  • 状态页

P2 生态

  • Agent 平台
  • 开发者市场
  • 算力租赁
低技术风险

P0 基础设施

  • 部署环境
  • CI/CD
  • 文档站
  • SDK 示例

可延后

  • 多语言全量
  • 营销官网复杂动画
  • 高级主题配置

不进 v1.0

  • 完整白标系统
  • 复杂投资人看板
  • 重型 BI 仓库

关键前后置关系

前置任务后置任务原因
底座部署 + 首批供应商接入API 调用链路、用户控制台没有真实调用,所有页面都是空壳
用户、模型、价格数据模型账本、订单、毛利看板计费必须先统一模型和价格口径
账本扣费充值、代理佣金、成本毛利所有商业数据都依赖账本流水
调用日志和 traceId监控、告警、状态页、客服排障没有 trace 就不能定位客户问题
代理归因佣金结算先确定客户归属,才能计算佣金
CI/CD 和测试环境AI 批量开发AI 产出必须依赖自动门禁兜底
11

8 周详细研发计划

每周都有明确产出和验收。第 4 周必须完成内测闭环,第 6 周必须公测,第 8 周形成可对外销售版本。

周次核心目标研发任务并行任务验收标准
第 1 周 技术底座与规范冻结 New API 部署、LiteLLM PoC、PostgreSQL/Redis、CI/CD、核心数据模型、AI 开发规范 供应商测试 Key、品牌域名、产品原型、验收用例 至少 3 个模型可通过测试环境转发
第 2 周 API 调用主链路 用户、API Key、模型列表、渠道管理、基础日志、流式响应验证 AI 生成用户台/管理台初版、文档站骨架 用户 Key 可调用主流模型并记录日志
第 3 周 计费和订单主链路 账本、usage normalizer、模型倍率、余额扣减、订单状态机、人工充值 AI 生成订单页面、流水页面、充值页面 充值后调用扣费,流水可追踪,余额准确
第 4 周 内测版本 用户控制台闭环、管理后台配置、API 文档、SDK 示例、第一批内测客户 客服 SOP、FAQ、价格表、种子客户导入 10-20 个内测用户可完成接入
第 5 周 代理和毛利体系 代理邀请、客户归因、佣金统计、成本字段、毛利看板、供应商健康检查 代理协议、代理素材、客服排障流程 至少 3 个代理可跑测试客户归因
第 6 周 稳定性与公测 fallback、限流、告警、异常冻结、压测、安全扫描、公测发布 状态页、故障公告模板、监控日报 公测请求成功率 97%+,核心告警可用
第 7 周 商业化补齐 企业套餐、代理结算单、成本报表、管理台补齐、bug 修复 销售材料、案例沉淀、运维手册 可支持 30-50 个真实客户试运营
第 8 周 正式上线 v1.0 生产发布、回滚预案、备份演练、验收报告、二期 Agent 规划 代理招募、客户转化、客服值班 正式对外销售,形成日常运营机制
12

项目甘特图

甘特图展示 8 周交付节奏。技术底座、前端页面、供应商、运维、文档、代理体系必须并行推进。

任务 / 周
W1
W2
W3
W4
W5
W6
W7
W8
技术选型 & PoC
底座部署 & 供应商接入
API 网关与调用链路
计费账本 & 订单
用户台 / 管理台
代理商系统
监控 / 告警 / 安全
文档 / 状态页 / SOP
内测 / 公测 / 正式上线
13

资源到位时间规划

资源不到位是 2 个月计划最大的非技术风险。服务器、API 合作商、支付、法务协议必须前置,不允许等研发完成后再补。

时间资金与预算服务器/基础设施API 合作商运营/法务资源
D0-D3确认 2 个月研发预算和 API 测试预算域名、Cloudflare、Git 仓库、测试服务器、PostgreSQL、RedisOpenAI、Anthropic、Google、OpenRouter 测试账号产品负责人、技术负责人、项目群、日报模板
第 1 周开通 AI Coding 工具、测试模型额度CI/CD、测试环境、日志基础设施Together、DeepInfra、Groq、SiliconFlow、Azure/GCP 评估服务条款、隐私政策、AUP 初稿
第 2 周首批供应商充值预算生产环境雏形、备份策略、监控面板确认首批 4-6 个生产供应商价格表、套餐、代理政策初稿
第 3-4 周支付通道保证金/手续费预算生产数据库、对象存储、邮件服务供应商成本台账、额度预警机制代理协议、企业合同模板、客服 SOP
第 5-6 周公测补贴预算和异常消耗备用金压测资源、安全扫描、状态页备用供应商和 fallback 配置种子客户、代理商名单、公测公告
第 7-8 周正式运营预算和续费预算生产扩容方案、值班机制、回滚预案企业合同/更高额度谈判销售材料、运维手册、验收报告
14

质量、安全与运维体系

API 中转站卖的是稳定性和信任,质量体系不能等上线后再补。尤其是 AI 生成代码,必须用自动化门禁和人工审查兜底。

测试体系

单元测试覆盖账本、订单、分佣、限流;接口测试覆盖调用、充值、扣费、日志;Playwright 覆盖用户主链路。

安全体系

API Key 加密、Secrets 管理、权限分层、审计日志、Gitleaks、依赖漏洞扫描、IP/设备异常检测。

运维体系

Prometheus、Grafana、Loki、Sentry、状态页、告警机器人、备份恢复、发布回滚、事故复盘。

上线质量指标

指标内测线公测线正式上线线
API 请求成功率95%+97%+98%+
账本扣费准确率99%99.5%99.9%
网关额外延迟 P95< 500ms< 350ms< 250ms
关键告警覆盖错误率、供应商失败成本、余额、延迟全链路、SLA、异常消费
数据备份每日备份每日备份 + 恢复演练自动备份 + RPO/RTO 记录
15

风险预估与应对措施

风险控制重点围绕技术、成本、周期、供应链和 AI 代码质量。每项风险必须有触发信号和应对动作。

风险触发信号影响应对措施Owner
开源底座二开困难第 1 周 PoC 无法跑通核心场景周期延误立即切换备选:New API/One API/LiteLLM 组合降级,核心账本独立技术负责人
账本误差usage 与扣费不一致、并发扣费错乱资金损失、信任崩塌账本流水不可变、幂等扣费、补账任务、每日对账高级后端
AI 代码质量不稳bug 多、风格乱、测试缺失返工增加小任务、强模板、强 review、测试门禁、禁止 AI 直接改核心账本架构师
上游断供或限流供应商错误率升高、余额不足、接口失败客户调用失败多供应商、健康检查、自动 fallback、余额预警、备用供应商DevOps + 供应商运营
成本失控高成本模型调用异常、低价包被套利毛利变负预算阈值、模型白名单、限购、成本实时告警、异常冻结产品 + 后端
支付审核拖延支付通道 2 周内未开通无法自动收款先支持人工入账和企业转账,支付自动化并行推进项目负责人
周期膨胀P1/P2 需求挤占 P02 个月无法上线P0 冻结,需求委员会每周裁剪,P2 全部移入二期项目负责人
安全泄露密钥进入代码、日志泄露敏感信息重大事故Secrets Vault、Gitleaks、日志脱敏、最小权限、审计DevOps
16

最终验收标准与交付物

v1.0 上线不是“页面做完”,而是商业主链路和运维主链路都可闭环。

业务链路验收
  • 新用户可注册、充值、创建 API Key。
  • 用户使用 OpenAI SDK 可成功调用至少 6 类模型。
  • 调用后实时或准实时扣费,并生成消费流水。
  • 余额不足、权限不足、限流、供应商失败有明确错误。
  • 代理商可邀请客户并看到客户消耗和佣金。
技术链路验收
  • 管理端可配置供应商、模型、倍率和用户额度。
  • 每笔请求有 traceId、provider、model、usage、cost。
  • 核心供应商失败后可切换备用供应商。
  • Prometheus/Grafana/Sentry/Loki 基础监控可用。
  • 数据库备份、发布回滚、事故处理文档完成。

交付物清单

交付物内容责任人
生产系统API 中转平台、用户台、管理台、代理台、文档站、状态页技术负责人
源代码与部署文档代码仓库、README、部署脚本、环境变量说明、回滚流程DevOps
接口文档OpenAI-compatible API、模型列表、错误码、SDK 示例产品/测试
测试报告单元测试、接口测试、压测、安全扫描、验收用例QA/产品
运维手册监控、告警、备份、事故处理、供应商切换、账本补账DevOps
运营手册价格配置、充值审核、代理结算、客服排障、异常用户处理运营负责人
最可能完成时间:6 周核心链路可用,8 周对外商用。正常完成时间:8 周核心链路可用,10 周商业稳定。若供应商、支付或核心人员不到位,应按 12 周保守计划管理预期。