# 倍率设置 倍率设置是 NewAPI 计费系统的核心配置,通过设置不同的倍率可以灵活控制各种模型和用户组的计费标准。 ## 倍率系统概述 NewAPI 使用三层倍率体系来计算用户的配额消耗: 1. 模型倍率(ModelRatio) - 定义不同AI模型的基础计费倍数 2. 补全倍率(CompletionRatio) - 对输出token进行额外计费调整 3. 分组倍率(GroupRatio) - 为不同用户组设置差异化计费倍数 ### 配额与倍率的关系 在 New API 系统中,倍率是计算配额消耗的关键参数。配额是系统内部的计费单位,所有的API调用最终都会转换为配额点数进行扣减。 配额单位转换: * 1 美元 = 500,000 配额点数 * 配额点数是系统内部计费的基础单位 * 用户的余额、消费记录都以配额点数为准 ### 配额计算公式 #### 按量计费模型(基于Token消耗) ``` 配额消耗 = (输入token数 + 输出token数 × 补全倍率) × 模型倍率 × 分组倍率 ``` #### 按次计费模型(固定价格) ``` 配额消耗 = 模型固定价格 × 分组倍率 × 配额单位(500,000) ``` #### 音频模型(特殊处理,new-api内部自动处理) ``` 配额消耗 = (文本输入token + 文本输出token × 补全倍率 + 音频输入token × 音频倍率 + 音频输出token × 音频倍率 × 音频补全倍率) × 模型倍率 × 分组倍率 ``` #### 预消费与后消费机制 New API 采用预消费和后消费的双重计费机制: 1. **预消费阶段**:API调用前,根据预估token数计算配额消耗并预扣 2. **后消费阶段**:API调用完成后,根据实际token数重新计算配额消耗 3. **差额调整**:如果实际消耗与预消费不同,系统会自动调整用户配额余额 ``` 预消费配额 = 预估token数 × 模型倍率 × 分组倍率 实际配额 = 实际token数 × 模型倍率 × 分组倍率 配额调整 = 实际配额 - 预消费配额 ``` ## 模型倍率设置 模型倍率定义了不同AI模型的基础计费倍数,系统为各种模型预设了默认倍率。 ### 常见模型倍率示例 | 模型名称 | 模型倍率 | 补全倍率 | 官网价格(输入) | 官网价格(输出) | | ------------- | ----- | ---- | --------------- | -------------- | | gpt-4o | 1.25 | 4 | $2.5/1M Tokens | $10/1M Tokens | | gpt-3.5-turbo | 0.25 | 1.33 | $0.5/1M Tokens | $1.5/1M Tokens | | gpt-4o-mini | 0.075 | 4 | $0.15/1M Tokens | $0.6/1M Tokens | | o1 | 7.5 | 4 | $15/1M Tokens | $60/1M Tokens | 倍率含义说明: * 模型倍率:相对于基础计费单位的倍数,反映模型的成本差异 * 补全倍率:输出token相对于输入token的计费倍数,反映输出成本差异 * 倍率越高,消耗的配额越多;倍率越低,消耗的配额越少 ### 设置方法 1. JSON格式设置:直接编辑模型倍率JSON配置 2. 可视化编辑器:通过图形界面设置倍率 倍率1 ## 补全倍率设置 补全倍率用于对输出token进行额外计费,主要用于平衡不同模型的输入输出成本差异。 ### 默认补全倍率 | 模型类型 | 官网价格(输入) | 官网价格(输出) | 补全倍率 | 说明 | | ------------- | --------------- | -------------- | ---- | -------- | | gpt-4o | 2.5$/1M Tokens | 10$/1M Tokens | 4 | 输出是输入的4倍 | | gpt-3.5-turbo | 0.5$/1M Tokens | 1$/1M Tokens | 2 | 输出是输入的2倍 | | gpt-image-1 | 5$/1M Tokens | 40$/1M Tokens | 8 | 输出是输入的8倍 | | gpt-4o-mini | 0.15$/1M Tokens | 0.6$/1M Tokens | 4 | 输出是输入的4倍 | | 其他模型 | 1 | 1 | 1 | 输出是输入的1倍 | ### 设置说明 * 补全倍率主要影响输出token的计费 * 设置为1表示输出token计费与输入token计费相同 * 大于1表示输出token计费更高,小于1表示输出token计费更低 ## 分组倍率设置 分组倍率允许为不同用户组设置差异化的计费倍数,实现灵活的定价策略。 ### 分组倍率配置 ```json { "vip": 0.5, "premium": 0.8, "standard": 1.0, "trial": 2.0 } ``` ### 分组倍率优先级 1. 用户专属倍率:为特定用户设置的个人倍率 2. 分组倍率:用户所属分组的倍率 3. 默认倍率:系统默认倍率(通常为1.0) 倍率2 ## 可视化倍率设置 可视化编辑器提供了直观的倍率管理界面,支持: * 批量编辑模型倍率 * 实时预览倍率配置 * 冲突检测和提示 * 一键同步上游倍率 倍率3 ## 未设置倍率模型 对于未设置倍率的模型,系统会: 1. 自用模式:使用默认倍率37.5 2. 商业模式:提示"倍率或价格未配置"错误 3. 自动检测:在管理界面显示未配置的模型 倍率4 ## 上游倍率同步 系统支持从上游渠道自动同步倍率设置: * 自动获取上游模型倍率 * 批量更新本地倍率配置 * 保持与上游价格同步 * 支持手动调整和覆盖 倍率5 ## 常见问题 ### Q: 如何为新模型设置倍率? A: 可以通过可视化编辑器添加新模型,或直接在JSON配置中添加。建议先设置保守倍率,根据实际使用情况调整。 ### Q: 分组倍率如何生效? A: 分组倍率会与模型倍率相乘,最终影响用户的配额消耗计算。用户的实际倍率 = 模型倍率 × 分组倍率。 ### Q: 补全倍率的作用是什么? A: 补全倍率主要用于平衡输入输出token的成本差异。某些模型的输出成本远高于输入成本,需要通过补全倍率进行调整。 ### Q: 如何批量设置相似模型的倍率? A: 可以通过可视化编辑器进行批量操作,或者直接在JSON配置中批量添加相似模型的倍率设置。 ## 配额计算实例 ### 示例1:GPT-4 标准用户对话 场景参数: * 输入token:1,000 * 输出token:500 * 模型倍率:15 * 补全倍率:2 * 分组倍率:1.0(标准用户) 计算过程: ``` 配额消耗 = (1,000 + 500 × 2) × 15 × 1.0 = (1,000 + 1,000) × 15 = 2,000 × 15 = 30,000 配额点数 ``` 等价美元成本:30,000 ÷ 500,000 = $0.06 ### 示例2:GPT-3.5 VIP用户对话 场景参数: * 输入token:2,000 * 输出token:1,000 * 模型倍率:0.25 * 补全倍率:1.33 * 分组倍率:0.5(VIP用户50%折扣) 计算过程: ``` 配额消耗 = (2,000 + 1,000 × 1.33) × 0.25 × 0.5 = (2,000 + 1,330) × 0.125 = 3,330 × 0.125 = 416.25 配额点数 ``` 等价美元成本:416.25 ÷ 500,000 = $0.00083 ### 示例3:按次计费模型(如Midjourney) 场景参数: * 模型固定价格:$0.02 * 分组倍率:1.0(标准用户) * 配额单位:500,000 计算过程: ``` 配额消耗 = 0.02 × 1.0 × 500,000 = 10,000 配额点数 ``` 等价美元成本:10,000 ÷ 500,000 = $0.02 有关更多计费规则,请查看[常见问题](/zh/docs/support/faq)