レート設定
レート設定は、NewAPIの内部コスト計算システムの中核となる設定であり、異なるレートを設定することで、さまざまなモデルやユーザーグループの組織内部のコスト配分、予算管理、または企業顧客の会計設定基準を柔軟に制御できます。
レートシステムの概要
NewAPIは、ユーザーのクォータ消費量を計算するために3層のレート体系を使用しています。
- モデルレート(ModelRatio) - 異なるAIモデルの基本課金倍数を定義します
- 補完レート(CompletionRatio) - 出力トークンに追加の課金調整を行います
- グループレート(GroupRatio) - 異なるユーザーグループに差別化された課金倍数を設定します
クォータとレートの関係
New APIシステムでは、レートはクォータ消費量を計算するための重要なパラメータです。クォータはシステム内部の課金単位であり、すべてのAPI呼び出しは最終的にクォータポイントに変換され、差し引かれます。
クォータ単位の変換:
- 1ドル = 500,000クォータポイント
- クォータポイントはシステム内部課金の基本単位です
- ユーザーの残高、消費履歴はすべてクォータポイントに基づきます
クォータ計算式
従量課金モデル(トークン消費量に基づく)
配额消耗 = (输入token数 + 输出token数 × 补全倍率) × 模型倍率 × 分组倍率回数課金モデル(固定価格)
配额消耗 = 模型固定价格 × 分组倍率 × 配额单位(500,000)オーディオモデル(特殊処理、New API内部で自動処理)
配额消耗 = (文本输入token + 文本输出token × 补全倍率 + 音频输入token × 音频倍率 + 音频输出token × 音频倍率 × 音频补全倍率) × 模型倍率 × 分组倍率事前消費と事後消費のメカニズム
New APIは、事前消費と事後消費の二重課金メカニズムを採用しています。
- 事前消費フェーズ:API呼び出し前、予測トークン数に基づいてクォータ消費量を計算し、事前控除します
- 事後消費フェーズ:API呼び出し完了後、実際のトークン数に基づいてクォータ消費量を再計算します
- 差額調整:実際の消費量が事前消費と異なる場合、システムは自動的にユーザーのクォータ残高を調整します
预消费配额 = 预估token数 × 模型倍率 × 分组倍率
实际配额 = 实际token数 × 模型倍率 × 分组倍率
配额调整 = 实际配额 - 预消费配额モデルレート設定
モデルレートは、異なるAIモデルの基本課金倍数を定義します。システムは、さまざまなモデルにデフォルトレートをプリセットしています。
一般的なモデルレートの例
| モデルタイプ | モデルレート | 補完レート | 公式サイト価格(入力) | 公式サイト価格(出力) |
|---|---|---|---|---|
| gpt-4o | 1.25 | 4 | $2.5/1M Tokens | $10/1M Tokens |
| gpt-3.5-turbo | 0.25 | 1.33 | $0.5/1M Tokens | $1.5/1M Tokens |
| gpt-4o-mini | 0.075 | 4 | $0.15/1M Tokens | $0.6/1M Tokens |
| o1 | 7.5 | 4 | $15/1M Tokens | $60/1M Tokens |
レートの意味の説明:
- モデルレート:基本課金単位に対する倍数で、モデルのコスト差を反映します
- 補完レート:出力トークンが入力トークンに対する課金倍数で、出力コストの差を反映します
- レートが高いほど、消費されるクォータは多くなります。レートが低いほど、消費されるクォータは少なくなります。
設定方法
- JSON形式での設定:モデルレートのJSON設定を直接編集します
- ビジュアルエディタ:グラフィカルインターフェースを通じてレートを設定します

補完レート設定
補完レートは、出力トークンに追加の課金を行うために使用され、主に入出力コストの差を均衡させるために使用されます。
デフォルトの補完レート
| モデルタイプ | 公式サイト価格(入力) | 公式サイト価格(出力) | 補完レート | 説明 |
|---|---|---|---|---|
| gpt-4o | 2.5$/1M Tokens | 10$/1M Tokens | 4 | 出力は入力の4倍 |
| gpt-3.5-turbo | 0.5$/1M Tokens | 1$/1M Tokens | 2 | 出力は入力の2倍 |
| gpt-image-1 | 5$/1M Tokens | 40$/1M Tokens | 8 | 出力は入力の8倍 |
| gpt-4o-mini | 0.15$/1M Tokens | 0.6$/1M Tokens | 4 | 出力は入力の4倍 |
| その他のモデル | 1 | 1 | 1 | 出力は入力の1倍 |
設定の説明
- 補完レートは、主に出力トークンの課金に影響します
- 1に設定すると、出力トークンの課金が入力トークンの課金と同じであることを意味します
- 1より大きい場合は出力トークンの課金が高く、1より小さい場合は出力トークンの課金が低いことを意味します
グループレート設定
グループレートを使用すると、異なるユーザーグループに差別化された課金倍数を設定できます。これにより、組織内部のコスト配分、予算管理、または企業顧客の会計設定を実現します。
グループレート設定
{
"internal-test": 0.5,
"standard": 1.0,
"enterprise-client": 0.8,
"trial": 2.0
}グループレートの優先順位
- ユーザー専用レート:特定のユーザーに設定された個人レート
- グループレート:ユーザーが所属するグループのレート
- デフォルトレート:システムのデフォルトレート(通常1.0)

ビジュアルレート設定
ビジュアルエディタは、直感的なレート管理インターフェースを提供し、以下をサポートします。
- モデルレートの一括編集
- レート設定のリアルタイムプレビュー
- 競合検出とヒント
- アップストリームレートのワンクリック同期

レートが設定されていないモデル
レートが設定されていないモデルの場合、システムは以下を行います。
- 自己利用モード:デフォルトレート37.5を使用します
- 課金モード:「レートまたは価格が未設定」というエラーを提示します
- 自動検出:管理インターフェースに未設定のモデルを表示します

アップストリームレートの同期
システムは、アップストリームチャネルからのレート設定の自動同期をサポートしています。
- 適法に許可されたアップストリームの公開または許可された価格/モデルメタデータのみを同期します
- ローカルレート設定の一括更新
- アップストリーム価格との同期を維持します
- 手動調整と上書きをサポートします

よくある質問
Q: 新しいモデルにレートを設定するにはどうすればよいですか?
A: ビジュアルエディタを通じて新しいモデルを追加するか、JSON設定に直接追加できます。まずは保守的なレートを設定し、実際の使用状況に応じて調整することをお勧めします。
Q: グループレートはどのように適用されますか?
A: グループレートはモデルレートと乗算され、最終的にユーザーのクォータ消費量計算に影響を与えます。ユーザーの実際のレート = モデルレート × グループレート。
Q: 補完レートの役割は何ですか?
A: 補完レートは、主に入出力トークンのコスト差を均衡させるために使用されます。一部のモデルでは、出力コストが入力コストよりもはるかに高いため、補完レートを通じて調整する必要があります。
Q: 類似モデルのレートを一括設定するにはどうすればよいですか?
A: ビジュアルエディタで一括操作を行うか、JSON設定に類似モデルのレート設定を一括で追加できます。
クォータ計算例
例1:GPT-4 標準ユーザーとの会話
シナリオパラメータ:
- 入力トークン:1,000
- 出力トークン:500
- モデルレート:15
- 補完レート:2
- グループレート:1.0(標準ユーザー)
計算プロセス:
配额消耗 = (1,000 + 500 × 2) × 15 × 1.0
= (1,000 + 1,000) × 15
= 2,000 × 15
= 30,000 配额点数等価ドルコスト:30,000 ÷ 500,000 = $0.06
例2:GPT-3.5 内部テストグループとの会話
シナリオパラメータ:
- 入力トークン:2,000
- 出力トークン:1,000
- モデルレート:0.25
- 補完レート:1.33
- グループレート:0.5(内部テストグループ)
計算プロセス:
配额消耗 = (2,000 + 1,000 × 1.33) × 0.25 × 0.5
= (2,000 + 1,330) × 0.125
= 3,330 × 0.125
= 416.25 配额点数等価ドルコスト:416.25 ÷ 500,000 = $0.00083
例3:回数課金モデル(Midjourneyなど)
シナリオパラメータ:
- モデル固定価格:$0.02
- グループレート:1.0(標準ユーザー)
- クォータ単位:500,000
計算プロセス:
配额消耗 = 0.02 × 1.0 × 500,000
= 10,000 配额点数等価ドルコスト:10,000 ÷ 500,000 = $0.02
その他の課金ルールについては、よくある質問をご覧ください。
このガイドはいかがですか?
最終更新