レート設定¶
レート設定(倍率設定)は NewAPI 課金システムの核心的な設定であり、異なる倍率を設定することで、様々なモデルやユーザーグループの課金基準を柔軟に制御できます。
レートシステム概要¶
NewAPI は、ユーザーのクォータ消費を計算するために三層の倍率体系を使用します。
- モデル倍率(ModelRatio) - 異なるAIモデルの基本課金倍数を定義
- 補完倍率(CompletionRatio) - 出力トークンに追加の課金調整を行う
- グループ倍率(GroupRatio) - 異なるユーザーグループに対して差別化された課金倍数を設定
クォータと倍率の関係¶
New API システムにおいて、倍率はクォータ消費を計算するための重要なパラメータです。クォータはシステム内部の課金単位であり、すべてのAPIコールは最終的にクォータポイントに変換されて差し引かれます。
クォータ単位変換:
- 1 米ドル = 500,000 クォータポイント
- クォータポイントはシステム内部課金の基本単位です
- ユーザーの残高、消費履歴はすべてクォータポイントに基づきます
クォータ計算式¶
従量課金モデル(トークン消費ベース)¶
従回数課金モデル(固定価格)¶
オーディオモデル(特殊処理、new-api内部で自動処理)¶
事前消費と事後消費のメカニズム¶
New API は、事前消費と事後消費の二重課金メカニズムを採用しています。
- 事前消費フェーズ:APIコール前に、予測トークン数に基づいてクォータ消費を計算し、事前控除
- 事後消費フェーズ:APIコール完了後、実際のトークン数に基づいてクォータ消費を再計算
- 差額調整:実際の消費が事前消費と異なる場合、システムは自動的にユーザーのクォータ残高を調整します
モデル倍率設定¶
モデル倍率は、異なるAIモデルの基本課金倍数を定義します。システムは様々なモデルに対してデフォルトの倍率を事前に設定しています。
一般的なモデル倍率の例¶
モデル名称 | モデル倍率 | 補完倍率 | 公式価格(入力) | 公式価格(出力) |
---|---|---|---|---|
gpt-4o | 1.25 | 4 | $2.5/1M Tokens | $10/1M Tokens |
gpt-3.5-turbo | 0.25 | 1.33 | $0.5/1M Tokens | $1.5/1M Tokens |
gpt-4o-mini | 0.075 | 4 | $0.15/1M Tokens | $0.6/1M Tokens |
o1 | 7.5 | 4 | $15/1M Tokens | $60/1M Tokens |
倍率の意味の説明:
- モデル倍率:基本課金単位に対する倍数で、モデルのコスト差を反映します
- 補完倍率:出力トークンが入力トークンに対して課金される倍数で、出力コストの差を反映します
- 倍率が高いほど、消費されるクォータが多くなります。倍率が低いほど、消費されるクォータが少なくなります
設定方法¶
- JSON形式設定:モデル倍率JSON設定を直接編集
- 可視化エディタ:グラフィカルインターフェースを通じて倍率を設定
補完倍率設定¶
補完倍率は、出力トークンに追加の課金を行うために使用され、主に異なるモデルの入出力コストの差を均衡させるために使用されます。
デフォルトの補完倍率¶
モデルタイプ | 公式価格(入力) | 公式価格(出力) | 補完倍率 | 説明 |
---|---|---|---|---|
gpt-4o | 2.5$/1M Tokens | 10$/1M Tokens | 4 | 出力は入力の4倍 |
gpt-3.5-turbo | 0.5$/1M Tokens | 1$/1M Tokens | 2 | 出力は入力の2倍 |
gpt-image-1 | 5$/1M Tokens | 40$/1M Tokens | 8 | 出力は入力の8倍 |
gpt-4o-mini | 0.15$/1M Tokens | 0.6$/1M Tokens | 4 | 出力は入力の4倍 |
その他モデル | 1 | 1 | 1 | 出力は入力の1倍 |
設定に関する説明¶
- 補完倍率は主に出力トークンの課金に影響します
- 1に設定すると、出力トークンの課金は入力トークンの課金と同じになります
- 1より大きい場合は出力トークンの課金が高くなり、1より小さい場合は出力トークンの課金が低くなります
グループ倍率設定¶
グループ倍率により、異なるユーザーグループに対して差別化された課金倍数を設定し、柔軟な価格設定戦略を実現できます。
グループ倍率設定¶
グループ倍率の優先順位¶
- ユーザー専用倍率:特定のユーザーに設定された個人倍率
- グループ倍率:ユーザーが所属するグループの倍率
- デフォルト倍率:システムデフォルト倍率(通常 1.0)
可視化された倍率設定¶
可視化エディタは、直感的な倍率管理インターフェースを提供し、以下をサポートします。
- モデル倍率の一括編集
- 倍率設定のリアルタイムプレビュー
- 競合検出とヒント
- アップストリーム倍率のワンクリック同期
倍率が未設定のモデル¶
倍率が設定されていないモデルについて、システムは以下を行います。
- 自用モード:デフォルト倍率 37.5 を使用
- 商業モード:「倍率または価格が未設定」エラーを提示
- 自動検出:管理インターフェースに未設定のモデルを表示
アップストリーム倍率の同期¶
システムは、アップストリームチャネルからの倍率設定の自動同期をサポートしています。
- アップストリームモデル倍率の自動取得
- ローカル倍率設定の一括更新
- アップストリーム価格との同期維持
- 手動調整と上書きをサポート
よくある質問¶
Q: 新しいモデルに倍率を設定するにはどうすればよいですか?¶
A: 可視化エディタを通じて新しいモデルを追加するか、JSON設定に直接追加できます。まずは控えめな倍率を設定し、実際の使用状況に基づいて調整することをお勧めします。
Q: グループ倍率はどのように有効になりますか?¶
A: グループ倍率はモデル倍率と乗算され、最終的にユーザーのクォータ消費計算に影響を与えます。ユーザーの実際の倍率 = モデル倍率 × グループ倍率です。
Q: 補完倍率の役割は何ですか?¶
A: 補完倍率は、主に入力トークンと出力トークンのコスト差を均衡させるために使用されます。一部のモデルでは、出力コストが入力コストよりもはるかに高いため、補完倍率による調整が必要です。
Q: 類似モデルの倍率を一括設定するにはどうすればよいですか?¶
A: 可視化エディタを使用して一括操作を行うか、JSON設定に類似モデルの倍率設定を一括で追加できます。
クォータ計算例¶
例1:GPT-4 標準ユーザーの会話¶
シナリオパラメータ:
- 入力トークン:1,000
- 出力トークン:500
- モデル倍率:15
- 補完倍率:2
- グループ倍率:1.0(標準ユーザー)
計算プロセス:
ドル換算コスト:30,000 ÷ 500,000 = $0.06
例2:GPT-3.5 VIPユーザーの会話¶
シナリオパラメータ:
- 入力トークン:2,000
- 出力トークン:1,000
- モデル倍率:0.25
- 補完倍率:1.33
- グループ倍率:0.5(VIPユーザー 50%割引)
計算プロセス:
ドル換算コスト:416.25 ÷ 500,000 = $0.00083
例3:従回数課金モデル(例:Midjourney)¶
シナリオパラメータ:
- モデル固定価格:$0.02
- グループ倍率:1.0(標準ユーザー)
- クォータ単位:500,000
計算プロセス:
ドル換算コスト:10,000 ÷ 500,000 = $0.02
課金ルールの詳細については、よくある質問をご覧ください。