Claude CodeのFast modeは「別の高性能モデル」ではなく、いつものOpusを速度優先で走らせる研究プレビュー機能です。効くのは出力速度(最大2.5倍)だけで、課金はサブスク枠ではなくusage creditsから従量で引かれます(会話途中で初めてオンにすると、その時点のコンテキスト全体に一度だけFast単価が上乗せされます)。この記事は自分のお金でCLIを動かす個人開発者・ブロガー向けに、正体・有効化・料金影響・使い分けを公式情報(2026年6月8日最終確認)で整理します。
この記事の要点
- Fast modeは別モデルではなく、同じOpusを速度優先で動かす設定(質は同じ・最大2.5倍速)
- 速くなるのは出力速度(OTPS)だけで、最初の応答までの時間(TTFT)は変わらない
- 料金はサブスクのプラン枠外、usage creditsから従量で引かれる(Opus 4.8で$10/$50・per MTok)
- 対話デバッグはFast、長時間の自走やCI/CDは標準が得という使い分けが基本
Claude CodeのFast modeとは?正体・速度・対応環境

Fast modeは「速度優先で動くOpus」であって、新しい賢いモデルではありません。同じClaude Opusを、コスト効率より速度を優先した推論設定で動かす仕組みで、知能・能力・モデルの重みは標準と同じだと公式ドキュメントが明言しています。だから「Fast modeにすれば回答が賢くなる」という期待は外れます。変わるのは速さと料金だけです。
もう一つの誤解が「速くなる=待ち時間ゼロ」です。Fast modeが速くするのは出力トークン毎秒(OTPS)で、最初の1文字が返るまでの時間(TTFT)は対象外。考え始めるまでの待ちは縮まず、生成が始まってからの出力が最大2.5倍速くなる、というのが正確な理解です。
結論:30秒でわかるFast modeの全体像
結論から言うと、Fast modeは「急いでいる対話作業のときだけ、追加料金を払って出力を速くするスイッチ」です。コードの試行錯誤やライブデバッグのように、こちらが画面を見て待っている時間が長い作業で効果を体感しやすい設定だと公式は位置づけています。手元で何度もやり取りを往復する作業ほど、1往復の待ち時間が短くなる恩恵が積み上がります。
逆に、夜間にまとめてリファクタを自走させる、CI/CDで流す、といった「人が待っていない処理」では速度メリットが薄く、割高なだけになります。バッチ処理やコスト最優先の作業も同様で、こうした場面は標準モードのままが合理的です。まずはこの「対話=Fast、自走=標準」という軸を押さえれば、細かい仕様は後から足していけます。
判断の順番としては、次の2点を上から確認します。この2点を満たして初めて、料金とバージョンの細部を詰める段階に進みます。
- いま自分は画面の前で応答を待っているか:待っているならFast modeの出番、放置して別作業に移れるならFast modeは不要、という切り分けです。
- 使うモデルはOpusか:SonnetやHaikuではそもそも有効化できないため、Fast modeを前提にするならモデルがOpusである必要があります。
さらに踏み込むと、Fast modeは「常時オン」にする機能ではなく「速さが必要な局面だけ入れるブースト」として扱うのが基本です。常用すると料金が読みにくくなるため、速度が要る作業の入口でオンにし、終わったら標準へ戻す、という出し入れの習慣を最初に決めておくと運用が安定します。
本記事の情報はAnthropicの公式ドキュメント(Claude Code Docs: fast mode / Claude API Docs: Fast mode (research preview))を2026年6月8日に確認して整理しています。Fast modeは研究プレビューのため、料金や提供範囲が今後変わる可能性があります。導入前にはリンク先で最新の数値を確認してください。
Fast modeの正体:別モデルではなく「速度優先のOpus」
公式は「Fast mode is not a different model.(Fast modeは別モデルではない)」と書いています。実体は同じOpusを、速度を優先したインフラ構成で動かしているだけです。回答の品質や振る舞いは標準と同一で、速くなったぶん質が落ちるという心配は不要だと明記されています。
Fast mode is not a different model. It uses Claude Opus with a different API configuration that prioritizes speed over cost efficiency. You get identical quality and capabilities with faster responses.(Fast modeは別モデルではありません。コスト効率より速度を優先したAPI構成でClaude Opusを使うもので、同じ品質と能力のまま応答が速くなります。)
APIの内部実装でも、リクエストに `speed: “fast”` を指定して同じモデルの重みを速い構成で回しているだけ、と説明されています。レスポンスの `usage.speed` フィールドで `”fast”` か `”standard”` かを確認することもできます。つまりFast modeは「モデル選び」ではなく「同じモデルの速度モード」です。Opusを使っている前提のうえでの、ギアの切り替えだと考えると分かりやすいです。賢さを底上げする機能ではないので、難しいタスクで質を上げたいときはFast modeではなくモデルやeffortの調整で対応します。なお高速設定と標準設定を同じ会話の途中で切り替えると、prompt cacheが無効化されます。速度の違うリクエストはキャッシュした共通部分を共有しないため、頻繁に切り替えるとキャッシュの取り直しが発生する点も、APIで作り込むときは頭に入れておくとよいでしょう。
速度の中身:2.5倍はOTPS、TTFTは速くならない
公式が示す速度は「標準比で最大2.5倍の出力トークン毎秒」です。ここでいう速さは生成スピード(OTPS)であって、最初の応答が返るまでの遅延(TTFT)ではありません。短い質問を投げて「最初の反応が遅い」と感じても、それはFast modeの効果範囲外です。期待値を「最初の沈黙が消える」ではなく「出力が始まってから速い」に置き換えておくと、体感とのギャップを避けられます。
効果が実感しやすいのは、長めの回答やコード差分がだらだら出力される場面です。出力が長いほど2.5倍速の恩恵が積み上がります。一方、ごく短い応答の連打では体感差が出にくいので、用途を選ぶ機能だと理解しておくと判断がぶれません。たとえば数十行のリファクタ案を一気に書き出させるようなやり取りでは、出力が流れ終わるまでの待ちが目に見えて短くなります。反対に「はい/いいえ」で済む確認の往復では、出力自体が短いため2.5倍にしても削れる秒数はわずかです。
なお速度に関わる設定にはeffort levelもありますが、こちらは思考時間を減らして速くするもので、複雑なタスクでは質が落ちる可能性があります。Fast mode(同品質・低レイテンシ・高コスト)とeffort(思考量の調整)は別物で、単純作業では両方を併用して最速にすることもできます。逆に難しい問題では、effortを下げると精度を落としかねないので、速さが欲しくてもFast modeだけにとどめてeffortは保つ、という組み合わせ方が安全です。速度の出どころが「出力スピード」なのか「思考量の削減」なのかを区別しておくと、どちらを触るべきか迷わなくなります。公式も両者を別の設定として並べており、Fast modeは「同じ品質のまま低レイテンシ・高コスト」、effortは「思考時間を減らして速くするが複雑なタスクで質が落ちうる」と整理しています。速さが欲しい理由が「待ち時間を減らしたい」だけならFast mode、「処理を軽くしたい」ならeffort、と動機で選び分けるのが分かりやすい考え方です。
対応モデルと環境要件:Opus 3種・v2.1.36以降・VS Code拡張は非対応
Fast modeが使えるのはOpus 4.8 / Opus 4.7 / Opus 4.6の3つで、Sonnet・Haikuなど他のモデルは非対応です。利用にはClaude Code本体がv2.1.36以降である必要があり、`claude –version` でバージョンを確認できます。VS Code拡張では使えず、CLI専用である点も要注意です。Amazon Bedrock・Google Vertex AI・Microsoft Azure Foundryなどのサードパーティ基盤でも提供されておらず、Anthropic Console APIとサブスクが対象です。
デフォルトで動くモデルはバージョンによって異なります。公式によると、Opus 4.8がFast modeのデフォルトになるのはv2.1.154以降で、v2.1.142〜v2.1.153ではFast modeのデフォルトがOpus 4.7です。古いCLIのまま「なぜ4.8にならないのか」と悩む前に、まずバージョンを上げるのが近道です。さらにOpus 4.6のFast modeは非推奨で、Opus 4.8公開の約30日後に削除される予定です。削除後は4.6に高速設定を送っても標準速度・標準料金に戻るため、これから使うならOpus 4.8を選ぶのが無難です。
環境面でつまずきやすいのは、この「バージョンとプラットフォームの前提」です。`/fast` が反応しない・項目が見当たらないときは、まずCLIがv2.1.36以降かを確認し、次にVS Code拡張から使おうとしていないか、BedrockやVertex AIなど非対応の基盤経由になっていないかを順に潰していくと原因にたどり着けます。Team・Enterpriseでは管理者が機能自体を無効にしている可能性もあるため、組織アカウントの場合は管理者設定も確認対象に含めてください。
料金影響と使いどころ・注意点

Fast modeでいちばん誤解されるのは料金の引かれ方です。「サブスクを払っているから追加料金はかからない」と思いがちですが、実際はプラン込みの利用枠ではなくusage credits(従量課金)から引かれます。ここを押さえないと想定外の請求につながりかねないので、以下で単価・課金タイミング・使い分けを順番に整理します。
Fast modeの料金:モデル別の単価と引かれ方
Fast modeは標準Opusより高い単価で、モデルによって金額が異なります。下表は公式が示すper MTok(100万トークンあたり)の入力/出力単価です。この単価は1Mトークンのコンテキスト全域でフラットに適用され、20万トークンを超えるリクエストでも同じレートです。prompt cachingやデータレジデンシーの料金修飾は、このFast mode単価の上に重なって適用されます。
| モデル | 入力(per MTok) | 出力(per MTok) | 補足 |
|---|---|---|---|
| Opus 4.8 | $10 | $50 | もっとも安く、現行の推奨 |
| Opus 4.7 | $30 | $150 | 4.8より割高 |
| Opus 4.6 | $30 | $150 | 非推奨。約30日後に削除予定 |
出典: Claude Code Docs「fast mode」(2026年6月8日確認)。研究プレビューのため料金は変更される場合があります。
Opus 4.8のFast modeは、以前のモデルより約3分の1の単価まで下がりました。コストを抑えつつ速度を取りたいなら、Opus 4.8でFast modeを使うのが基本路線になります。逆にOpus 4.7・4.6は入力$30・出力$150と4.8の3倍の単価なので、同じ高速設定でもモデル選択で支払額が大きく変わる点を意識してください。
金額の感覚をつかむために、出力トークンに注目してみます。仮に1回のやり取りで数万トークンを出力するような長い作業を繰り返すと、出力単価の差(4.8の$50 と 4.7/4.6の$150)がそのまま積み上がります。Fast modeは速いぶん同じ時間でより多くのトークンを生成できるので、「速いから短時間で終わる=安い」とは限らない点に注意が必要です。コストを読みにくいと感じたら、まずはOpus 4.8で短い対話に限って使い、請求の伸び方を確認してから常用するかを判断すると安全です。組織で使う場合は、Usage and Cost APIなどでFast modeのトークン使用量を可視化しておくと、誰がどれだけ高速設定を使ったかを後から追えます。
サブスクへの影響と「会話途中オン」で高くなる仕組み
Pro/Max/Team/Enterpriseのどのプランでも、Fast modeはプラン込みの利用枠から引かれません。公式は「usage credits only and not included in the subscription rate limits」と明記しており、Fast modeのトークンはプランの含み枠を消費せず、最初のトークンからFast modeレートで課金されます。そのため利用には、プランの含み枠を超えた課金を許可するusage creditsの有効化が前提です。個人はConsoleの請求設定で、Team・Enterpriseは管理者が組織単位で有効化します。Team・Enterpriseでは既定で無効のため、管理者がオンにしないと `/fast` が「組織によって無効化されています」と表示されます。
課金にはもう一つ独特のクセがあります。会話の途中で初めてFast modeをオンにすると、その時点での会話コンテキスト全体にFast modeのuncached入力単価がまとめて一度かかります。やり取りが長いほど積み上がったコンテキストが大きいので、後半でオンにするほど割高です。逆に言えば、Fast modeを使うと決めたらセッションの最初からオンにしておくのがいちばん安く済みます。この費用は会話ごとに一度だけで、いったんかかった後はオフにして再びオンにしても二重には取られません。「途中でひらめいてオンにしたら高かった」という事故は、開始時オンで避けられます。コスト効率を最優先するなら、長い会話を続けてから高速化するのではなく、速くしたい作業は新しいセッションを切ってから始める運用が向いています。管理者側でコストを抑えたい組織では、セッションごとにFast modeをオフへ戻す設定(per-session opt-in)も用意されており、複数セッションを同時に走らせる環境での無駄な高速課金を防げます。
出典: Claude Code Docs「fast mode(Requirements / cost tradeoff)」(2026年6月8日確認)
有効化の手順と、いつ標準が得かの使い分け
有効化は簡単で、CLIで `/fast` を入力してTabを押すとオン・オフが切り替わります。設定ファイルで `”fastMode”: true` を指定する方法もあります。別のモデルを使っている状態でオンにすると、Claude Codeが自動でOpusに切り替えます。オンになると「Fast mode ON」と表示され、プロンプトの横に小さな `↯`(稲妻)アイコンが出ます。これが点灯していればFast mode中という目印です。もう一度 `/fast` を実行すると無効化できますが、無効化してもモデルはOpusのまま戻りません。別モデルに変えたいときは `/model` を使います。既定ではFast modeはセッションをまたいで維持され、管理者設定でセッションごとにリセットさせることもできます。
使い分けの軸はシンプルです。Fast modeが向くのは、応答の速さがコストより重要なインタラクティブ作業(コード修正の素早い試行錯誤、ライブデバッグ、締め切りの近い作業)です。反対に標準モードが得なのは、速度が重要でない長時間の自走タスク、バッチ処理やCI/CDパイプライン、コスト最優先のワークロードです。さらにFast modeのレート上限に達したりusage creditsが尽きたりすると、自動で標準速度に落ち、↯アイコンがグレーになってクールダウン後に自動で戻ります。Opus 4.8 / 4.7 / 4.6のFast modeは同じレート上限プールを共有する点も覚えておくと、上限管理がしやすくなります。
使う前に知っておきたい注意点
Opus 4.6のFast modeは非推奨で、Opus 4.8公開の約30日後に削除予定です。削除後は4.6に高速設定を送っても標準速度・標準料金にフォールバックします。速度を保ちたいならOpus 4.8か4.7へ移行してください。Fast mode全体は研究プレビューで、仕様・料金・提供範囲は今後変わる可能性があります。最新情報は必ず公式ドキュメントで確認してください。
よくある質問と導入前チェック
Fast modeは「速度を金で買う対話用スイッチ」と理解すれば判断に迷いません。読者からよく出る疑問を先回りで整理し、最後に導入前の確認項目をまとめます。下のFAQは記事末尾の構造化データ(FAQPage)と同じ問答で揃えてあります。料金や対応状況は研究プレビューゆえに変わるため、実際に使う直前に公式ドキュメントで最終確認するのが安全です。
Q. Fast modeにするとClaudeは賢くなりますか?
賢くはなりません。Fast modeは別モデルではなく同じOpusを速度優先で動かす設定で、知能・能力・モデルの中身は標準と同一です。変わるのは出力速度と料金だけです。
Q. 最初の反応が遅いのはFast modeが効いていないからですか?
いいえ。Fast modeが速くするのは出力速度(OTPS)で、最初の応答までの時間(TTFT)は対象外です。生成が始まってからの出力が最大2.5倍になります。
Q. サブスクのプラン枠から引かれますか?
引かれません。Fast modeはプラン込みの利用枠ではなくusage credits(従量課金)からのみ消費され、プランのレート上限にもカウントされません。利用にはusage creditsの有効化が必要です。
Q. どのモデルとバージョンで使えますか?
Opus 4.8 / 4.7 / 4.6で使え、Sonnet・Haikuは非対応です。Claude Code v2.1.36以降が必要で、VS Code拡張では使えません。Opus 4.6は約30日後に削除予定です。
Q. 会話の途中でオンにしても大丈夫ですか?
使えますが割高になりがちです。途中でオンにするとその時点の会話コンテキスト全体にFast単価が一度かかるため、使うと決めたらセッション開始時からオンにするのが安く済みます。
使い始める前の最終チェック
- Claude Codeがv2.1.36以降か(`claude –version` で確認)
- usage creditsを有効化しているか(個人はConsole請求設定/Team・Enterpriseは管理者)
- 使うモデルがOpus 4.8か(4.6は約30日後に削除予定なので避ける)
- その作業は対話寄りか(自走・CI/CD・バッチなら標準モードのまま)
- 使うならセッション開始時に `/fast` をオンにしたか(途中オンは割高)
最新の料金・対応状況は研究プレビューのため変わります。導入前に公式ドキュメントで最終確認するのが確実です。当サイトのAIコーディングツール解説では、料金・制限・エラー対処をツール別に整理しているので、合わせて活用してください。

コメント