DeepSeek が 5 月 22 日、V4-Pro の API 料金を 75% オフのまま恒久化 すると発表した。4 月 24 日のリリース直後に始まったプロモーション割引を、期間限定で終わらせずにそのまま正規料金にしたかたちだ。
これで V4-Pro の出力トークンは $0.87/MTok。GPT-5.5 の $30 と比べると 約 34 分の 1。Claude Opus 4.7 の $25 に対しても約 29 分の 1。「ほぼフロンティア」の性能を持つモデルが、桁違いに安い価格で固定された。
さらに軽量版の V4-Flash はもっと安い。出力 $0.28/MTok で、GPT-5.5 比 107 倍安い。個人開発者の API コスト設計を根本から変えうる価格帯に入っている。
- DeepSeek 公式発表: api-docs.deepseek.com/news/news260424
- HN 議論 (リリース時 2091pt): news.ycombinator.com/item?id=47884971
- HN 議論 (恒久化発表 616pt): news.ycombinator.com/item?id=48237663
この記事をわかりやすく
まず V4 には 2 種類ある。V4-Pro (= 1.6 兆パラメータのうち 1 トークンあたり 490 億がアクティブになる大型モデル) と V4-Flash (= 2840 億パラメータ中 130 億アクティブの軽量版)。どちらもコンテキスト 100 万トークン、出力上限 38.4 万トークン。MIT ライセンスでウェイトも公開されている。
性能面で注目すべきは、V4-Pro が SWE-bench Verified (= 実際の GitHub issue を解かせるコーディングベンチマーク) で 80.6% を出していること。Claude Opus 4.7 の 80.8% とほぼ並んでいる。LiveCodeBench (= リアルタイムのコーディング問題) では 93.5 で全モデル中トップ。Codeforces レーティングも 3206 で GPT-5.4 の 3168 を抜いている。数学・コーディング系のタスクでは明確に強い。
料金を並べるとこうなる。V4-Pro の入力は $0.435/MTok (キャッシュヒット時は $0.003625)、出力は $0.87。V4-Flash の入力は $0.14、出力は $0.28。比較対象として Claude Sonnet 4.6 は入力 $3、出力 $15。GPT-5.5 は入力 $5、出力 $30。DeepSeek はこの価格で「ほぼフロンティア」の性能を出している。
技術的にこれが可能な理由は、V4 の Sparse Attention (= 注意機構の計算を必要な部分だけに絞る省エネ設計) アーキテクチャにある。100 万トークンのコンテキストを処理するとき、前世代 (V3.2) の 27% の演算量と 10% の KV キャッシュで済む。つまり安売りで赤字を垂れ流しているわけではなく、アーキテクチャレベルでコスト構造が違う。75% オフを恒久化できたのは、そもそも原価が桁違いに低いからだ。
個人にとっての意味: 自分の動きにどう効くか
正直、この価格は衝撃だった。自分みたいに API コストを気にしながら個人プロダクトを回してる人間にとっては、ゲームのルールが変わるレベルの話だと思う。
Claude Code Max / サブスクユーザー目線: Claude Code Max を使ってる人は月額固定だから直接の影響は少ない。ただ、DeepSeek V4-Pro を Claude Code の外部モデルとして使えるという報告が HN に出ている。メインは Claude、サブタスクは V4-Pro に振る「ハイブリッド運用」がコスト的に現実味を帯びてきた。
個人 builder 目線: ここが一番インパクトがでかい。たとえばコード生成の API を 1 日 200 回叩くとして、V4-Flash なら 月 $9 程度。同じことを Claude Sonnet でやると $468。差額 $459 は個人開発者にとって「やるかやらないか」を決定する金額だ。API コストがボトルネックで諦めていたプロダクトが、そのまま成立する可能性がある。
ノーコード系・これから始める人目線: V4-Flash は API の入門としてもちょうどいい。月 $10 以下で「フロンティアに近い」モデルを叩けるなら、試行錯誤のコストが劇的に下がる。ただし DeepSeek は中国のサービスなので、機密性の高いコードを送るのは慎重になるべき。公開前提のプロジェクトや学習用途なら問題ないが、本番プロダクトのプロプライエタリなコードを流すかどうかは自分で判断する必要がある。
HN で speu というユーザーが「V4-Flash は水道水のように安くて、価格帯を超えたパンチ力がある」と書いていたのが印象的だった。もう一つ、submain の「中国は広範な普及を追いかけていて、アメリカは AGI の夢を追いかけている」という指摘も刺さる。目指してるゴールが違うから、価格設定の思想も違う。結果として個人開発者が一番得をするのは、この「普及戦略」の方だ。
明日からのアクション: これを糧にするには
- すぐやる: DeepSeek の API キーを取得して V4-Flash を試す。公式の料金ページでアカウントを作れる。OpenAI 互換 API なので、既存のコードはエンドポイント URL とモデル名を差し替えるだけで動く。まず $5 分くらいのクレジットで感触を掴む
- すぐやる: 自分の今の API コストを棚卸しする。月にいくら払っていて、どのタスクに何トークン使っているか。V4-Flash / V4-Pro に置き換えたら月額がどう変わるか、ざっくり計算してみる
- 検討: コーディング系タスク (テスト生成、リファクタリング、ドキュメント生成) を V4-Pro に切り替える。SWE-bench 80.6% は実用十分。メインの創造的な作業は Claude や GPT に任せて、定型的な作業を V4 に流す「2 層構成」は合理的
- 検討: V4-Flash を使った SaaS の原価設計。出力 $0.28/MTok なら、エンドユーザーに月 $10 で提供するプロダクトでも十分に利益が出る。「API コストが高すぎて個人 SaaS は成り立たない」という前提が崩れつつある
- 保留判断: セルフホスティング。V4-Flash は RTX 4090 を 4 枚 (= ハードウェア代 $6,000〜$8,000) 積めば動くが、1 日あたりの API コストが $10 以下なら自前サーバーのメリットは薄い。月の API 支出が $300 を超えてから検討しても遅くない
- 罠の回避: データ主権の問題を軽視しない。DeepSeek のサーバーは中国にある。顧客データ、認証情報、プロプライエタリなビジネスロジックを含むリクエストは送らない。公開コード・学習用途・非機密タスクに限定するのが現実的な線引き
- 検討 (逆張りの機会): DeepSeek の台頭で「AI の品質は十分、問題はコスト」という世界観が広がる。ここで逆に「GPT-5.5 / Claude Opus でしかできないこと」に特化したプレミアム路線のプロダクトを作るのも戦略としてあり。全員が安い方に流れるタイミングこそ、高品質側の希少価値が上がる
DeepSeek V4 の恒久値下げは、個人開発者にとって「API コストの天井が下がった」ことを意味する。全部を DeepSeek に移す必要はないし、データの扱いには注意がいる。でも「フロンティアに近い性能が月 $10 以下で使える」という事実は、これから何かを作ろうとしている人間にとって、言い訳を一つ減らしてくれる。