GPT-5.4とは?2026年3月5日リリースの最新フロンティアモデル

2026年3月5日、OpenAIが新たなフロンティアモデル「GPT-5.4」を公開した。「プロフェッショナルワーク向け最強モデル」を掲げ、44職種にわたるプロレベルの知識作業で前モデルを大幅に上回るスコアを記録。さらに、AIが実際のPCをマウスとキーボードで操作する「Computer Use」機能を搭載した初の汎用モデルでもある。

GPT-5.4には標準版と、最大パフォーマンスを引き出す「GPT-5.4 Pro」の2バージョンが用意されている。ChatGPT上では「GPT-5.4 Thinking」として利用でき、コンテキストウィンドウは最大100万トークンに対応する。

この記事では、GPT-5.4の5つの主要機能、ベンチマーク比較、利用方法、そしてプライバシー観点での注意点まで網羅的に解説する。

GPT-5.4の5つの主要機能

1. コンピューター操作(Computer Use)

GPT-5.4の目玉機能が「Computer Use」だ。AIがマウスとキーボードを使い、実際のデスクトップアプリケーションやブラウザを操作できる。これまでテキストベースの応答に限られていたAIが、人間と同じようにPCを動かせるようになった。

API経由ではcomputerツールとしてアクセスでき、Playwrightを使ったブラウザ自動化コードの生成にも対応する。たとえば「このスプレッドシートのデータを集計してグラフを作って」といった指示を、AIが画面を見ながら実行できる。

OSWorld-Verifiedベンチマークでは75.0%を達成し、人間のスコア(72.4%)を超えた。PC操作タスクにおいて、人間以上の精度を発揮する初のAIモデルとなる。

2. Tool Search(ツール検索)

開発者にとって大きな改善が「Tool Search」機能だ。従来、AIに使わせたいツールの定義をすべてプロンプトに含める必要があったが、GPT-5.4では数千のツール定義をオンデマンドで検索・取得できる。

36のMCPサーバーを接続した環境で、トークン使用量を47%削減しながらMCP Atlasベンチマークで同等の精度を維持した。API利用料を抑えつつ、大規模なツール統合が可能になる。

3. 思考可視化と中断調整

ChatGPTの「Thinking」モードでは、GPT-5.4が回答を生成する前に思考計画を表示する。ユーザーは回答の方向性を事前に確認でき、必要に応じて回答途中でも方向修正が可能だ。

たとえば「この方向ではなく、もっと技術的に深掘りして」と途中で指示すれば、AIが軌道修正して回答を続ける。長文の生成で「最後まで待ったら全然違う内容だった」という問題を解消する。

4. 知識作業・ドキュメント処理

GPT-5.4は知識労働の精度を大幅に引き上げた。

  • スプレッドシート作業:87.3%(GPT-5.2の68.4%から約19ポイント向上)
  • プレゼンテーション:人間の68.0%がGPT-5.4の出力を好むと回答
  • 法律文書:BigLaw Benchで91%を達成

100万トークンのコンテキストを活かし、大量の資料を一度に読み込んだうえで要約・分析・作成ができる。報告書やプレゼン資料の下書き作成で、作業時間を大幅に短縮できるだろう。

5. コーディング強化

GPT-5.4は、コーディング特化モデルだったGPT-5.3-Codexの能力を統合している。SWE-Bench Proで57.7%(GPT-5.3-Codexの56.8%超え)を記録し、汎用モデルでありながらコーディング専用モデル以上のスコアを出した。

OpenAIのCodex環境では/fastモードで1.5倍の高速コード生成が可能。さらに「Playwright Interactive」機能で、ブラウザを視覚的にデバッグしながら開発を進められる。

AIコーディングツールに興味がある方は、AI開発ツール徹底比較:z.ai vs Cursor vs GitHub Copilotの記事も参考にしてほしい。

GPT-5.4の性能はどれほど?ベンチマーク比較

GPT-5.4の各ベンチマークスコアを見ると、前世代モデルからの飛躍が明らかだ。

ベンチマーク 測定内容 GPT-5.4 参考値
GDPval(44職種プロ知識) 専門知識作業の正確性 83.0% GPT-5.2: 70.9%
SWE-Bench Pro ソフトウェアエンジニアリング 57.7% GPT-5.3-Codex: 56.8%
OSWorld-Verified PC操作タスク 75.0% 人間: 72.4%
BrowseComp Web情報検索 82.7%
Toolathlon ツール使用能力 54.6%
ハルシネーション削減 事実誤認の減少率 33%削減 GPT-5.2比

特筆すべきはGDPvalの83.0%だ。GPT-5.2の70.9%から12ポイント以上の向上で、弁護士・会計士・コンサルタントなど44職種のプロフェッショナルと同等以上の知識作業を処理できることを示す。

GPT-5.4 vs GPT-5.2 ベンチマーク比較グラフ

GPT-5.4 vs GPT-5.3-Codex vs GPT-5.2 比較表

項目 GPT-5.4 GPT-5.3-Codex GPT-5.2
リリース日 2026年3月5日 2025年 2025年
コンテキスト 100万トークン
Computer Use 対応 非対応 非対応
Tool Search 対応 非対応 非対応
GDPval 83.0% 70.9%
SWE-Bench Pro 57.7% 56.8%
OSWorld-Verified 75.0%
ハルシネーション 33%削減(5.2比) 基準
コーディング統合 統合済み コーディング特化 汎用
思考可視化 対応 非対応 非対応

GPT-5.4は「汎用性」と「専門性」を両立させた点が最大の強みだ。コーディング特化だったGPT-5.3-Codexの能力を取り込みつつ、知識作業やPC操作でも過去最高のスコアを叩き出している。

GPT-5.4の使い方・アクセス方法

GPT-5.4にアクセスする方法は3つある。

ChatGPT(ブラウザ・アプリ)

  • GPT-5.4 Thinking:無料プランを含むすべてのユーザーが利用可能
  • GPT-5.4 Pro:Proプラン加入者向けの最大パフォーマンス版

モデル選択メニューから「GPT-5.4 Thinking」を選ぶだけで使える。Proプランの場合は「GPT-5.4 Pro」も選択肢に表示される。

API

開発者はgpt-5.4というモデル名でAPI経由でアクセスできる。Computer Use機能はcomputerツールとして、Tool Searchは自動的に有効化される。

# APIモデル名
model: "gpt-5.4"

# Computer Use(APIツール)
tools: [{"type": "computer"}]

Codex

OpenAIのCodex環境では、GPT-5.4が標準モデルとして搭載されている。/fastコマンドで1.5倍速のコード生成も利用可能だ。

ChatGPTでGPT-5.4を試す

プライバシー観点での注意点

GPT-5.4のComputer Use機能は便利だが、プライバシーとセキュリティの面で慎重に考える必要がある。当ブログとしては、以下の3点を押さえてから利用を検討することを推奨する。

AIにPC操作を許可するリスク

Computer Use機能を使うと、AIがデスクトップ画面を読み取り、マウスやキーボードを操作する。つまり、画面上に表示されているすべての情報にAIがアクセスできる状態になる。パスワードマネージャーの画面、銀行口座、個人的なメッセージなど、意図せず機密情報を読み取られる可能性がある。

データ送信の範囲

PC操作中の画面キャプチャや入力データがOpenAIのサーバーに送信される。OpenAIのプライバシーポリシーを確認し、データの保持期間や学習への使用有無を理解したうえで使うべきだ。特に業務データを扱う場合は、API利用規約の「データ学習オプトアウト」設定を必ず確認しよう。

AIに入力するデータの管理については、AIデータ漏洩リスク2026:ChatGPT/Claude/Geminiに入力してはいけないものを参考にしてほしい。

ツール認証の安全性

Tool Search機能では、外部ツールの定義をオンデマンドで読み込む。接続先のMCPサーバーやAPIの信頼性は利用者自身で確認する必要がある。不正なツール定義を読み込んだ場合、意図しない外部サービスへのデータ送信につながるリスクがある。

ChatGPTのプライバシー設定全般については、ChatGPTは安全?プライバシーと情報漏洩を防ぐ使い方も合わせて確認してほしい。

AI開発ツール z.ai を試す(招待リンク)

まとめ

GPT-5.4は、OpenAIが「プロフェッショナル向け最強」と位置づけるだけあり、ベンチマークの数値は目覚ましい。PC操作を丸ごと任せられるComputer Use、トークンを節約するTool Search、回答途中で軌道修正できる思考可視化など、実用面での進化が大きい。

一方で、AIにPCの操作権限を渡すことへのリスク意識は持っておくべきだ。便利さとプライバシーのバランスを取りながら、自分の用途に合った使い方を選んでいこう。

GPT-5.4の主要ポイントをまとめる:

  • 44職種のプロレベル知識作業で83.0%を達成
  • AIがPCを直接操作する「Computer Use」機能を搭載
  • 100万トークンのコンテキストウィンドウ
  • ハルシネーション(事実誤認)が33%削減
  • ChatGPTの無料プランでも「GPT-5.4 Thinking」が利用可能

GPT-5.4をChatGPTで使ってみる

🔒 GPT-5.4を安全に使うためのプライバシー対策

Computer Use機能でAIにPCを操作させる場合、通信レイヤーの保護も重要だ。NymVPNのミックスネット技術を使えば、AIへの接続がメタデータレベルまで匿名化できる。

▶ NymVPN 公式サイト(30日間返金保証)

あわせて読みたい記事