【最新まとめ】GPT-5がついに全ユーザー解放!性能・仕様・レビュー総整理速報

雑記・考察

2025年8月8日、GPT-5が正式発表され、ついに全ユーザーが利用可能になりました。
これまでの進化を大きく超える性能アップに加え、無料プランからProプランまで幅広く提供。この記事では、公式発表情報から実際に初日からいろいろぶっ叩いて試した使用感までまとめてご紹介します。


📌 GPT-5の概要

  • 全モデルがGPT-5シリーズに統合(Auto / Thinking / Pro)
  • 推論精度は前モデルo3比で間違い率80%減
  • 最大40万トークンの長文コンテキスト処理(GPT-4の約5倍)
  • 無料プランでも一定回数利用可能
  • フロントエンド〜バックエンドまで自律的エンジニア級の開発力
  • ハルシネーションが激減し、正直な応答が増加
  • 価格はGPT-4oより安く、性能・速度・コスト比が圧倒的

1. GPT-5のモデル構成

  • Auto:標準モード。即応答と深い思考応答を自動切替
  • Thinking:全プロンプトで思考モードを使用。複雑作業向け
  • Pro:推論強化版。並列・アンサンブル型の可能性あり(Proプラン専用)

利用プラン(GPT-5)

  • 無料:5時間で10メッセージまでやり取り可能、超過後はGPT-5 mini
  • Plus(月$20):3時間で80メッセージまでやり取り可能+優先リソース、超過後はGPT-5 mini
  • Pro(月$200):無制限利用+Proモデルアクセス

2. 主要性能ベンチマーク

数学・推論

  • AIME 2025:94.6%(GPT-4.1の約2倍)
  • Pythonツール使用時:100%達成
  • GPQA(科学知識):88.4%(新記録)

コーディング

  • SWE-bench Verified:74.9%(業界最高)
  • Gemini 2.5 Proやo3を上回る精度
  • ポリグロット対応でエラー率3分の1に減少

マルチモーダル理解

  • MMMU:84.2%(GPT-4.1比で+10ポイント)
  • VideoMMMU:動画理解性能大幅向上

専門分野

  • HealthBench Hard:46.2%(飛躍的改善)
  • 法律・金融分野での実用性向上

3. 信頼性の向上

  • 事実誤り:GPT-4o比で45%減、o3比で80%減
  • 画像不在時の虚偽説明:86.7% → 9%
  • 過剰同調:14.5% → 6%未満
  • より率直かつ批判的思考を維持

4. 実際に使った所感

  • ハルシネーションが減少し、知らないことは正直に答える→知らないことは答えないじゃなくて、自信ないから調べてね、みたいなスタンスになっています。
  • Claudeと比較すると、一から仕上げる能力はGPT-5が優位→自然言語からのプグラミン具能力が格段に上がっていますね。以前だと一発出しではエラーが出ていたようなものも、今回はすんなりビルドが通ることが多いです。
  • 万能型の優等生だが、特にソフトウェア開発が突出
  • 賢くて速くて安いというコスパ最強感があります
  • 過剰なお世辞や忖度が減少→これは個人的にかなりうれしかったです。お世辞じゃなくていいものはいい、悪いものは悪いと、何も指示しなくても言ってくれる感じになりました。
  • 性格が時々安定しないのは昔から変わらない感じですが、振れ幅は小さくなった気がします。

6. API使用価格

  • 入力:$1.25 / 百万トークン(キャッシュ時90%引き)
  • 出力:$10 / 百万トークン

総じて過去のChatGPTよりも安価になっています。


まとめ

今回のアップデートはあまり派手なものではなかったでしたが、全体的に安定感が増してきたような感触ですね
まだまだ初日なので、アクセス過多なのかエラーを吐く場面も多いですが、今後はそういったことも無くなるかと思います。

コメント

タイトルとURLをコピーしました