GPT‑4o新画像生成機能、1週間で累計7億枚のイラスト生成

画像:OpenAIより引用

米国AIサービスのOpenAIは2025年3月26日、対話型AI「ChatGPT」の現行モデルGPT‑4oに、高度な画像生成機能を追加したことを発表しました。

公式発表によれば、アップデートの内容は複数の要素を把握しながら文字や図を正確に描写する能力など、従来のイラスト生成では困難であった機能を備えるものです。ユーザーの指示に基づき、写真のようにリアルなビジュアルから、ダイアグラム、インフォグラフィックまで幅広い用途に対応する機能が標準搭載されました。

GPT‑4oの画像生成機能は大規模なテキスト・画像データの同時学習とポストトレーニングを経て開発されています。多様な言語に対応したテキストレンダリング(文字を表示する昨日)の精度向上や複数オブジェクトの厳密な配置指示への対応など、実用的なビジュアルコミュニケーションを重視されています。また、プロンプトの設計も簡略化され、ユーザーは日常会話の形式で直感的に画像を生成できる仕様です。

新たな画像生成機能は、リリース後わずか一週間で世界中のユーザーが画像生成機能を試用し、累計で七億枚を超える画像が作成されました。特に「ジブリ風」のイラストがSNSで爆発的に拡散し、Sam Altman CEO自身も似顔絵をジブリ風に描かせて大きな話題を呼んでいます。

参照Introducing 4o Image Generation|OpenAI