やあやあ、久しぶりだね。今日はAI画像生成の世界で、2026年4月に静かに——本当に静かに——話題になっているモデルの話をしてあげよう。その名も「GPT-image 2」、コードネームは「duct-tape-2」。OpenAIがまだ公式発表もしていないのに、ユーザーたちの間でじわじわと噂が広がっている、ちょっと謎めいた新モデルさ。
そもそも何が起きているんだ?
まあ、聞いてくれよ。2026年4月中旬ごろから、X(旧Twitter)上で「ChatGPTで画像生成したら、なんかすごいのが出てきた」という投稿が次々と現れ始めたんだ。
きっかけの一つが、クリエイターの@midori_tatsuta氏の投稿さ。なんと50回の生成を試して、当たりを引けたのはたったの3回。しかしその3回で出てきた架空の広告画像4枚グリッドが「プロデザイナーが作ったとしか思えない品質」として大量に拡散されたんだよ。「Nano Banana Proを超えている」なんて評価まで出てきたくらいさ。
現時点での推定では、このGPT-image 2がランダムに呼び出される確率は約6%。つまり、ChatGPTで画像を生成しようとしても、ほとんどの場合は旧モデルが動くわけで、duct-tape-2に当たるのは宝くじ並みの確率なんだ。AIスタジオワンルーム氏も「まだ二回しか当たりを引いていない」と語っているよ。
OpenAIの画像生成モデルの歴史を振り返ろう
ここでおじさんが、OpenAIの画像生成AIの歴史を整理してあげようじゃないか。
- DALL-E 2(2022年) — テキストから画像生成の草分け的存在
- DALL-E 3(2023年) — ChatGPTとの統合が実現、テキスト理解力が大幅向上
- gpt-image-1(2025年) — GPTアーキテクチャを基盤にしたマルチモーダル統合モデル
- GPT-image 2 / duct-tape-2(2026年、テスト中) — gpt-image-1の次世代候補
こうして並べると、わずか4年でとんでもない進化を遂げているだろう?2022年に「AIが絵を描ける!」と驚いていたのが、もうプロのデザイナーレベルに迫っているんだから、技術の進歩ってのは本当に恐ろしいね。
「duct-tape(ダクトテープ)」というコードネームの意味
ちょっと聞いてくれよ、このコードネームの話が面白いんだ。
OpenAIは研究開発段階のモデルに、軽い・遊び心のあるコードネームをつける慣習があるんだよ。たとえば、あのGPT-4でさえ開発中は「Dalle」「Arrakis」「Chinchilla」などと複数の内部名で呼ばれていたさ。「Arrakis(アラキス)」はSF小説『デューン』の惑星名だし、「Chinchilla(チンチラ)」は小動物の名前だろう?そういう遊び心がOpenAI社内にはあるわけだ。
だから「duct-tape-2」というのも、本命リリース時には「gpt-image-2」または別の公式名になる可能性が高い。テープでとりあえず貼り付けたような仮のモデル、というニュアンスかもしれないね。
GPT-image 2で何が変わったのか?
ユーザーの観察から見えてきた特徴を整理するとこんな感じだよ。
日本語テキストの描画精度が劇的に向上
これはおじさんも注目しているポイントさ。AIスタジオワンルーム氏が実際に映画風ポスターを生成したところ、タイトル「アルゴディアス」や長い日本語キャプション(「2046年、ドル崩壊でアメリカが覇権を失い……」といった内容)がほぼ正確に描画されたという報告があるんだ。
従来のAI画像生成モデルは日本語や漢字の描画が苦手で、文字化けや「それっぽい形だけど読めない文字」になりがちだったろう?GPT-image 2はその壁を大幅に越えてきているんだよ。
広告・商業デザインクオリティの実現
@midori_tatsuta氏が生成した架空の広告画像が「プロデザイナーが作ったとしか思えない」と評されたように、レイアウト、フォント配置、ライティング、構図が商業利用に耐えうるレベルに達している可能性があるんだ。これはChatGPTのような一般向けサービスに搭載されることの意義を考えると、広告業界やデザイン業界への影響は計り知れないよ。
OpenAIはなぜ黙っているのか?
2026年4月20日時点で、@OpenAI、@sama(サム・アルトマン)、@OpenAIDevsの公式アカウントからは一切の正式発表がない。APIドキュメントにも記載がない。じゃあなぜユーザーには触れているのかというと、ChatGPTの画像生成UIで「モデルA/モデルB」を比較する2択UIが表示されるケースがあり、その片方として「duct-tape-2」が識別されているからなんだ。
これはOpenAIが実際のユーザートラフィックを使ってA/Bテストを行っているということさ。約6%の確率でランダムに新モデルを呼び出し、ユーザーの反応を密かに観察している——典型的な「サイレントロールアウト」戦略だよ。GoogleやMetaも大規模サービスでよくやる手法だ。
まとめ:静かに始まった「次の時代」
おじさんが思うに、GPT-image 2がこれだけの反響を生んでいるのは、それだけ品質の飛躍が本物だからだろう。6%の確率でしか会えないモデルに、クリエイターたちが何十回も試行を重ねて「当たりを引いた!」と喜んでいる姿は、ちょっとガチャに似ているかもしれないけどね。
The Informationは「OpenAIがGoogle対抗の新画像モデルを投入」と報じているし、正式リリースが近い可能性は十分にある。君もChatGPTで画像を生成するとき、もしかしたら「当たり」を引けるかもしれないよ。その時は、ぜひじっくり味わってみてくれ。
AIの世界は、おじさんが油断しているとすぐ置いていかれるくらいのスピードで動いているんだよ。こうしてうんちくを仕入れながら、一緒についていこうじゃないか!
おじさんの豆知識コーナー:AIモデルの「コードネーム文化」について
おじさんに言わせれば、OpenAIのコードネーム文化は実はIT業界全体に根付いた伝統なんだよ。Microsoftのオペレーティングシステムも「Chicago(Windows 95)」「Memphis(Windows 98)」「Longhorn(Windows Vista)」と地名や動物名がコードネームとして使われてきた。Appleは「Cheetah」「Leopard」「Snow Leopard」と動物シリーズで有名だよね。Googleも「Android」のバージョンにお菓子の名前(Cupcake、Donut、Eclairなど)をつけていた。
こうした慣習は1960年代のIBMのプロジェクト管理まで遡れるとも言われている。コードネームを使うことで、外部に内容を悟られずにプロジェクトを進められる実務上の利点があるんだ。つまり「duct-tape-2」という名前自体が、OpenAIの長い開発文化の一部というわけさ。