OpenAIが新たに発表したGPT-4oは、実在人物の画像生成を含む強化された画像生成機能を持つAIモデルです。
要約するとOpenAIは、最新の画像生成AIモデル「GPT-4o」を発表し、その機能を大幅に強化しました。
GPT-4oは、これまでの画像生成技術の中で最も強力で、テキストの正確なレンダリングやプロンプトへの従従が優れています。
このモデルは、オンラインの画像とテキストの共分布に基づいてトレーニングを行い、画像と言語の関係性を学習しています。
その結果、視覚的に分かりやすく、一貫性のある画像を生成する能力が向上しました。
特に、自然な会話を通じて画像を改良し、全体の一貫性を保つことができる点が特徴です。
従来の画像生成AIが苦手としていたテキストのレンダリングも改善されており、長文をホワイトボードに手書きするシーンを自然に生成できるようになりました。
さらに、最大で10~20個の異なるオブジェクトを同時に処理する能力も持ち、詳細なプロンプトに従った画像生成が可能です。
加えて、実在の人物を再現した画像の生成も実現しており、著名人の写真を基にした画像を作成することができます。
OpenAIは、このモデルを構築する際に強力な安全基準を設け、コンテンツの信頼性を担保するためのメタデータ付与や、倫理に反するコンテンツを生成するリクエストのブロックを行っています。
特に、ヌードや暴力描写に関しては強力な保護策が講じられています。
これにより、GPT-4oは、より安全かつ高品質な画像生成を実現しています。
参考リンクhttps://news.yahoo.co.jp/articles/10a9d7799361c32daab6d19ab3ed8ce56707f557