OpenAIのGPT-4oが新機能を発表。簡単なプロンプトでリアルな画像生成が可能になり、ユーザーの意図をより正確に反映。悪用リスクにも配慮。
要約するとOpenAIが発表したGPT-4oの新機能は、ユーザーが簡単なプロンプトを入力するだけで、リアルな画像を生成できるというもので、生成AIの領域において大きな進化を遂げています。
これまでの画像生成では、生成された画像がどこか不自然であったり、ユーザーの意図を反映するのに多くの手間がかかることがありました。
しかし、GPT-4oではそのハードルが大きく下がり、ユーザーが求める画像を簡単に作成できるようになりました。
具体的には、ドナルド・トランプがStarlinkを手に持って微笑む姿を生成する際、プロンプトは非常にシンプルでありながら、まるで実際の写真のようなクオリティを実現しています。
この新機能の特徴は、GPT-4oが画像生成をネイティブ機能として統合している点です。
これにより、ChatGPTの会話の流れの中で自然に画像を生成できるようになり、ユーザーは一貫した文脈の中で画像を調整することが可能です。
例えば、ビデオゲームのキャラクターをデザインする際には、何度も試行錯誤を行っても外見の整合性が保たれます。
また、最大20個のオブジェクトを扱うことができ、テキストや記号を加えることも可能です。
このように、GPT-4oはユーザーの指示をより深く理解し、生成された画像に反映する能力が向上しています。
しかし、OpenAIはこの技術の悪用リスクも考慮しており、適切な制限を設けることも示唆しています。
新たな画像生成の可能性を秘めたGPT-4oは、今後さまざまな場面での活用が期待されます。
参考リンクhttps://news.yahoo.co.jp/articles/4d7388d648d596cb3ec6330f1eab0de48b928787