Imagen3在理解文本提示方面比前两代更好,可捕捉长文本提示中的很多细微细节,对图片的嵌入文字生成也更加准确、稳定。
用户只需上传3-5张某物体的照片,再用文字描述想要生成的背景、动作或表情,就能生成相应的图片。