DALL-E是一个可以通过文本描述中生成图像的人工智能程序,可以根据自然语言的描述创建逼真的图像和艺术,于2021年1月5日由OpenAI发表。
DALL-E通过120亿参数[版本的GPT-3 Transformer模型来理解自然语言输入(例如“五边形形状的绿色皮革钱包”或“一只悲伤水豚的等距视图”)并生成相应的图片。它既可以生成现实的对象(例如“带有蓝色草莓图像的彩色玻璃窗”),也能够生成现实中不存在的对象(例如“具有豪猪纹理的立方体”)。它的名字是2008年动画电影WALL-E(瓦力)和20世纪西班牙加泰罗尼亚画家萨尔瓦多·达利(Salvador Dalí)之混成词。
自2000年代以来,已有其他许多神经网络有生成逼真图像的能力。而DALL-E的特点在于它能够通过纯文本描述生成这样逼真的图像。
数据统计
类似工具
暂无评论...