技术动态 > 正文
OpenAI公布最新人工智能神经网络“DALL·E”
通过自然语言文本直接生成对应图像
2021/1/7 10:56   OpenAI      关键字:OpenAI 人工智能 神经网络      浏览量:
据OpenAI介绍,DALL·E基于120亿参数版本的GPT-3模型,使用文本-图像对的数据集,能够通过文字描述生成图像。OpenAI研究人员发现,DALL·E有一系列不同功能,例如创建动物或物体的拟人化版本、以合理的方式组合不相关的概念、文字渲染以及对已有图像进行变换等等。
  当地时间2021年1月5日,OpenAI在官方博客公布最新人工智能神经网络“DALL·E”。OpenAI称其可以通过自然语言文本直接生成对应图像,意味着“通过语言文字操纵视觉概念现在已经触手可及。”
  据OpenAI介绍,DALL·E基于120亿参数版本的GPT-3模型,使用文本-图像对的数据集,能够通过文字描述生成图像。OpenAI研究人员发现,DALL·E有一系列不同功能,例如创建动物或物体的拟人化版本、以合理的方式组合不相关的概念、文字渲染以及对已有图像进行变换等等。
  “DALL·E”的名字来自艺术家萨尔瓦多·达利(SalvadorDali)和皮克斯的机器人WALL-E。
  在他们给出的第一批示例里,文本“穿着芭蕾舞裙的萝卜宝宝在遛狗”被拟人化地呈现在图像上。类似的例子还有“一只模仿乌龟的长颈鹿”、“一杯被恋爱冲昏头脑的波霸奶茶”等。从这些案例中,研究人员发现,DALL·E能够将人类活动和衣物,甚至情绪迁移到动物和无生命物体上。

微信扫描二维码,关注公众号。