Meta 开发出文本生成图像模型 CM3Leon，号称业界最佳

meta

互联网资讯发布于 2年前 27 浏览 0 回复 0 点赞

7 月 16 日消息，Meta 公司宣布开发出一款名为 CM3Leon 的人工智能模型，该模型可以根据文本生成高质量的图像，也可以为图像生成文本描述，甚至可以根据文本指令编辑图像。

Meta 开发出文本生成图像模型 CM3Leon，号称业界最佳

燃领网注：CM3Leon 生成结果（上）对比 DALL-E 2 生成结果（下）

Meta 公司称，这款模型在文本到图像生成方面达到了业界最高水平，超过了谷歌、微软等公司的产品。CM3Leon 是一种基于 Transformer 的模型，Transformer 是一种利用注意力机制来处理输入数据的神经网络结构。相比于其他基于扩散（diffusion）的模型，Transformer 模型更加高效，训练速度更快，计算成本更低。

Meta 公司展示了 CM3Leon 在不同任务上的优异表现，包括根据复杂的文本提示生成图像，根据文本指令编辑图像，以及生成图像描述和回答。Meta 公司表示，CM3Leon 是图像生成和理解领域的一大进步，但也承认该模型可能存在数据偏见的问题，并呼吁行业加强透明度和监管。

Meta 公司使用了数百万张来自 Shutterstock 的授权图片来训练 CM3Leon，最强大的版本有 70 亿个参数，比 OpenAI 的 DALL-E 2 模型多两倍。

Meta 公司没有透露是否会公开发布 CM3Leon 模型。

为您推荐相关文章:

Meta 减少数字藏品，发力 Meta Pay 等金融科技工具

Meta CEO 扎克伯格：办公室办公比远程办公更高效

Meta 请竞争对手提供反垄断诉讼证据，eBay 怒斥“你查我商业机密”

扎克伯格裁员不手软，消息称 Meta 即将再裁 4000 人

微软推送 Windows Server 十月更新，修复远程桌面连接每 30 分钟崩溃问题

全球最大建站平台 WordPress 出现骚乱，开发商和托管商口水战升级

谷歌 CEO 皮查伊：AI 不会取代程序员，反而会让更多人成为程序员

谷歌 Android 15 源码正式推送至安卓开源项目 AOSP