跳至正文

AI助手助力创作生图提示词

近日,ControlNet的作者Lvmin Zhang推出了一项名为Omost的新项目,致力于解决AI绘画领域的一大痛点——如何仅通过简单的一句话描述就能生成想要的图像。Omost这个名字有两层含义,发音与英文单词”almost”相似,暗示着每次使用Omost后,用户所需的图像几乎就完成了;而”O”则代表”omni”,即全能,”most”则表示希望最大限度地利用它。

据悉,Omost采用了一种全新的图像生成方式。用户只需简洁明了地描述一下自己的想法,如”a funny cartoon batman fights joker(一幅有趣的卡通蝙蝠侠与小丑战斗的图画)”,Omost就会自动为其生成一张符合要求的画作。此外,生成的图像的整体布局可以保持不变,只要用户需要更改画面中的某个元素,只需再次输入一句话即可。

目前,Omost已经成功应用于生成代码等领域,并得到了广大网友的一致好评。许多网友纷纷表示:”这也太强大了吧!”。

Omost项目提供了一系列基于Llama3和Phi3变体的LLM(大型语言模型)供用户使用。用户可以根据这些模型轻松实现无损文本编码方法,从而更好地满足自身需求。此外,Lvmin Zhang还为该项目开发了一个基于注意力操纵的Omost LLM的baseline渲染器,以及一系列提高提示理解的技巧,如提示前缀树等。

总之,Omost项目的诞生无疑为AI绘画领域带来了新的可能性和突破。有兴趣的用户可以通过访问其GitHub页面(https://github.com/lllyasviel/Omost)或Demo页面(https://huggingface.co/spaces/lllyasviel/Omost)了解更多相关信息并进行实际操作。

发表回复