消费级显卡也能跑 AI ?Stable Diffusion 3 模型开源
IT之家6月13日消息,稳定性人工智能(Stability AI)公司发布了一款名为Stable Diffusion 3 Medium(以下简称SD3 Medium)的开源模型,官方宣称这是迄今为止最先进的模型,性能甚至超越了Midjourney 6。该公司表示,SD3 Medium在处理文本描述时能重点关注克服文生图模型中手部和面部识别的难题,从而生成逼真度极高的图像。该模型采用了底层Diffusion Transformer架构,能够精确地将文字元素整合在一起。值得一提的是,相较于其他资源密集型AI模型,SD3 Medium能在消费级显卡上运行,有助于加快普及和应用。Stability AI以非商业许可的方式提供SD3 Medium,供免费使用。对于商业用途,艺术家、设计师和开发人员可申请创作者许可证;而对于大型商业用户,可直接与Stability AI洽谈授权事宜。该公司还透露未来将把产品拓展至视频和音频生成领域。
此外,SD3 Medium在艺术创作方面具有很高的潜力,如为艺术家提供一个日本18岁女孩搭便车的场景,她手持一张写着“东京站”的字条,站在路边,表情充满期待。背景则是繁华的城市街道,汽车穿梭而过,城市建筑错落有致。整个画面充满了活力和生气,完美捕捉了东京的脉动。这种富有电影感的构图正成为艺术station上的热门趋势。