全新的AIGC提示词撰写工具PromptLLM
宣布创业近10个月后,原Facebook人工智能科学家,原阿里技术副总裁,知名开源深度学习框架Caffe的创立者,TensorFlow、Pytorch等框架的核心成员和共同领导者,曾被誉为AI框架领域最厉害的华人科学家–贾扬清,近期携两款颇令人惊艳的新产品,回到了人们的视野。
1月10日,贾扬清在推特上表示,其创立的Lepton AI最近与HippoML合作,推出了全新的AIGC提示词撰写工具PromptLLM,用于帮助撰写AI绘图的提示词。
1月15日,Lepton AI联合创始人、前阿里云开源大数据前端负责人谢亚东发推特表示,基于Lepton AI,开发团队只需要不到500行代码就可以实现Perplexity的效果,同时还附上了Lepton Search的网址和截图。
这是一款对标Perplexity AI的产品。
提示词
Lepton团队推出的PromptLLM是提示词生成工具,其To C应用是一个名为PromptCraft的网页工具。用户只需输入一行简短的提示词,PromptCraft就能在几秒内生成一个更加完整、具体的提示词,顺便再用Stable Diffusion XL生成两张图片。
比如我们输入“space shuttle orbiting earth(绕地球运行的航天飞机)”,它就会给我们扩展成“Space shuttle in orbit around Earth, meticulously detailed with intricate features, a spectacle of engineering marvel set against the backdrop of our blue and green ball of life, bathed in the gentle light of the setting sun, Photography, Captured in ultra high definition for a sense of raw, untouched realism”,生成的图片质感也很逼真。
再比如我们输入“伊隆马斯克穿着夏威夷草裙跳舞”,它则帮我们扩充了人物表情、姿态、图片背景、摄影器材等细节,生成的图片效果如下:
在官方的演示中,提供了不少精彩的案例,比如鹦鹉吃胡萝卜、驯鹿亲吻大鹅、狐狸穿袜子、山羊划船等,每一张图都是可以“即出即用”的程度。
当然,在发布案例炫技的同时,贾扬清也不忘及时公布PromptLLM的API链接。从其定价页面可以看到,该工具推出了基础版(免费)、标准版($30/月)和企业版三个版本,根据使用模型的不同,每100万个Token的定价在0.1美元—0.8美元之间。
PromptCraft的底层技术是Lepton AI团队和HippoML共同开发的,其中Lepton AI提供API平台支持,HippoML提供PrivateCanvas系统来保障运行。
HippoML是一家做人工智能基础设施的公司,其目标是专注于降低人工智能软件堆栈的复杂性,让大型(河马,hippo)模型运行得像猎豹一样快。HippoML的主要产品是一个名为PrivateCanvas的应用,集成了Stable Diffusion(XL, LCM), SDXL Inpaint, Segment Anything, ESRGAN, MI-GAN等大模型,可以让用户在本地就使用各种热门大模型的功能。
该公司的创始团队来自Meta,其中包括Bing Xu和Hao Lu两位华人科学家。
而Lepton AI与HippoML之间的合作也并非首次。早在2023年8月,两家就合作推出了号称“最快”的SD扩散模型,同时将代码进行了开源。
而在2023年12月,有眼尖的网友发现,Lepton AI小试牛刀,悄悄上线了一个很有意思的项目:tryemoji,该项目可以把emoji表情变成真实的图像、动画,还提供了不同风格的模板供用户筛选。
贾扬清此前曾在播客中表示,不会做大模型创业,而是会更关注如何帮用户构建更好的AIGC应用,在AI Infra(AI时代连接硬件和上层应用的中间层基础设施,提供基础模型服务、赋能模型微调和应用开发)领域持续发力。
AI+搜索,AI+一切
除了提示词,Lepton AI还向AI搜索工具下手了。
目前,AI搜索领域最明星的产品是 Perplexity AI。不同于谷歌搜索出来的结果是链接,Perplexity会直接生成一段答案,并且在这段答案上方提供一个个附注链接(表明答案来源于这些地方),方便用户自己溯源。
自2022年12月上线以来,Perplexity的产品一直稳定增长,在2023年10月推出订阅制服务后ARR达到了300万美元,月活在2024年1月达到了1000万,并以5亿美元的估值完成了由IVP 领投的 7360 万美元融资。
而就在最近,Lepton AI也做了一款类似于Perplexity的产品。
Lepton AI的口号是“建立高效的 AI 应用平台(Build AI The Simple Way)”。除了PromptLLM和Lepton Search这两款主打的产品,在他们的官网上,还有各种各样有意思的AIGC产品:
比如OpenVoice,这是一个多功能的即时语音克隆工具,用户只需要输入一段文字,并且上传原始音频片段,就能生成和原说话者一样声音的音频内容,还可以选择不同的语气。
比如Super Resolution ,可以用人工智能生成无损质量的超高分辨率图片。
开源斗士
Lepton AI的创始人贾扬清一直是开源的摇旗呐喊者。早在深度学习框架Caffe刚刚出炉之时,贾扬清就力排众议,坚持将此框架开源;同时,他也是开源框架Tensor Flow和Pytorch的核心成员和共同领导者。
贾扬清此前曾经在公开演讲中指出,AI普惠的两个重要支撑,一个是工程化,另外一个是开源:从工程化角度,人们可以使用大规模的计算来寻找背后的统计学规律,无论是通过云原生的方式,还是更加高效的分布式计算,都让开发到迭代的路径变得更加简单;从开源的角度,开源让工作变得更加迅速、让整个市场变得更大,使得整体开发的效率提升、成本降低,进而实现共赢。
也因此,Lepton AI一出生就带着“开源”的基因,不仅在所有的产品页面上都附上了API,更是用 GitHub 开源工具链 SDK 的方式降低了模型的使用门槛,让每一位 AI 开发者们通过一行命令即可拉起热门模型。
而就在两个月之前,贾扬清还发朋友圈怒怼同行,表示有模型厂商套壳Llama,给下游客户造成了负担,也有损开源社区的自由度。
消息一传开,各种Llama魔改的国产大模型纷纷躺枪,贾扬清迅速留言辟谣说不是老东家阿里。关于这一“大厂”究竟是谁目前仍然众说纷纭,但是很多人猜测是李开复创办的零一万物发布的大模型Yi-34B。
此前就有网友在Hugging Face社区的Yi-34B板块讨论区留言说,除了两个张量(input_layernorm 和 post_attention_layernorm)被重新命名外,Yi完全使用了Llama的架构。
零一万物是李开复在2023年7月趁着这波大模型热成立的新公司,Yi-34B是其在11月发布的首款预训练开源大模型。
此事一出,零一万物负责人Richard Lin回应称,“这个命名问题是我们的疏忽,在大量的实验中,我们对代码进行了多次重命名,以满足试验要求,但在推出发行版前没有把名字换回来”。
同时,Richard Lin还在回复中表示,将检查所有代码,加强流程管控,保证这样的失误不会再次发生。