Midjourney–最强大的AI图像和插画生成工具

你有没有想过你可以把你输入的文本变成图片? 想象一下,只需几句话就能为你的故事、演示文稿、游戏或艺术项目创建令人惊叹的视觉效果,这正是Midjourney所做的。Midjourney是一个文本生成图像的AI工具,可让你从任何文本描述中生成逼真且多样化的图像。无论你想创造奇幻风景、未来城市、可爱动物,还是任何你能想到的东西,Midjourney都可以帮助你实现。

Midjourney的发展历史

Midjourney 由一群对人工智能和创造力充满热情的研究人员和工程师于 2022 年创立,他们受到OpenAI 的 DALL-E和Stable Diffusion模型的突破的启发——从自然语言输入创建高质量图像。

然而,他们也注意到这些模型有一些局限性。 例如,它们经常生成模糊或扭曲的图像,无法捕捉到复杂的细节或情绪,或者生成的图像与用户的意图不符。Midjourney 的创始人希望创建一种 AI 来克服这些挑战,并生成不仅逼真而且富有表现力和多样性的图像,让用户更好地控制自己的创作,让他们能够无限制地探索自己的想象力。

为了实现这一目标,他们基于最先进的技术开发了自己的专有模型,例如Transformer、生成式对抗网络 (GAN) 和自注意力机制。 他们还收集并整理了来自不同领域和流派的文本图像对的大规模数据集,经过数月的努力和测试,终于在2022年底推出了Midjourney作为在线平台,任何人都可以访问他们的AI 免费生成图像。

Midjourney的主要特点

Midjourney有几个特点使其从其他文本到图像的AI工具中脱颖而出:

  • 现实逼真。Midjourney可以产生看起来逼真自然的图像,它可以处理具有多个对象、背景、灯光效果的复杂场景和视角。 它还可以捕获细微的细节,例如纹理、阴影和反光。
  • 情感表达。Midjourney可以产生传达情感和情绪的图像,它可以根据用户的输入调整不同颜色、品味、和风格的图像。它还可以生成面部表情、身体语言、以及人类或动物角色的手势。
  • 多样性。Midjourney可以产生多样化且独特的图像,它可以为每个输入生成多个变体,允许用户选择他们最喜欢的一个或将它们组合在一起。 它还可以在图像中引入随机元素或惊喜,让他们更有创意和乐趣。
  • 交互性。Midjourney允许用户以各种方式与他们的图像进行交互, 用户可以编辑他们的输入、添加标题或应用过滤器来改变图像的外观。用户还可以在 Discord、Twitter 或 Instagram 等社交媒体平台上与其他用户分享他们的图像。

ClipDrop–强大的图像或视频抠图能力

集合了图片曲背,模糊图片变清晰,替换背景,去除文字,AI绘画等一系列功能聚合网站

https://clipdrop.co/

Clipdrop是一款强大的图像处理软件,它能够将任何场景中的图像或视频实时抠出,让你可以即时将其应用到你的设计或者文档中。它的优点在于:操作简单,可以将颜色、文字、二维码、表格等元素从纸张上或其他场景中提取出来,而无需使用复杂而昂贵的图像编辑软件。它还支持多种输出格式和多种设备,可以轻松实现跨平台传输,非常方便。

Upscayl–免费开源的AI图片无损放大工具

1、简介

免费开源的AI图片无损放大工具
2、下载地址

https://www.upscayl.org/
3、功能介绍

如何将一张图片高清化还尽量保留原图的细节呢?Upscayl就能帮你实现!

软件主打无损放大功能,让你轻松将任意分辨率的图片纸放大到高清、超清甚至 4K 水平,大幅提升图片细节表现与清晰度。

这款软件的优点:文件小,内存占用小
这款软件的缺点:吃显卡,显卡越好压力越小(实测gtx950稳定运行,造成其他视频软件稍微卡顿)还有一点就是下载速度超慢,但是文件小,我们等一会也不是不可以。这款软件的界面清爽,是英文界面,实际的选项功能并不多,个人认为这软件最大的缺点就是生成的图片过大(本文中还有很多小编自己实测的高清图,但是都超多10M无法上传),能优化在7M一下就很好了。

4、使用说明

第一步:点击SELECT IMAGE,上传自己需要的照片。

第二步:选择功能

·REAL-ESRGAN:提高图像的清晰度和真实感,并尽可能保持图像细节;

·RemaCRI:适合处理一些特定领域的图像增强,如人像、风景等。它可以更好地处理对比度、饱和度等方面的问题;

·UltraMix Balanced:适用于处理色彩饱和度偏低的图像,同时保持图像细节和色彩平衡;

·UltraSharp:专注于提高图像的清晰度以及边缘锐利度;

·Digital Art:专门用于增强数字艺术作品的细节、颜色和纹理等方面,以使其效果更逼真;

一共有五大功能,详细介绍就在上面了。这里随便选了一张像素不高的图,准备进行高清修复,选择第一个功能REAL-ESRGAN。

第三步:点击SET OUT FOLDER设置图片输出位置

第四步:点击UPSCAYL,完成

处理完的效果可以看下面的动图。(PS:具体处理时间就看我们电脑配置啦)

UniJump–免费的ChatGPT Chrome 插件

1、简介

一个可以让你从任何网站上快速访问ChatGPTChrome插件,开源免注册。

2、下载地址

链接:https://pan.baidu.com/s/17xi0yZKPQlgTKb03zWkhdg?pwd=klkj
提取码:klkj

如无法下载,请加我们的AI小助手微信

3、功能介绍

快速访问ChatGPT聊天机器人;
提供实用的交互式聊天服务;

UniJump - Shortcut for ChatGPT插图

支持多种语言和主题;
提供准确的答案和解决方案;

UniJump - Shortcut for ChatGPT插图1

可以在任何网页上使用。

4、安装说明

1、在打开的谷歌浏览器的扩展管理器
就是点击最左侧的三个点,在弹出的菜单中选择【更多工具】——【扩展程序】
或者你可以在地址栏中直接输入chrome://extensions/
2、进入扩展程序页面后将开发者模式打勾
3、最后将解压出来的crx文件拖入到浏览器中即可安装添加
4、如果出现无法添加到个人目录中的情况,可以将crx文件右键,然后选择【管理员取得所有权】,再尝试重新安装
5、安装好后即可使用

5、使用说明

首先,用户需要在Chrome浏览器中打开Chrome Web Store,搜索“UniJump – Shortcut for ChatGPT”插件,并安装在浏览器中。

UniJump - Shortcut for ChatGPT插图3

安装完成后,在浏览器的右上角会出现一个ChatGPT的图标,点击即可打开聊天机器人。
在弹出的聊天框中,用户可以输入问题或关键字,ChatGPT将会给出相应的答案或解决方案。
用户还可以选择不同的语言和主题,以便更好地与ChatGPT进行交互。
当用户需要关闭聊天机器人时,只需再次点击浏览器的ChatGPT图标,即可关闭聊天框。

卖了93亿元,AIGC最大收购案诞生!62人大模型公司,创始人之一是华人哈佛博士

AI浪潮下,巨头们除了自主研发和投资外,直接收购初创公司也成了巨头们进军AI领域的主要方法之一。 

近日,大数据巨头Databricks就宣布以13亿美元的价格收购了位于旧金山的生成式AI初创公司MosaicML。

收购完成后,MosaicML将成为Databricks Lakehouse平台的一部分,其团队和技术也将并入Databricks。

此前,MosaicML已经从 DCVC、AME Cloud Ventures、Lux、Frontline等多家知名投资机构获得了近6400万美元的融资。

值得注意的是,MosaicML上一轮融资时估值仅为2.22亿美元,这意味着此次收购使得MosaicML的估值短期内暴涨了6倍

此笔交易也是截至目前今年生成式AI领域内所公布的最大一笔收购案

MosaicML是一家专注于生成式AI的公司,由曾在 Intel 担任人工智能产品负责人、Nervana Systems 的联合创始人 Naveen Rao 以及英特尔AI实验室的高级主管Hanlin Tang于2021年创立,员工仅 62 人。

注:Hanlin Tang(左一)、Naveen Rao(左二)

Naveen Rao曾在2014年创建了深度学习初创公司Nervana Systems,该公司因开发了Neon这一高性能的深度学习框架而广受关注,后来以4亿美元的价格被英特尔收购。Naveen Rao随后加入英特尔,成为AI产品集团的负责人。

2020年,英特尔宣布放弃原计划的Nervana服务器端AI加速芯片,转而使用花费20亿美元收购的以色列公司Habana的产品。

这一决定导致Naveen Rao和Nervana的前核心员工Hanlin Tang选择离开英特尔,另起炉灶创办了MosaicML,Hanlin Tang 担任 MosaicML的CTO

Hanlin Tang毕业于哈佛大学,研究人类视觉中的递归神经网络。Hanlin Tang在普林斯顿大学取得物理学学士学位,随后在哈佛大学取得生物物理学的博士学位,研究人类视觉中的递归神经网络,他少年时期在台北度过。后来加入英特尔后,在英特尔AI实验室担任高级主管,在此期间Hanlin Tang负责算法工程和深度学习研究,并参与了MLPerf基准测试的开发。

Hanlin Tang在国际顶级期刊和会议上发表了多篇论文,涉及计算神经科学、计算机视觉、自然语言处理和强化学习等领域。

不同于主要面对ToC的ChatGPT,MosaicML主要针对企业的需求。MosaicML提供了一个平台,让企业可以在自己的安全环境中训练和部署AI模型,并降低成本。

MosaicML曾宣称,他们可以用不到5万美元的成本,在7.45天内训练出一个与stable diffusion 2 base相当的模型。

MosaicML的产品包括开源的、商业授权的MPT Foundation系列模型,以及MosaicML推理和训练服务。

几天前MosaicML发布的大模型MPT-30B,展示了企业如何以经济高效的方式使用其数据快速构建和训练自己的最先进模型。其LLM上一个版本 MPT-7B 已获得 330 万次下载。

MosaicML客户包括艾伦人工智能研究所、Generally Intelligence、Hippocratic AI、Replit 和 Scatter Labs。

而这次收购MosaicML的金主Databricks成立于2013,总部位于旧金山,是一家基于云计算的Spark大数据软件公司,提供用于数据集成、数据清洗、数据管理以及其他服务的基于Spark的云服务。

如今,全球有9000 多家组织(包括荷兰银行、康泰纳仕、再生元和壳牌)依靠 Databricks 来实现大规模数据工程、协作数据科学、全生命周期机器学习和业务分析。

Databricks 联合创始人兼首席执行官 Ali Ghodsi 在一份声明中表示,“每个组织都应该能够从人工智能革命中受益,并对其数据的使用方式有更多的控制。Databricks 和 MosaicML 拥有实现人工智能民主化的绝佳机会。

在这次AI浪潮中,对于想亲自下场的巨头们来说,大肆购买GPU已成基本操作。

2023年以来,字节跳动被曝已经订购了价值约10亿美元的英伟达GPU。其中包括10万块最新的A100和H800加速卡。

当字节大幅投入GPU时,有媒体爆出字节跳动原RISC-V和服务器芯片负责人卢山创立了蓝芯算力,专注于RISC-V数据中心CPU。

注:RISC-V 是一种开源和免费的指令集,可以被自由地用于商业目的,不受单一国家或公司制约,无需支付 IP 授权费用。

卢山毕业于清华大学,拥有波士顿大学电气与计算机工程博士学位,在英特尔和高通有十余年的工作经验。

RISC-V 目前主要用于物联网芯片,但也有一些团队尝试基于 RISC-V 设计更高性能的 CPU,用于手机和数据中心服务器。

目前,蓝芯算力正在进行首轮融资,并获得了1亿美元的投前估值。

头部融资

上周,国内生物医药和人工智能领域总共发生了14起投融资事件。人工智能6起,融资总金额超1.45亿元,生物医8起,融资总金额超过7.6亿元。

上周天使轮到A轮融资较多。生物医药领域的涉及创新药等,人工智能领域包括大模型等。

上周生物医药领域融资最多的是朗来科技,是一家处于临床阶段的创新药研发公司,秉持研发管线和平台构建同步提升的双驱动策略,构建了从概念验证、候选化合物筛选、临床前成药性开发到临床研究的全流程新药研发体系。

一周融资汇总:

来源:头部科技