马斯克:中国 AI 会很强,年底或实现自动驾驶

北京时间 2023 年 7 月 6 日上午,WAIC 2023 世界人工智能大会正式开幕,特斯拉创始人伊隆·马斯克再次亮相,不过这次是以远程视频的方式。

遥想 2019 年,同一场地,马斯克曾经和阿里巴巴创始人马云展开过一次巅峰对话。4 年之后,很多事情都变了,其中最重要的一个就是,因为大语言模型带起的新一波 AI 浪潮,让通用智能似乎距离人类更近了一步。

在当天的发言中,作为「AI 毁灭派」的代表之一,马斯克强调了通用人工智能 AGI、或者深度智能可能带来积极的未来,但也有概率出现负面的未来,人们应该确保不会发生后者。

在此次 WAIC 2023 大会的展区,特斯拉的机器人 Optimus 吸引了众多目光。马斯克认为,人形机器人还处于早期开发阶段,但是在未来,机器人的数量,或将超过人类数量。

同时,作为有限人工智能的一种,特斯拉一直在研发的全自动驾驶 FSD 或将在年底实现。

对于东道主,马斯克认为「中国下定决心去做一件事,他们一定能够做得非常出色,人工智能也不例外」。他相信「中国在人工智能方面将拥有强大的能力」。

以下为伊隆·马斯克在 WAIC 2023 大会上的演讲文字整理实录:

上海的朋友们,大家好!

人工智能将在人类文明进化中发挥非常深远的作用。当前。计算机的数量和算力正在爆炸式增长,地球上的数字计算机与「生物计算机」的比例一直在增大。这意味着随着时间推移,相对于机器,人类智力在地球上的总思维能力中所占的比例将越来越小。

这将是一场深刻的变革,我认为,人类正处于最深远的变革时期之一。

未来,地球上会有大量的机器人。一个值得思考的问题是,随着时间推移,机器人与人类的比例会是多少?在将来某个时刻,二者的比例可能超过 1:1,这意味着机器人将比人类多,甚至是多很多。这一趋势已经十分明显。

好的一面是,人类将生活在一个富足的时代,人们想要的任何商品和服务都可以轻易地拥有。在拥有大量机器人的未来,全球的生产效率将会提高到令人难以置信的水平。当然,我们需要非常谨慎地对待,确保机器人对人类是有益的。

特斯拉 Optimus 机器人在 WAIC 2023 上展出|极客公园

我相信,特斯拉将在这一进程中扮演重要的角色。特斯拉人形机器人正在开发中,其目标是帮助人们完成琐碎的工作,完成人类不愿做的无聊、重复或危险的任务。因此,它不需要很高的智能水平就可以胜任这些工作。

人工智能的一个重要应用是汽车的自动驾驶。在自动驾驶方面,特斯拉非常乐意将技术授权给其他汽车制造商。自动驾驶技术会把人们从枯燥的驾驶中解放出来,给人们更多的自由和时间。

同时,自动驾驶将大大提升车辆的利用率。一辆普通乘用车每周使用时长大概是 10 到 12 个小时,大部分时间它会停在停车场,而一辆拥有完全自动驾驶能力的车,每周的使用时间可以达到 50 到 60 个小时。自动驾驶车辆的利用率会是非自动驾驶车辆的 5 倍。特斯拉希望将这一类技术分享给更多企业使用。

目前,特斯拉的技术已经非常接近完全自动驾驶的目标。在美国道路上进行测试的特斯拉车辆,已经很少需要人工干预了。因此,当我们驾驶一辆具备最新版本完全自动驾驶能力测试版的特斯拉,从一个目的地到另一个目的地,我们几乎不需要人为操控。特斯拉可能在今年晚些时候就具备 L4 或 L5 级的完全自动驾驶能力。

相比自动驾驶、特斯拉人形机器人等人工智能,通用人工智能(AGI, Artificial General Intelligence)有很大不同。

通用人工智能是一种计算机智能,它能比所有人类都聪明。这并非特斯拉目前专攻的领域,有其他公司正在研究。但我认为,这也是我们应该关注的领域。尤其是面对深度人工智能的上万台,甚至数十万、数百万台最先进的计算机,我们需要有监管措施来确保这些计算机都可以协同并有序工作,以成就一个单一的综合「超级智能」(ASI, Artificial Super Intelligence) 。

未来,「超级智能」将比人类更有能力,也同时存在着风险。我们应该尽一切可能,确保担忧的事情不会发生,迎接积极未来的到来。

在中国,有很多非常聪明、有才华的人,我一直很钦佩他们的才华与干劲。我认为,中国在任何它想做的事情上都会完成得十分出色,这在许多领域都有体现,不论是经济还是人工智能领域。我相信,未来中国将拥有非常强大的人工智能能力。

最后,感谢大会邀请我来做分享,非常期待能跟大家见面!

0代码训练GPT-5?MIT微软证实GPT-4涌现自我纠错能力,智能体循环根据反馈让代码迭代!

【导读】谁能想到,训练GPT-5竟不用手写代码。MIT微软最新研究发现,GPT-4在代码修复中的有效性。以后,OpenAI工程师能做的只有——Critique is all you need。

我们都知道,大模型具有自省能力,可以对写出的代码进行自我纠错。

这种自我修复背后的机制,究竟是怎样运作的?

对代码为什么是错误的,模型在多大程度上能提供准确反馈?

近日,MIT和微软的学者发现,在GPT-4和GPT-3.5之中,只有GPT-4表现出了有效的自修复。并且,GPT-4甚至还能对GPT-3.5生成的程序提供反馈。

论文地址:https://arxiv.org/pdf/2306.09896.pdf

英伟达科学家Jim Fan强烈推荐了这项研究。

在他看来,即使是最专业的人类程序员也无法一次性正确编写程序。他们需要查看执行结果,推理出问题所在,给出修复措施,反复尝试。这是一个智能体循环:根据环境反馈迭代改进代码。

很有可能,OpenAI正在通过雇佣大量软件工程师来训练下一代GPT。而他们不需要输出代码——Critique is all you need。

– GPT-4能够进行自我修复的核心原因是其强大的反馈能力。它能够有效地自我反思代码的问题所在,其他模型无法与之竞争。

– 反馈模型和代码生成模型不必相同。事实上,反馈模型是瓶颈。

– 基于GPT-4的反馈,GPT-3.5能够编写更好的代码。

– 基于专业人员的反馈,GPT-4本身能够编写更好的代码。

揭秘用于代码生成GPT修复

我们都知道,大语言模型在生成代码方面,表现出了非凡的能力。

然而,在具有挑战性的编程任务(比如竞赛和软件工程师的面试)中,它们却完成得并不好。

好在,很多模型会通过一种自修复工作流来「自省」,来自我纠正代码中的错误。

研究者很希望知道,这些模型在多大程度上能提供正确的反馈,并且说明自己生成的代码为什么是错误的。

如图显示的是,基于自我修复方法的经典工作流程。

首先,给定一个规范,从代码生成模型中采样一个程序,然后在规范中提供的一组单元测试上执行该程序。

如果程序在任何单元测试中失败,那么错误的消息和程序会被提供给一个反馈生成模型,该模型再输出代码失败原因的简短解释。

最后,反馈被传递给一个修复模型,该模型生成程序的一个固定版本。

表面上看,这个工作流似乎非常完美。它让系统在解码过程中克服由于不良样本引起的错误,在修复阶段容易地合并来自符号系统(编译器、静态分析工具和执行引擎等)的反馈。

并且模仿人类软件工程师编写代码的试错方式。

然而,工作流有一个问题:自修复需要对模型进行更多的调用,从而增加了计算成本。

而且,研究者们发现了一个很有意思的现象:大模型自修复的有效性不仅取决于模型生成代码的能力,还取决于它对于代码如何在任务中犯错的识别能力。

目前还没有任何工作对此进行详细调查,因此,作者们研究了GPT-3.5和GPT-4在解决竞赛级代码生成任务时的自修复有效性。

研究人员提出了一个新的评估策略,在这个策略中,根据从模型中采样的token总数来衡量任务的通过率。

因为使用的是pass@t,而不是传统的pass@k(根据实验数量衡量通过率),这样就能与纯粹基于采样的方法进行公平的比较。

从实验中,研究者发现:

1. GPT-4才能实现自我修复带来的性能提升;对于GPT-3.5,在所有预算下,修复后的通过率要低于或等于基准的无修复方法。

2. 即使对于GPT-4模型,性能提升也最多只能算是适度的(在预算为7000个token的情况下,通过率从66%提高到71%,约等于45个独立同分布的GPT-4样本的成本),并且取决于初始程序的多样性足够丰富。

3. 使用GPT-4生成的反馈替换GPT-3.5对错误的解释,可以获得更好的自修复性能,甚至超过基准的无修复GPT-3.5方法(在7000个token下,从50%提高到54%)。

4. 使用人类程序员提供的解释替换GPT-4自己的解释,可以显著改善修复效果,修复并通过测试的程序数量增加了57%。

自我修复四阶段

自修复方法涉及4个阶段:代码生成、代码执行、反馈生成和代码修复。对此,研究人员正式定义了这四个阶段。

阶段一:代码生成

阶段二:代码执行

阶段三:反馈生成

阶段四:代码修复

研究人员又进一步针对3个问题进行了测试:

1. 对于更加有挑战的编程任务中,这些模型的自我修复是否比不进行修复的i.i.d.有更好的采样?

2. 更强的反馈模型会提高模型的修复性能吗?

3. 如果让人类参与功能最强模型的自我修复循环,提供人工反馈,是否可以解锁更好的修复性能?

首先研究团队引入了一个很有挑战的编程任务:Automated Programming Progress Standard (APPS)数据集中的编程任务。

这个数据集中的任务包括从入门级到大学竞赛级的编程任务,可以用来评估人类程序员解决问题和代码能力。

研究人员选取了300个任务,包括60个入门级别的任务和60个竞赛级别的任务。

研究人员选取了GPT-3.5和GPT-4作为模型,使用模板字符串连接和单次提示词来进行自我修复。

下图为提示词的实例之一。

自修复需要强大的模型和多样化的初始样本

研究人员让单个模型分别进行代码的修复生成和反馈生成。

在右边的图中,我们沿轴显示了具有两个超参数的热图,其中每个单元格中的值表示平均通过率,当给定相同的token预算(即t的相同值pass@t)时,自我修复由基线的平均通过率归一化。

从实验可以看到,对于GPT-3.5模型,pass@t在所有设置下都低于或等于相应的基线(黑),清楚地表明自我修复对GPT-3.5并不是一种有效的策略。

而在GPT-4中,有几个值的自修复通过率明显优于基线。

GPT-4反馈改进了GPT3.5的修复结果

研究人员又进一步进行了新的实验,评估使用单独的、更强的模型来生成反馈的效果,目的是为了测试一个假设:由于模型无法内省和调试自己的代码,阻碍了自我修复(比如说对于GPT-3.5)。

这个实验的结果如上图(亮蓝色)所示。

在绝对性能方面,GPT-3.5,GPT-4确实突破了性能障碍,并且比GPT-3.5的i.i.d.采样略微更高效。

这表明文本反馈阶段本身是至关重要的,改进它可以缓解GPT-3.5自修复的瓶颈。

人工反馈显著提高了GPT-4修复的成功率

在最后一项实验中,想要研究在用更强的模型(GPT-4)进行修复时,加入专家人类程序员的反馈的影响。

研究目的是了解模型识别代码中错误的能力与人类的能力相比如何,以及这如何影响自修复的下游性能。

研究人员研究人员招募了16名参与者,包括15名研究生和1名专业机器学习工程师。

每个参与者都有五种不同的基础程序,基于他们的Python经验编写代码。

每个程序都取自不同的任务,参与者永远不会看到属于同一个任务的两个不同的程序。

然后,参与者被要求用他们自己的话解释这个程序做错了什么。

研究人员发现,当我们用人类参与者的调试替换GPT-4自己的调试时,总体成功率提高了1.57×以上。

不出意外的是,随着问题变得更难,相对差异也会增加,这表明当任务(和代码)变得更复杂时,GPT-4产生准确和有用反馈的能力远远落后于人类参与者。

法律大模型ChatLaw登场!北大学生团队,两天百万关注

有人做了统计,截止到今天,国内已经公布的大语言模型LLM已经达到93个,距离“百模大战”仅差一步之遥。

有意思的是,这些大模型的主体所在地有45%在北京,而其中最知名且开源的大模型莫过于清华的ChatGLM-6B/130B。作为中国两大顶级学府之一,清华的ChatGLM早就名声在外,成为了中文大模型的微调底模标配。

直到几天前,一街之隔的北大学子们终于拿出了他们自己的语言模型:ChatLaw

严格来说,ChatLaw不能算是大语言模型。一方面,它是在其他大模型基础之上做的专项训练;另一方面,显然你也不能指望法律模型给你写小红书写脚本,把它看成是垂直模型更恰当一些。

按理说,大模型发布了这么多,咱们早就看麻木了。但ChatLaw发布当晚就在知乎冲到了热榜第一的位置,很短的时间内话题浏览量就超过150万。

就连我随手回复个求内测名额,也能堆起50层回复。

在Github项目库里,点赞的星星数量仿佛旱地拔葱,直接腾空而起,目前已经有1.7K,妥妥的热门项目。

那么,这个模型究竟做对了什么,让见过市面的人们也争先恐后的排队体验?

除了最基础的法律条文问答,这三件事最让人眼前一亮:

其一,不仅是法律条文的问答,还能上传文档。比如在劳动纠纷中支持上传劳动合同,将重要信息结构化展示。

其二,支持上传对话录音。这很接近法律实践中的举证环节,ChatLaw抽取对话录音的信息,结构化展示,刚登场就是多模态级别。

其三,法律文书撰写。基于用户举证,结合判例和法条,为用户撰写法律文书,比如劳动仲裁申请书。

如果要用一句话评价这个项目团队,我只能说他们太会举例子了,简介视频都能拿捏社会热点,产品宣发在宣发上就已经遥遥领先其他大模型。

展开来说,可以分为模型技术层面和社会需求层面。

从模型技术上讲,ChatLaw并没有多先进,而是典型的应试教育+大力出奇迹的结合体。

项目团队已经训练出三个版本,底层大模型来自LLaMA,其中:

学术demo版ChatLaw-13B,基于姜子牙Ziya-LLaMA-13B-v1训练而来,中文表现很好,但是应对逻辑复杂的法律问答时效果不佳,需要用更大参数的模型来解决。

学术demo版ChatLaw-33B,基于Anima-33B训练而来,逻辑推理能力大幅提升,但是因为Anima的中文语料过少,导致问答时常会出现英文数据。

ChatLaw-Text2Vec,使用93万条判决案例做成的数据集基于BERT训练了一个相似度匹配模型,可将用户提问信息和对应的法条相匹配,例如:

在训练数据上,项目团队的数据主要由论坛、新闻、法条、司法解释、法律咨询、法考题、判决文书组成,随后经过清洗、数据增强等来构造对话数据。比如像下面这样的对话方式:

在类似这样的大量先验数据投喂下,ChatLaw在司法考试的大模型对比中成绩超过了GPT-4,虽然超过的不多,但证明了这种训练方式的有效性。更具体一点,在训练中加入大量司法考试的选择题作为训练数据,只要让模型牢牢“记住”答案,分数自然就上去了。

为此,团队模型训练上也总结出了三条经验:

一是引入法律相关的问答和法规条文的数据,能在一定程度上提升模型在选择题上的表现;

二是加入特定类型任务的数据进行训练,模型在该类任务上的表现会明显提升,比如问答题数据;

三是大力可以出奇迹,法律选择题需要进行复杂的逻辑推理,参数量更大的模型通常表现更优。

从社会需求上讲,ChatLaw团队做了一件大好事,既是为社会创造了普惠工具,又给大厂们好好上了一课。

自从ChatGPT问世,我们一直在思考一个问题,它对社会带来的具体贡献是什么?

是降本增效,是时代变革,是几天一个王炸的颠覆?

够了,不要再被这些只会贩卖焦虑吸引流量的媒体和视频洗脑。

就这么说吧,GPT引发的新一轮AI浪潮是一种显著的创新,但不足以跨越从好玩到好用的鸿沟。它能提升一部分工作流程的效率,但还不足以取代人类。

为什么ChatLaw要大费周章的投喂90多万条真实的司法数据,就是因为通用大语言模型看起来很厉害,实际上到了垂直领域并不能直接用。

比如在司法实践中就发生过这样的乌龙:

美国有一名旅客起诉航空公司,他的代理律师提交了诉状,并引用了六个判例论证起诉要求的合理性。每个判例有原告有被告有法官甚至还有判决书全文,看起来有模有样。

但无论是航空公司还是主审法官,都无法在数据库中查到这六个判例的任何一例。最后代理律师坦言,这些判例都来自ChatGPT之手。

美国人用美国人开发GPT都能胡编法律案例,想象一下用它来咨询中国法律会发生什么。

正应了那句话,你以为它懂得很多,直到有一天它说到了你擅长的领域。

或者换句话说,没有经过足够数量的数据微调或者再训练的大语言模型,充其量就是个社牛:你跟它说什么它都能接上话茬,但是不是胡说八道,请你自行判断。

我们对于生成式人工智能的心态,应当是战术上不要轻视,战略上不要迷信。

很快,我们就会有超过100个大模型,请不要再无谓的重复训练那些超越这个或者那个的模型了。

真的有那么多资金烧算力,不如想ChatLaw一样,做个本地化的,且社会大众都能用得上的AI工具。

就像Demo中预设的这些问题,普通人并不知道如何拿起法律武器保护自己权益,也不知道怎么找或者找什么样的律师帮自己维权。

也难怪ChatLaw刚宣布内测,就吸引如此之多的人去排队等待体验。

什么是刚需,这就是刚需!普法之路任重道远

再看看下面几个例子,请点开来仔细看。以后微博热搜再发小作文,多少先过一遍ChatLaw再评论不迟。

这群来自北大信息工程学院的学生们,清晰的勾勒出下一步的开发计划:

一方面法律场景的真实问答通常涉及很复杂的逻辑推理,为了提升逻辑推理能力,必须训练30B以上的中文模型底座;

另一方面法律是一个严肃的场景,在优化模型回复内容的法条、司法解释的准确性上还可以进一步优化,预计还需要两个月的时间,大幅减轻大模型幻觉的现象。

当大厂们还在挖空心思筑高墙炒概念,拿开源冒充原创,重复训练低质量闭源模型时,一群学生肩负起了为社会创造开源普惠工具的责任。

祝ChatLaw好运!

论文地址:

https://arxiv.org/pdf/2306.16092.pdf

Github:

https://github.com/PKU-YuanGroup/ChatLaw

官网:

https://www.chatlaw.cloud

开源Demo:

https://chatlaw.cloud/lawchat/#/

AI争霸,谷歌囤“数据”

数据作为AI技术发展的三大要素之一,一直是这场AI”诸神大战”中,科技巨头们“斗争”的焦点。

7月1日,谷歌更新了隐私权政策,明确表示公司保留了获取用户在网上发布的内容来训练其人工智能工具的权利。

谷歌隐私政策的更新内容如下:

谷歌将利用信息来改进我们的服务并开发新产品、功能和技术,使我们的用户和公众受益。例如,我们将使用公开信息来帮助训练谷歌的AI模型并构建Google Translate、Bard 和 Cloud AI等产品和功能。

而通过对比可知,在前一个谷歌隐私权政策的版本中,谷歌只提到了将这些数据将用于“语言模型”,而不是“人工智能模型”。

媒体分析指出,这一隐私政策条款与以往有很大的不同,通常来说,这些政策将说明企业如何使用用户在公司自己的服务器上发布的信息。但在这一项条款中,谷歌似乎保留了收集和利用在公共平台上发布的所有数据的权利,就好像整个互联网是该公司自己的AI游乐场。

此前尽管任何人都可以看到在线公开发布的内容,但这些信息的使用方式正在发生变化。公众对数据的关注点从谁可以访问数据转向如何利用数据

谷歌的Bard和ChatGPT可能早已利用了你已经遗忘的博客帖子或几年前的餐厅评论来训练自己。对于大众对于隐私权的担忧,谷歌并未立即发表评论。

谷歌向“卖水人”表达诚意

除了谷歌的用户外,数据提供商们成了想要囤“数据”的谷歌不得不“讨好的对象”。

数据提供商们被看作为AI时代中的“卖水人”。

马斯克不想被AI白嫖数据,限制访问,导致推特大宕机。同样是不想被白嫖数据的美国贴吧Reddit,付费API已经来了。直接导致了几个非常流行的第三方Reddit app下线。由此可见AI时代“卖水人”对自家“水”的保护。

而谷歌已率先向“卖水人”们拿出了自己的诚意。大型新闻出版商们的数据自然是首当其冲的焦点。

最近几个月,围绕AI的版权问题进行讨论从未停止,加剧了大型科技公司与出版界之间本已紧张的关系。而谷歌率先表态,愿意付费购买新闻内容。

媒体援引一位报业集团高管消息称,谷歌已制定了协议,愿意在未来付费购买新闻内容

AI争霸,谷歌囤“数据”“谷歌已经制定了许可协议,他们愿意接受需要付款购买内容的原则,但我们还没有讨论金额。谷歌方称,未来几个月里会进行金额方面的谈判,这是第一步。”

针对这一报道,谷歌澄清称关于许可协议的报道“不准确”,并补充说“现在还处于早期阶段,我们正在继续与生态系统合作,包括新闻发布商,获取他们的意见。”

据谷歌表示,他们正在与美国、英国和欧洲的新闻机构进行“持续对话”,同时他们的AI工具Bard也正在接受“公开可获得的信息”的培训,这可能包括需要付费的网站。

高清还原你大脑中的画面

将头脑中的想法转化为文本这一步可以省去,直接通过脑活动(如 EEG(脑电图)记录)来控制图像的生成创作。

清华大学深圳国际研究生院、腾讯 AI Lab 和鹏城实验室的研究者们联合发表了一篇「思维到图像」的研究论文,利用预训练的文本到图像模型(比如 Stable Diffusion)强大的生成能力,直接从脑电图信号生成了高质量的图像。

论文地址:https://arxiv.org/pdf/2306.16934.pdf

项目地址:https://github.com/bbaaii/DreamDiffusion

AI 盈利,需要做两个备案

一个是公安部的照《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》,https://www.beian.gov.cn/portal/topicDetail?id=79&token=1ff8d856-36ff-47e0-9dc3-ee175f7b226b

一个是《互联网信息服务算法推荐管理规定》,去互联网信息服务算法备案系统备案,https://beian.cac.gov.cn/#/index

ChatGPT的创建者OpenAI因收集大量私人数据被诉

一群匿名人士在一场寻求集体诉讼地位的诉讼中声称,ChatGPT的创建者OpenAI正在窃取“大量”个人信息,以训练其人工智能模型,肆无忌惮地追求利润。

根据这起长达157页的庞大诉讼,OpenAI从互联网上秘密抓取3000亿字,窃听“书籍、文章、网站和帖子,包括未经同意获得的个人信息”,违反了隐私法。它毫不避讳地使用笼统的语言,指责该公司有“文明崩溃”的风险。

克拉克森律师事务所(Clarkson Law Firm)周三在旧金山联邦法院(federal court)提起的诉讼中表示,原告是根据职业或兴趣来描述的,但由于担心遭到强烈反对,只能用缩写来识别。他们列举了30亿美元的潜在损失,基于他们估计的数百万受伤害者的类别。

“一种不同的方法:盗窃”

他们声称:“尽管已经制定了购买和使用个人信息的协议,但被告采取了不同的方法:盗窃。”该公司广受欢迎的聊天机器人程序ChatGPT和其他产品是在未经原告许可的情况下,根据从包括儿童在内的数亿互联网用户那里获取的私人信息进行培训的。

据报道,计划向OpenAI投资130亿美元的微软公司也被列为被告。

OpenAI的发言人没有立即回复寻求对诉讼发表评论的电话或电子邮件。微软发言人没有立即回复电子邮件。

ChatGPT和其他生成人工智能应用程序激起了人们对该技术前景的强烈兴趣,但也引发了隐私和错误信息的轩然大波。国会正在讨论人工智能的潜力和危险,因为这些产品对创意产业的未来以及区分事实和虚构的能力提出了质疑。OpenAI首席执行官Sam Altman本人上个月在国会山作证时呼吁对人工智能进行监管。但这起诉讼的焦点是OpenAI一开始是如何获得其产品的勇气的。

秘密刮擦

处于新兴行业前沿的OpenAI在诉讼中被指控进行了大规模的秘密网络抓取操作,违反了服务协议条款以及州和联邦隐私和财产法。其中一项被引用的法律是《计算机欺诈和滥用法案》,这是一项联邦反黑客法规,以前曾被用来解决争议。该诉讼还包括侵犯隐私、盗窃、不当得利和违反《电子通信隐私法》的指控。

原告声称,OpenAI大规模滥用个人数据以赢得“人工智能军备竞赛”,非法访问个人与其产品的互动以及集成了ChatGPT的应用程序中的私人信息。诉讼称,这种集成使该公司能够从Snapchat收集图像和位置数据、Spotify上的音乐偏好、Stripe上的财务信息以及Slack和Microsoft Teams上的私人对话。

原告声称,为了追求利润,OpenAI放弃了“以最有可能造福全人类的方式”推进人工智能的最初原则。该诉讼预计,ChatGPT 2023年的预期收入为2亿美元。

在寻求代表大量据称受到伤害的个人,并要求在审判中确定金钱损失的同时,原告还要求法院暂时冻结OpenAI产品的商业访问和进一步开发。

美国 AI 创业公司的新难题:有钱,但是缺数据

随着时间的推移,美国人工智能产业的附加值重心,已经悄悄发生了转移。根据《华尔街日报》的最新报道:正在筹集数十亿美元的生成式 AI 创业公司,如果没办法获得正确的数据,那么它们可能已经走向失败
风投机构 Primary Venture Partners 的联合创始人兼普通合伙人布拉德.斯夫鲁加指出:

“我们已经看到很多公司可能正在寻求出色的 AI 应用,但他们无法访问能够让他们构建强大应用程序的数据,更加不用说可以帮助他们的专有数据了。”

换句话说:当市场上,构建实际的模型已经变得类似于可以购买的商品时,真正的价值变成了数据。拥有正确的数据,现在可能比任何时候都更加重要。
(一)这里的逻辑是:目前,许多 AI 创业公司都希望能在如金融或医疗保健等细分领域建立起小众的 AI 模型,但因为他们缺乏品牌认知度和社会认同,这些创业公司要获得垂直行业的培训数据集并不容易。

在这方面,大公司可能更具优势因为在如何处理数据方面,大公司已经赢得了大客户们的信任。例如根据《华尔街日报》的报道:安永全球有大量的交易数据,每天都有生成式 AI 创业公司找上门来。但安永全球担心:如果把自己的专有数据用于训练外部模型将会发生什么?“谁拥有这些数据?当我们训练模型时,我们对这个模型的访问权限是什么?其他人还能如何使用这个模型?数据是由我们带来的知识产权的一部分。” 安永全球指出。

要解决类似的 IP 问题,一种对策是:创业公司可以通过仅仅是根据每个客户的数据,来为每个客户训练不同的模型。例如 TermSheet 就是用这种策略来构建 Ethan 产品策略的。后者是一种生成式 AI 模型,可以为房地产开发商、经纪人和投资者回答行业的问题。但是 TermSheet 的 CEO 罗杰.史密斯也表示,即便客户同意这一点,他们也需要教育客户和一些说服力。  

此外,对网络安全的担忧,也是大客户公司不愿意选择创业公司的原因。如金融服务公司 Truist 的首席数据官特蕾西.丹尼尔斯就表示,在数据安全方面,他们信任更加大的供应商,因此只选择与大技术供应商而非创业公司一起探索生成式 AI 应用。

第三,甚至在某些情况下,垂直行业的大客户会要求生成式 AI 创业公司支付巨大的资金额或者是公司股权。如生成式 AI 公司 Veesual 可以生成人们试穿衣服的图像,他们最初利用互联网上的公共图像进行训练,但在努力让大零售商同意交出他们数据以增强模型时,就因为上述原因失败了。

第四种情况,则是在技术上很难实现。如 PatentPal 是一家帮助律师事务所起草专利申请的生成式 AI 初创公司,他们接受过公开专利申请方面的培训。他们有机会继续根据加密或匿名的实际客户反馈,来训练其模型,从而使他们的工具更加准确。但这种过程十分复杂,因为反馈必须与高度敏感和机密的数据(包括商业机密)分开。 

然而与此同时,生成式 AI 创业公司的竞争已经趋向白热化。

如果从资金注入规模看,根据《华尔街日报》引用 PitchBook 的数据:从去年 2022 年到今年的前五个月,生成式 AI 创业公司的风险投资资金规模已经从 48 亿美金增长到了 127 亿美元。因此,为了确保能够在某些利基市场中获得更多数据,生成式 AI 创业公司的压力已经越来越大。

Struck Capital 的创始人兼执行合伙人亚当.斯特拉克指出:一些初创公司正竞相相互竞争,以确保在某些利基市场内获得更多数据。“如果你相信有一个专有数据集,你就想在他们之前得到它,然后,协商排他性。从这个意义上说,这几乎变成了一场军备竞赛。”他说。


(二)

有意思的是,上述现状也不禁让我想到:似乎,市场上真的缺乏一个数据的公开交易市场。

实际上在 2018 年或者更早的 2017 年,我在美国流媒体公司 Netflix 的一位朋友就和我聊起过他的这个创业想法:做一个数据的公开交易市场。不过,始终没有合适的产品形态,包括如何让公司自愿交出自己的数据。

从这个角度讲,前两天的一个新闻——OpenAI 正在考虑推出一个交易市场——就非常值得关注。

需要注意的是:在 ChatGPT 的插件计划几乎失败之后,根据美媒的报道:

OpenAI 正在考虑推出一个交易市场,以让客户可以将他们根据自己需求定制的人工智能模型出售给其他公司。换句话说:这个交易市场将为企业提供一种访问前沿大语言模型的方法,并托管客户们构建的 OpenAI 模型的微调版本。

一家 380 亿美元的数据巨头,要掀起企业「AI 化」革命

作者 | 宛辰、Li Yuan
编辑 | 靖宇

当地时间 6 月 28 日,美国知名数据平台 Databricks 举办了自己的年度大会——数据与人工智能峰会。会上,Databricks 公布了 LakehouseIQ、Lakehouse AI、Databricks Marketplace 、 Lakehouse Apps 等一系列重要新品。

无论是从峰会的名称,还是新产品的命名,都能看出这家知名数据平台,正在趁着大语言模型的东风,加速向 AI 转变的脚步。

Databricks 公司 CEO Ali Ghodsi 所说的数据和 AI 普惠化|Databricks

「Databricks 要实现的是『数据普惠』和 AI 普惠,前者让数据通向每一个雇员,后者让 AI 进入每一个产品。」Databricks 公司 CEO Ali Ghodsi 在台上说出了团队的使命。

就在大会开始之前,Databricks 刚刚宣布以 13 亿美元收购 AI 领域的新生力量 MosaicML,创下了当前 AI 领域收购纪录,可见公司在 AI 转型上的力度和决心。

正在前方参会的 PingCAP 创始人兼 CEO 刘奇告诉极客公园,Databricks 平台刚刚上线 AI 的企业级应用,就已经有超过 1500 家公司在上面进行模型训练,「数字超出预期」。同时,他认为 Databricks 由于之前在数据+ AI 方面的积累,让公司能在 AI 大火之际,迅速在之前平台基础上加入新产品,就能快速给出和大模型相关的服务。

「最关键的就是速度。」刘奇说道,在大模型时代,如何用更快的速度让大模型和现有产品整合,解决用户的痛点,可能是当下所有数据公司最大的挑战,同时也是最大的机会。

Talking points

  1. 通过交互界面的升级,不是数据分析师的普通人,也可以直接使用自然语言查询和分析数据。
  2. 企业将大模型部署到云端数据库将越来越容易,直接使用成品大模型工具分析数据,也将变得更加简单。
  3. 随着AI的进展,数据的价值还将越来越高,数据潜力将被进一步释放。

01

数据库迎来自然语言交互

在会上,Databricks 推出了全新的「神器」LakehouseIQ。LakehouseIQ 承载着 Databricks 近期最大的发力方向之一——数据分析普惠化,即不掌握 Python 和 SQL 的普通人也能轻轻松松接入公司数据,用自然语言就能进行数据分析。

为达到这个目的,LakehouseIQ 被设计为一个功能合集,既可以被普通终端用户使用,也可以被开发者使用,针对不同的用户设计了不同的功能。

LakehouseIQ 产品图|Databricks

对于开发者方面,发布了 LakehouseIQ in Notebooks,这项功能中,LakehouseIQ 可以利用大语言模型帮助开发人员完成、生成和解释代码,以及进行代码修复、调试和报告生成。

而对于普通的非程序员群体,Databricks 则提供了可以直接用自然语言交互的界面,背后由大语言模型驱动,可以直接用自然语言来搜索和查询数据。同时,该功能与 Unity Catalog 集成,让公司可以对数据的搜索和查询进行访问权限控制,只返回提问者被授权查看的数据。

自大模型推出以来,用自然语言对数据进行查询和分析,其实一直是一个数据分析方向的热点,许多公司在此方向都有所布局。包括 Databricks 的老对手 Snowflake,刚刚宣布的 Document AI 功能也是主打这个方向。

LakehouseIQ 自然语言查询界面|Databricks

不过 Databricks 宣称,LakehouseIQ 做到了更好的功能。它提到,通用大语言模型在理解特定客户数据、内部术语和使用模式方面拥有局限性。而 Databricks 的技术,能够利用客户自己的模式(schema)、文档、查询、受欢迎程度、线程、笔记本和商业智能仪表盘来获取智能,回答更多查询。

Databricks 的功能与 Snowflake 的功能还有一个差别,Snowflake 平台的 Document AI 功能,仅限于对文档中的非结构化数据进行查询,而 LakehouseIQ 适用于结构化的 Lakehouse 数据和代码。

02

从机器学习到 AI

Databricks 与 Snowflake 在发布会上的相似之处还不局限于此。

此次发布会中,Databricks 发布了 Databricks Marketplace 和 Lakehouse AI,这与 Snowflake 这两天大会的重点也完全吻合,二者都主打将大语言模型部署到数据库环境中。

在 Databricks 的设想中,Databricks 未来既可以协助客户部署大模型,也提供成品的大模型工具。

Databricks 过去就有 Databricks Machine Learning 的品牌,在此次发布会上,Databricks 对其进行品牌全面的重新定位,升级为 Lakehouse AI,主打协助客户部署大模型。

Databricks 上线了 Databricks Marketplace。

在 Databricks Marketplace 中,用户可以接入经过筛选的开源大语言模型集合,包括 MPT-7B、Falcon-7B 和 Stable Diffusion,还可以发现和获取数据集、数据资产。Lakehouse AI 还包括一些大语言模型操作能力(LLMOps)。

Lakehouse AI  架构图|Databricks

Snowflake 也在对此进行积极部署,其相似功能由 Nvidia NeMo、Nvidia AI Enterprise、Dataiku 和 John Snow Labs 提供。

在协助客户部署大模型方向,Snowflake 与 Databricks 显现出了分歧。Snowflake 选择积极地与合作伙伴进行合作,而 Databricks 则试图将该功能作为其核心平台的本地特性添加进去。

而在提供成品工具方面,Databricks 宣布 Databricks Marketplace 未来还将可以提供 Lakehouse Apps。Lakehouse Apps 将直接在客户的 Databricks 实例上运行,它们可以与客户的数据集成,使用和扩展 Databricks 服务,并使用户能够通过单点登录体验进行互动。数据永远不需要离开客户的实例,没有数据移动和安全/访问问题。

这点则与 Snowflake 公司的产品从命名到功能上都直接撞车。Snowflake 公司与之相似的 Snowflake Marketplace 和 Snowflake Native App 已经上线,是其发布会的重点之一。彭博社就在 Snowflake 的大会上宣布了一个由彭博社提供的 Data License Plus (DL+) APP,允许客户在云端用几分钟时间就能配置一个随时可用的环境,内部设有完全建模的彭博订阅数据和来自多供应商的 ESG 内容。

03

数据平台迎来新变革

开幕式主旨演讲上,Databricks 公布了一个数字:过去 30 天,已经在 Databricks 平台上训练 Transformer 模型的客户超过 1500 家。

在谈及这个令人印象深刻的数字时,PingCAP 刘奇认为,这说明企业应用 AI 的速度比预期的要快得多,「应用模型不一定要去训练模型,所以如果训练的都有 1500 家,那应用的肯定要比这个(数字)大的多得多。」

另一方面,这也表明 Databricks 在 AI 这个领域的布局相对完整。「它现在不仅仅是一个 Data Warehouse(数据仓库),一个  Datalake(数据湖)。现在它还提供:AI 的 training(训练)、AI 的 serving(服务),模型的管理等一整套。」

Ali Ghodsi 以计算和互联网的革命,类比大模型之于机器学习的变革|Databricks

也就是说,底层模型可以通过 Databricks 的平台去训练,「最底层的模型改改参数就能训练」。在这个模型之上所需要的 AI 服务,Databricks 也布局了相应的基础设施——今天发布了 vector search(向量搜索)和 feature store(特征库)。

Databricks 全面向大模型升级。

过去,Databricks 在 AI 方面有很多积累,比如在建索引、查数据、预测工作负载等方面,用小模型来提高效率、降低时延。但是,以如此快的速度补上大模型的能力,还是让不少人意外。

在今天峰会全面展示的 AI 布局之前,Databricks 收购了 Okera(AI 数据治理),推出了自家的开源大模型 Dolly 2.0,又以 13 亿美元并购了 MosaicML,一连串的动作一气呵成。

对此,硅谷徐老师 Howie 认为,Databricks 和 Snowflake 这两个大会都可以比较明确地看出:两家公司的创始人认为,基于数据库、数据湖他们所做的行动、接下来会面临根本性的改变。按照一年前他们在做的思路,在未来几年行不通。

相应地,快速补齐大模型的能力,也意味着可以获得由于大模型带来的增量市场。

刘奇认为,没有大模型之前,很多的需求可能都不存在,但有了大模型之后,有了很多新增需求。「因为只有模型没有数据,干不了什么事情,特别是没有办法做出差异化。如果大家都是一个大模型,那你跟别人可能也没有差别。」

但比起大模型,峰会现场的观众似乎更关注小模型,因为小模型的几个优势:速度、成本、安全性。刘奇表示,基于自己独有的数据,做出差异化的模型,模型要足够小才能满足这三条:足够便宜、足够快、足够安全。

值得注意的是,Databricks 和 Snowflake 在日前都公布了它的营收数据,平台年营收增长在 60% 以上。相比整个市场软件支出放缓的大背景,这样的增长速度反映了数据越来越被关注。这次 Databricks 峰会的主题也是数据加 AI,但有了大模型,数据的价值还将越来越高。

大模型的到来,让数据自动生成成为可能,可以预见,数据量将指数级增长。怎么轻松地访问数据、怎么支持不同的数据格式、挖掘数据背后的价值,会成为越来越频繁的需求。

另一方面,今天很多企业还在还在探索观望将大模型接入企业软件,但考虑到安全、隐私、成本,敢直接用的,还很少。一旦通过将大模型直接部署到企业数据上,无需移动数据,部署大模型的门槛将被进一步降低,数据被消费的数量和速度都将被进一步释放。

火山引擎给大模型造大底座!MiniMax、智谱AI等已登陆

火山引擎刚刚交出大模型趋势答卷:

火山方舟,一个大模型服务平台

它将国内多个明星大模型放在平台上,如MiniMax、智谱AI、复旦MOSS、百川智能、IDEA、澜舟科技、出门问问等。

不仅为大模型玩家提供训练、推理、评测、精调等功能与服务,后续还提供运营、应用插件等工具,进一步支撑大模型生态。

总之,就是要为大模型,打造一个超强底座

而透过火山方舟,火山引擎如何看待大模型趋势?想做哪些事?如今也有了更明确的答案。

火山方舟是什么?

简单理解,各种大模型平台都好比自营商铺,向行业用户售卖大模型服务。

不过火山方舟想做的不是自家专卖店,而是一个集合了多家大模型旗舰店的商城

在这个商城里,行业用户可以快速触及到业界优质的大模型,基于火山引擎的能力对模型精调推理,降低大模型使用门槛

大模型玩家能基于火山引擎搭建稳健的大模型基础设施,提升自家模型业务能力,触及到更加直接和广泛的行业需求,加速迭代升级。

火山方舟作为连接二者的平台,则负责提供丰富完善的开发工具、充沛算力、安全互信的平台以及企业服务等,让双方的合作更加丝滑。

重点功能包括6个方面,贯穿了大模型采购使用的全流程:

第一是模型广场

这可以理解为模型提供方和使用方初步了解的一个平台,大模型厂商能在此进行模型创建、上传、部署等操作,下游用户能看到模型效果并快捷体验。

第二是模型推理

当用户选定好模型后,火山引擎可提供安全互信的推理方案,既保障模型提供方的知识产权安全,同时也维护使用者的数据信息安全。用户能直接使用已部署的在线服务,或者将精调模型部署为在线任务。

第三是模型精调

对于大部分行业用户来说,通用大模型只是基础能力,想要使用更优质的大模型服务可能都需要基于自家数据进行持续训练或精调。

火山方舟能提供极简精调流程,只需两步即可一键精调:选择基础模型→上传标注数据集。对于有复杂需求的场景,还能进一步设置高级参数、验证集、测试集等更丰富的功能。

第四是模型评测

生成式大模型目前还很难形成一个业界公认的benchmark,应用场景、数据等因素都会影响它的表现。但对于行业用户来说,明晰不同大模型的优劣势是购买服务前至关重要的一步。

所以火山方舟同步推出了评测工具,支持用户基于自身数据、系统化地感知模型表现情况,并且给出详细的测评报告,为后续做决策提供数据基础。

要知道,B端的使用场景也是“千人千面”的,企业要用自己的评测数据试一试,才能给出符合自身要求的准确评估。此外,基础模型的升级,新技术新模型的涌现,还将持续很长一段时间。企业需要不断测试对比、紧跟发展。

第五是运营干预

通过提供运营干预工具,用户可以快速设置相关规则,这样在模型已经投入使用后,无需精调模型即可干预模型输出结果。

第六是应用插件

目前大模型接入插件功能是大势所趋,能进一步发挥模型能力。未来在火山方舟上,能看到实时信息获取(通常说的“联网”)*、私域文档问答召回、Prompt补全与构建等。

透过以上重点功能,不难看出火山引擎对于当下云计算趋势的理解——尽可能加速大模型应用落地

而且在具体实现路径上,火山引擎还给出了一种别样的打法,并且形成了鲜明的自身特点。

火山引擎智能算法负责人吴迪给出了三个关键词来总结:

开放、加速、信任。

所以火山方舟有何不同?

开放、加速、信任,三个关键词一一对应,其实代表火山方舟的自身定位、算力和安全。

首先来看自身定位上,火山方舟是个开放、中立的平台,企业客户可以根据实际效果自由选择模型

对于云厂商而言,想要做好MaaS服务,核心之一肯定是模型层要够丰富、够强大。因为这意味着能在更丰富的应用场景中落地。

此前不少人将这一问题的解决,局限在了云厂商自家大模型能力提升上。

随着亚马逊云推出大模型平台Bedrock,一次接入Stability AI、Anthropic等多家大模型能力,给行业内开启了一种新范式。

这样一来,平台能直接引入业内最优秀的大模型,丰富自身能力和应用场景。

火山方舟的路径亦是如此,纳入更多大模型也让它具备更高的灵活性。

吴迪介绍,这样一来用户能够根据不同任务需求“货比三家”,接触到更多行业先进大模型。

通过提供统一的workflow,火山方舟能够实现模型之间的灵活插拔。在多模型切换下,工作流基本不改变,让各个模型完成自己擅长的任务,加速大模型的开发构建应用。

其次,火山引擎重点关注了大模型玩家们焦虑的算力问题。主打一个够用、实惠且稳定。

火山引擎的海量资源池,能够满足当下大模型训练推理的需求。

而通过加速训练和推理,能让算力的性价比更高。

NVIDIA开发与技术部亚太区总经理李曦鹏表示,如果想要硬件充分发挥性能,需要软硬件协同设计

硬件方面,NVIDIA针对生成式AI的不同硬件配置与火山引擎底层平台深度结合。

在软件层面也提出了多种优化方法,双方一起做了很多开源发布,以图像预处理算子库CV-CUDA为例。它们能高效地运行在GPU上,算子速度达到OpenCV(运行在CPU)的百倍左右。如果用CV-CUDA作为后端替换OpenCV和TorchVision,整个推理的吞吐量能提升至原来的二十多倍,算子输入结果上CV-CUDA与OpenCV完全对齐。

此外,火山引擎还推出了Lego算子优化

这一框架可以根据模型子图的结构,采用火山引擎自研高性能算子,实现更高的加速比。

在推理场景下,使用Lego算子优化,可以将基于Stable Diffusion模型的端到端推理速度提升至66.14 it/s,是PyTorch推理速度的3.47倍,运行时GPU显存占用量降低60%。在训练场景下,在128张A100上跑15天,模型即可训练完成,比当时最好的开源版本快40%。

而在稳定性方面,火山引擎也和英伟达做了更底层的合作。

李曦鹏介绍,目前大模型训练往往需要几千、上万张卡同时启动,如果其中某台机器出现故障,则会导致整个训练过程被影响。因此训练过程中的稳定性非常关键,它将直接影响开发效率。

在这方面,火山引擎和英伟达基于内部大量测试,最终实现了特定模型的规模、网络结构等,确定合适的checkpointing频率,在保障训练连续性的同时又让机器能够稳定运行。

具体能力也已有实际案例验证

大模型玩家MiniMax基于火山引擎,研发了超大规模的大模型训练平台,高效支撑着三个模态大模型每天数千卡以上的常态化稳定训练。在并行训练上实现了99.9%以上的可用性。除了训练以外,MiniMax也同步自研了超大规模的推理平台,目前拥有近万卡级别的GPU算力池,稳定支撑着每天上亿次的大模型推理调用。MiniMax和火山引擎一起为大模型训练搭建了高性能计算集群,一起致力于提升大模型训练的稳定性,保证了超千卡训练的任务稳定运行数周以上。

稳健的大模型基础设施让MiniMax从零开始自主完整地跑通了大模型与用户交互的迭代闭环,实现从月至周级别的大模型迭代速度,和指数级的用户交互增长。MiniMax面向企业级的大模型解决方案目前已接入数百家企业客户,打通办公协作、智能硬件、教育、医疗、客服等十余个行业场景。

然后是能力输出上,火山引擎提出训推一体以及统一workflow

统一workflow的能力不仅在于模型的灵活插拔,它还集成了火山引擎对大模型能力的理解。

比如如何做自动评估?pipeline怎么定?该做多少精调?这些问题都是需要经过大量开发工作后,才能输出的经验。通过这些细节上的保驾护航,企业用户落地大模型的效率和成功率都会有明显提升。

另一边,火山方舟也重点提出了训推一体的理念。

吴迪表示,基于对行业的观察,他相信未来大模型领域的头部及腰部厂商都会使用“1+n模式”,也就是自研或深度合作一个主力大模型、同时调用多个外部模型,对训练和推理都有需求。

加之火山引擎始终认为深度学习、机器学习是一件统一、紧凑且纯粹的事情,所以他们判断训推一体模式会是发展趋势,并已在火山方舟上推出。

而且训推一体化后,同样能为企业节省算力。

最后再来看安全方面,这也是火山方舟着重强调的部分

吴迪表示,在大模型时代,信任问题至关重要。

大模型提供方不希望自己辛苦训练出的模型被人拷贝走,这属于重要知识产权;下游客户不希望自己的数据在推理和精调过程中不被泄露,敏感数据只有自己可见。

在这二者之间,便会形成一个信任的gap。尤其是当下大模型服务中的合作方众多,构筑信任墙就显得至关重要。而火山引擎作为云平台,会通过互信计算框架,基于不同客户的安全和隐私保护诉求,提供了包括安全沙箱、可信硬件以及联邦学习方案,来保证大家在互信的基础上推理、精调等。

以上三个方面,将火山引擎在云市场中的差异勾勒清晰。

从中也可看出,火山引擎的技术积累、行业经验和趋势理解,都为它入局大模型平台提供了坚实的保障。

那么,为什么火山引擎的答卷是火山方舟?

为什么是火山方舟?

直接原因来自于市场需求

大模型趋势轰轰烈烈演进几个月,几乎触及到了各行各业,相应的需求也随之暴涨。

但对于行业用户来说,怎么触及市面上最先进的模型?怎么选择最适合自己的模型?怎么确定最后的大模型服务方案?这些问题对企业自身的技术理解程度、开发水平都提出了要求。

作为供给侧,大模型玩家也急于在热潮下快速推进自家业务发展。这不仅是一场技术竞赛,同时也是一场商业竞速赛,谁能更快触及更多用户,就会在市场中更快站住脚跟。在这种情况下,平台的触达能力一定大于厂商自身。

以及底层硬件厂商,同样也迫切需要大模型底座

NVIDIA开发与技术部亚太区总经理李曦鹏表示,英伟达开发每一款新产品,都是以workload来驱动,所有开发都是要解决真实存在的问题。

比如随着深度学习的兴起,用Tensor Core加速矩阵乘法计算,就是在原有框架下针对workload的重点模块做效率提升。

再比如英伟达去年发布的Hopper架构,设计远早于发布时间。当时GPT-3才刚刚问世,大模型趋势远没有到来,英伟达是做了大量前瞻性的研究。而怎么做出这种前瞻性的探索,就是要从实际应用的基础结构中去发现问题。

回到当下来看,对于未来AI的趋势是否朝着GPT趋势发展,李曦鹏表示现在也无法确定,但是行业中的实际需求能够推动英伟达做出更有针对性的硬件和软件特性升级。

怎么更快、更准确把握住这些需求?还是要依托平台连接大模型玩家

所以,像火山方舟这样承载着大模型供给方、使用方以及底层硬件厂商的平台,是行业迫切需求的。

而更深层的原因,还来自火山引擎自身

吴迪很确定地说,火山方舟的使命,是加速大模型、大算力应用落地。

为什么要加速?两条增长曲线可以给出答案。

在以时间为横轴、GPU需求量为纵轴的坐标系里,首先出现当下的第一条增长曲线:模型训练曲线

现在新兴的大模型正如雨后春笋般冒出,训练需求量飙升。但随着通用大模型市场趋于饱和,这条增长曲线也会逐渐放缓。

与此同时,还有一条增长曲线出现:推理需求曲线(模型应用曲线)

而且它将在短期内呈指数增长趋势,在2025年左右和训练需求曲线相交,并在之后反超。

也就是说,市场上的推理需求量,最终一定会大于训练需求量。因为推理需求多大,代表了应用场景有多丰富。

如果应用场景的丰富度不够高,导致推理需求曲线没有快速升起,训练需求曲线同样也会受到影响滑落

一旦出现这一局面,将意味着目前诸多投身大模型浪潮的创业者和企业,将会面临非常艰难的局面。

吴迪表示,火山引擎深信大模型趋势不是一次简单的浪潮,它将是新技术时代的一扇窗。如果想要加速这个时代更快到来,那么就要尽可能缩短推理需求超过训练需求的时间轴。

也就是加速大模型的应用落地。

火山方舟同时连接下游应用层和上游模型层、硬件层,加速企业用户使用大模型,在营收上更快去回报大模型领域创业者,以此形成一个加速正向循环。

而这也是为什么火山引擎要将自家大模型平台取名为“方舟”。

吴迪说,在想名字的时候,他们希望能有一个词来形容开放包容、生机勃勃、充满希望的意境。

最终在几十个词中确定了方舟。因为它能代表两方面寓意。

第一,承载着很多人的事业和梦想,共同驶向一个成功的远方,而且是一个具象的词;

第二,火山引擎相信整个大模型、大算力领域,需要众多合作伙伴在模型训练、内容安全、硬件优化等方面共同努力;

如今,方舟带着火山引擎的技术积累、行业理解以及美好愿景,正式启航。

未来大模型浪潮将会如何翻涌,还是未知数。

但载着众多国产大模型玩家、携手英伟达的火山方舟,一定会带着火山引擎驶向新的节点。

来源: 量子位

周鸿祎:企业不要觉得有了GPT就能瞎裁员了

6月29日消息,360创始人周鸿祎在一场演讲中谈到,“我一直在很努力的说服很多企业家,不要觉得有了 GPT 就能瞎裁员了。”

周鸿祎称,自己的观点和微软类似,信息化、数字化增大了我们大家的工作量。自从有了电脑化、即时通信工具后,大家每天有无数的消息要回,工作量加大了,有大量的文案工作。大模型企业落地要普惠,让每个人都用起来,成为员工的知识助手、办公助手,领导的决策助手。

“大模型不是万能的,只能打辅助,做一部分工作。所以大模型不会淘汰人,当然程序员也不会被淘汰,要有信心。我最近不也是又报名上了清华,电子信息专业,重新去学习做一个工程师。”周鸿祎在微博上也发文强调:“人工智能的发展还是要以人为本。”

“比GPT-4强”!谷歌DeepMind自曝正开发新型AI模型

不久前强强合并而成的人工智能巨头Google DeepMind终于向ChatGPT发出实质性挑战。在上个月的谷歌(Google) I/O开发者大会上,谷歌公司首次透露了其正在开发的大型语言模型Gemini。

据《连线》6月26日报道,DeepMind联合创始人兼Google DeepMind首席执行官德米斯·哈萨比斯(Demis Hassabis)最近在采访中进一步透露了Gemini的细节:该系统将AlphaGo背后的技术与大语言模型相结合,目标是让系统具有新的能力,如规划或解决问题,比OpenAI的GPT-4能力更强。

2016年,DeepMind开发的AlphaGo曾击败围棋高手创造历史。“你可以认为Gemini结合了AlphaGo系统的一些优势和大模型的惊人语言能力。”哈萨比斯说,“我们也有一些新的创新,这些创新将非常有趣。

可能会尝试新想法AlphaGo是基于DeepMind开创的一种叫做强化学习的技术,在这种技术中,软件通过反复尝试并接受关于其表现的反馈,学会选择采取何种行动以处理棘手的问题,比如围棋或视频游戏。它还使用了一种叫做树状搜索(tree search)的方法来探索和记忆棋盘上的可能动作。语言模型的下一个大飞跃,可能涉及让这种技术在互联网和计算机上执行更多任务。哈萨比斯说,Gemini仍在开发中,这个过程将需要数月时间,可能花费数千或数亿美元。

OpenAI首席执行官山姆·奥特曼(Sam Altman)曾在4月透露,创建GPT-4的成本超过1亿美元。训练像GPT-4这样的大型语言模型,需要将来自书籍、网页和其他来源的大量文本输入被称为Transformer(谷歌开发的一种深度学习模型,OpenAI在此基础上开发了GPT)的机器学习软件。

它利用训练数据中的规律,熟练地预测一段文本后面的字母和单词,这种简单的机制在回答问题和生成文本或代码方面被证明是非常强大的。要开发ChatGPT和类似能力的语言模型,需要一个重要的额外步骤:使用基于人类反馈的强化学习来完善其性能。

DeepMind在强化学习方面的深厚经验可以让其研究人员赋予Gemini新的能力。哈萨比斯和他的团队也可能尝试用人工智能其他领域的想法来加强大型语言模型技术。DeepMind的研究人员涵盖了从机器人到神经科学等各个领域,本周,该公司展示了一种算法,能够学习用各种不同的机器人手臂执行操纵任务。

谷歌DeepMind的研究人员最近将人工智能与一款名为RoboCat的机器人结合起来,预计将在自我训练机器人方面实现一大跃进。人们普遍认为,像人类和动物那样从世界的物理经验中学习,对于使人工智能更有能力非常重要。一些人工智能专家认为,语言模型通过文本间接地学习世界,是一个主要的限制。谷歌高层十分重视GeminiGemini是DeepMind迄今为止在该领域最有野心的项目。

国外科技网站The Information在3月报道称,受谷歌聊天机器人项目巴德(Bard)失败的刺激,为了跟上ChatGPT的步伐,谷歌高层直接参与Gemini的研发,包括该公司最高级的人工智能研究主管杰夫·迪恩(Jeff Dean)。

Gemini的开发完成,可能会让谷歌在与ChatGPT等生成式人工智能技术的竞争中占据优势。尽管谷歌开创了许多技术,并催生了最近的人工智能创新,但它选择了谨慎地开发和部署产品。

而到了4月,为了应对越来越激烈的竞争,谷歌将其“谷歌大脑”实验室与哈萨比斯领导的DeepMind合并为Google DeepMind。哈萨比斯说,新团队将结合两个强大的人工智能团队。“如果你看看我们在人工智能领域的地位,我会说80%或90%的创新来自这两者之一。”哈萨比斯说。“过去十年里,这两个组织都取得了一些杰出的成就。”哈萨比斯自己曾引发过一场人工智能狂热。

2014年,DeepMind被谷歌收购。在接下来的几年里,DeepMind展示了AI如何做到曾经看起来只有人类才能做到的事情。当AlphaGo在2016年击败围棋冠军李世石时,许多人工智能专家都惊呆了,因为他们曾认为,机器要想熟练掌握如此复杂的游戏,还需要几十年。

值得注意的是,Gemini并不是DeepMind进入语言模型领域的第一次尝试。去年,该公司推出了聊天机器人Sparrow,声称它比其他语言模型更不可能给出“不安全”或“不恰当”的答案。

哈萨比斯今年1月在接受《时代》采访时说,DeepMind将考虑在今年某个时候发布Sparrow的私人测试版,目前还不清楚这些计划是否仍在进行中。

来源:澎湃科技

弥补全球认知鸿沟 微软开始提供生成式AI职业培训项目

当地时间周三,全球AI大厂微软宣布,正式启动一个培训全球人民如何使用生成式AI的项目。

据微软负责慈善事业的副总裁Kate Behncken透露,这个项目将包括面向机构、非营利组织的全球挑战补助,以及免费且附带认证证书的在线课程,和面向教师的培训工具包和挑战项目。

接下来根据官方公告,简单解释一下这几个项目分别是干什么的。

首先,微软慈善基金会与data.org、微软“AI向善”实验室和GitHub合作推出一个生成式AI挑战补助项目。这是一项开放式资助项目,旨在探索、开发和推动非营利组织、社会企业、研究机构如何培训和授权员工使用生成式人工智能。

微软并没有透露补助的金额为多少,仅表示除了钱以外,这些机构还将获得Azure云计算资源,以及微软、GitHub的专家在数据训练等技术方面的指导。申请这个项目的时间截至今年8月15日,随后微软将在今年秋天公布名单。

而对于广大“打工人”而言,微软也提供了在线学习课程,完成学习和考试后能够获得在线“职业认证证书”。微软强调,这是在线学习市场上第一个生成式AI职业证书。

不过从课程表的构成来看,微软的这个课程更偏向于入门,包括“什么是AI”、“什么是生成式AI”、“如何将Bing融合进工作流”、“AI与道德”等项目。

微软表示,目前首发上线的只有英语课程,在接下来几个月里将提供西班牙语、葡萄牙语、法语、德语、简体中文和日语课程。

同时,微软也向全球的教育者提供了教学工具包,提供一系列的流媒体和课程资源,来帮助他们进行AI课程的备课。稍有不足的是,虽然AIGC的特点是流利且富有逻辑的机器人对话,但微软提供的课程中仍以传统的视频要素来呈现。

最后,微软也在Microsoft Learn平台上发起了一项AI技能挑战认证,活动将在7月中旬开始,涉及机器学习、构建MLOps解决方案、认知服务等,活动周期为一个月。

来源:财联社(编辑 史正丞)