危言耸听?离AI取代程序员又进一步?Meta 首推 Code Llama 70B:强大的代码生成 AI 模型

在科技的浪潮中,人工智能(AI)的发展一直是引领变革的前锋。从自动化办公到智能家居,再到自动驾驶汽车,AI的应用领域日益广泛。而在软件开发领域,AI的脚步同样迅猛,尤其是在代码自动生成技术方面。近日,Meta首次推出的Code Llama 70B,作为一款强大的代码生成AI模型,再次引发了业界对于“AI是否将取代程序员”这一话题的热烈讨论。 

AI编程助手的崛起

在过去几年里,随着StarCoder、GPT-4 和 CodeGen-16B-Mono等代码基础模型的出现,AI在编程辅助方面的能力得到了显著提升。例如,StarCoder作为一种大型代码语言模型,在众多编程基准测试中表现优异,其处理输入的能力超越了现有的所有开放式法学硕士模型。这意味着StarCoder能够理解和生成的代码量和复杂度远超过以往任何工具,为广泛的应用场景提供了可能。

而GPT-4,作为OpenAI开发的多模态大语言模型,不仅能够理解和交流多种语言和方言,还已经被应用于支持GitHub Copilot的“Copilot X”,展现了其在代码生成和自然语言处理方面的强大能力。CodeGen系列则是基于自然语言和编程语言数据训练的大型语言模型,专门用于程序综合。它们在The Pile、BigQuery 和 BigPython等数据集上的训练,进一步提升了模型在理解和生成代码方面的能力。

 Code Llama 70B:新一代代码生成AI模型

在这样的背景下,Meta推出的Code Llama 70B无疑是一颗重磅炸弹。作为一款功能强大的代码生成AI模型,Code Llama 70B不仅继承了前述模型的优点,更在多个维度上进行了创新和优化。最为突出的改进,是其在企业私有环境中的部署能力,这意味着企业可以在确保知识产权保护的同时,利用Code Llama 70B提高软件开发的效率和质量。这一特性对于希望保持技术秘密和竞争优势的企业来说尤为重要。通过在私有环境中部署Code Llama 70B,企业不仅能够保障自身数据的安全,还能够根据自身需求定制模型,从而在软件开发过程中实现更高的效率和创新。

离AI取代程序员还有多远?

随着Code Llama 70B等AI模型的出现,人们不禁要问,AI是否真的有一天会取代程序员?就目前来看,AI编程助手正变得越来越智能,能够处理越来越复杂的编程任务,但它们仍然需要人类程序员的指导和监督。AI可以帮助程序员提高生产效率,减少重复性工作,甚至在某些情况下提供创新的编程思路,但它们暂时还无法完全理解和创造人类程序员所能提供的复杂逻辑和创意。此外,编程不仅仅是代码的编写,更涉及到需求分析、设计思考、团队协作等多个方面。这些领域内的技能和经验,是目前AI所难以完全掌握的。因此,尽管AI编程助手的能力在不断提升,但它们更多的是作为程序员的“助手”而非“替代者”。

结语

总而言之,Meta推出的Code Llama 70B标志着AI在代码生成领域的又一重大进步。它不仅提高了软件开发的效率,还为企业提供了更大的灵活性和安全性。尽管AI编程助手的能力在不断增强,但至少在可预见的未来,它们更多的是增强和辅助程序员的工具,而非取代者。在这一领域,人类的创造力和逻辑思维仍然是不可或缺的。随着技术的不断进步,我们期待AI和人类程序员之间能够形成更加紧密和高效的合作模式,共同推动软件开发和技术创新的未来。

马斯克:若想参与AI竞赛,每年至少都得花上数十亿美元

近期,特斯拉CEO马斯克在社交平台表示,价值5亿美元的「Dojo超级计算机」虽是一大笔金额,但只相当于内建100,000颗英伟达H100的系统。 

马斯克透露,特斯拉今年采购的英伟达硬件将比这个数字还多,现在若想参与AI竞赛,每年至少都得花上数十亿美元。

同时,马斯克也表示,特斯拉也计划购买更多AMD芯片,但没提到哪一款,外界猜测可能是InstinctMI300系列,很可能是MI300X。

业界指出,目前 AMD 已成功缩小在性能、供应上的差距,因此英伟达不一定能寡占市场。AI市场在2024年不断增长,而AMD和Nvidia等供应商受益最大。

针对AI,“美方希望切断中国获取主要途径”,外交部回应

在1月29日中国外交部例行记者会上,有记者提问称,彭博社报道称,美国希望云计算公司披露在其平台上开发人工智能应用程序的外国客户信息。这意味着华盛顿可以利用这些要求来切断中国人获取人工智能培训和托管关键服务的主要途径。请问外交部对此有何评论?

中国外交部发言人汪文斌说,人工智能发展治理攸关全人类的命运,需要的是群策群力协调应对,而不是“脱钩断链”、“围栏筑墙”。我们敦促美方不要违背科技发展的客观规律,切实尊重市场经济和公平竞争原则,为加强人工智能领域的国际协调合作创造良好条件。

上海AI实验室开源发布科学大模型“浦科化学”

1月26日,上海人工智能实验室(上海AI实验室)开源发布首个科学大模型浦科化学(ChemLLM),拓展了大模型助力科学研究的探索路径。

基于书生·浦语2.0强大的基座模型能力,浦科化学通过注入海量化学专业数据,使大模型获得了理解和处理化学相关专业任务的知识与能力。同时,研究人员发现,随着化学能力的获得,大模型的数理学科及推理能力也得到增强。

浦科化学现已开源,并提供免费商用。

开源链接:https://huggingface.co/AI4Chem/ChemLLM-7B-Chat

专注核心:化学知识注入,专业能力突出

为了评估浦科化学的专业能力,上海AI实验室的研究人员对其在三种相关任务上的表现进行了测试:分子名称转换、分子性质预测和反应产物预测——这些任务分别涉及化学物质的表示、性质和转化,是化学研究的基础和核心。
分子名称转换方面,要求模型能够在不同分子表示方式之间进行准确转换,如SMILES、IUPAC名称、分子式等;

分子性质预测方面,要求模型能根据分子的结构和组成,预测其化学性质,如沸点、密度、溶解度等;反应产物预测方面,要求模型能根据给定的反应物和反应条件预测反应产物的结构。

测试结果显示,浦科化学在这三项任务上均表现出色,分别获得22.0、49.0和7.0的分数,远超过其他同规模模型的水平,并超越了GPT-3.5,证明浦科化学在理解和处理化学知识方面具备强大能力。

依托书生·浦语2.0基座模型优秀的多语言能力,浦科化学在经过专业化学知识训练后,还具备了优秀的化学专业中英文翻译能力,可帮助化学研究者跨越语言障碍,准确地翻译化学文献中的专有名词,获取更多的化学知识。

下图展示了浦科化学翻译的一篇2024年1月16日发表在《自然·化学》杂志上论文的摘要。

在专业化学知识训练之外,浦科化学也进行了初高中知识的学习。在回答初高中化学题目时,不仅能给出答案,还能给出具体的解释,下图展示了例子:

齐头并进:逻辑推理增强,泛理科能力涌现专项能力的增强,是否以牺牲其他能力为代价?实践证明,浦科化学不仅在化学领域表现出色,其在数学、物理及推理等方面能力均得到增强。

研究人员使用MMLU(大规模多任务语言理解数据集)作为测试集来评估浦科化学在通用场景下的性能,对语言模型的多项任务能力进行测试评估,并将浦科化学与其他同等规模的模型进行比较,以评估化学训练数据对基础模型的影响。

评测结果显示,浦科化学在大学化学任务上得分为47.0,超越了所有其他模型,这体现了它在回答化学问题及处理复杂化学任务的能力。研究人员发现,尽管没有对浦科化学进行数学和物理学科的训练,模型在大学数学、大学物理、STEM(科学、技术、工程和数学)类等相关领域上也获得了最佳成绩。

同时,浦科化学在形式逻辑任务上也达到了最高水平。上述结果表明,当对大模型进行进行化学专业训练时,其数理及推理能力也能得到增强。

有趣的是,浦科化学在道德场景、人文科学类、社会科学类等分项任务上也展现了优异的平均性能,这说明,对大模型进行专业某个学科的知识训练,不仅不会让大模型“分心”,反而有助于其道德水平及一般任务水平的提升。

举一反三:扩展大模型应用,助推科研新范式

对大语言模型进行化学专项训练,不仅扩展了大模型的应用空间,更为AI for Science相关研究开启了新的探索路径。上海AI for Science团队面向化学、物理、生命、地球等科学领域,通过深入研究各学科基础理论,结合最新人工智能理论,探索AI驱动重大科学问题的研究范式,加速人工智能在化学、药物研发、新材料、气象等领域的渗透与落地,赋能各行业发展。

其中,AI for Chemistry方面的研究以语言模型为核心,通过大模型连接智能化实验设备,全方位提升实验效率,从而实现化学研究的自动化和智能化。相关研究范式的创新,将助推科学发现速度,实现更大的社会效益。

未来,基于浦科化学模型,人工智能可为化学研究提供智能化辅助,如化学合成路径规划、化学反应条件优化、实验结果自动化分析等,从而提升化学研究的效率和质量。

周鸿祎与百度再上演“AI搜索大战”,360上线AI搜索App

近日,360集团迎来了一项重大的升级——全新的大模型搜索产品“360 AI搜索”正式登陆多个安卓应用商店,版本为1.0.0。被冠以“新一代答案引擎”的名号,这一升级旨在为用户提供更为相关和全面的搜索答案。从问题输入到答案生成,360 AI搜索经历了一系列复杂的处理流程,包括问题分析、网页检索、重新匹配排序等,最终旨在呈现给用户逻辑清晰、有理有据、追根溯源的答案。

这一消息的发布引起了业界的广泛关注,360 AI搜索的推出不仅是对搜索引擎市场的一次冲击,更是在人工智能时代,360与其他巨头重新上演“搜索大战”的序幕。这一战役与之前的搜索引擎大战不同之处在于,巨头们都纷纷加入“AI搜索”的竞争,为领先技术和市场份额展开激烈角逐。

360 AI搜索被赋予“新一代答案引擎”的称号,其独特之处在于其复杂的处理流程,远不止于简单的问题回答。当用户在360 AI搜索中输入问题时,背后的引擎会迅速展开问题分析,通过网页检索收集信息,重新匹配排序,并最终提炼出用户需要的答案。这一系列流程的精密性旨在确保用户获取到的答案不仅相关性强,而且信息全面。

360公司创始人周鸿祎此前明确了公司的AI发展战略——“两翼齐飞”。这意味着360将继续全力自研生成式大语言模型技术,打造自己的技术引擎。同时,360还将占据场景,积极推出相关产品服务。这一战略的一部分就是360 AI搜索的上线,将AI技术融入搜索引擎,以提供更为智能和便捷的搜索体验。

在AI时代,搜索引擎的角逐愈发激烈。微软在2023年推出基于大模型的AI搜索产品New Bing,被认为对Google的搜索引擎市场形成冲击。与此同时,百度也在搜索页面内置“文心一言”大模型技术,实现Chat AI对话功能,加深了人工智能与搜索引擎的结合。

360 AI搜索的上线引发了对其性能的高度关注。根据了解,360 AI搜索上线首周,“360智脑”获得300万用户超过5000万次互动,多项指标甚至超越了GPT-3.5。这显示了360在大模型领域的实力和竞争力。

360 AI搜索的iOS版本于1月26日短暂上架苹果App Store,但不到22个小时后下架,原因尚不清楚。这一短暂的上线引发了关于iOS版本的关注和猜测,也表明了市场对360 AI搜索的期待。

AI时代的搜索大战愈演愈烈,360 AI搜索上线正与其他巨头形成激烈竞争。微软的New Bing、百度的“文心一言”以及其他大模型的介入,预示着搜索引擎市场将经历一场全新的洗牌。360 AI搜索的推出,无疑将与这场竞争紧密相连,作为AI技术与搜索引擎融合的代表,其性能表现将是产业关注的焦点。

回顾360公司的发展战略,周鸿祎明确指出360将“两翼齐飞”,致力于自研生成式大语言模型技术,并推出相关产品服务。360 AI搜索的上线正是这一战略的一部分,将AI技术与搜索引擎无缝结合,旨在为用户提供更加智能、定制化的搜索体验。这一举措不仅考验了技术实力,也意味着360在AI领域的战略布局。

360 AI搜索的上线首周表现出色,产品“360智脑”获得了惊人的用户互动量,多项指标甚至超过了国际知名的GPT-3.5。这无疑是对360在大模型领域不懈努力的回报,也彰显了中国企业在人工智能领域的竞争力。这一强劲的表现使得360 AI搜索更具备了在市场中竞争的资本。

然而,360 AI搜索的iOS版本上线短暂并随后下架,引发了一系列关于原因的猜测。这也引起了市场对于iOS版本的期待和关注。这一举动的背后可能涉及到多方面的考量,如技术适配、市场策略等,需要进一步的解读。

 360 AI搜索的正式上线标志着AI时代的搜索大战再度拉开帷幕。百度、微软等巨头加入“AI搜索”领域,为搜索引擎市场带来了更多的可能性与挑战。360 AI搜索作为这场战争的新兵,不仅承载了360公司AI发展战略的一环,也代表着中国企业在AI时代的勇敢探索。

七部门共推AI芯片发展,加快国产芯片替代,NVIDIA将失去中国市场

日前工信部、中国科学院等7部门联合印发《关于推动未来产业创新发展的实施意见》,其中包括了加快突破GPU芯片等内容,意味着中国将集中力量加速推进国产AI芯片发展,以国产芯片替代NVIDIA的芯片。

中国在AI芯片行业已打破空白,多家国产GPU/AI芯片企业表示他们的AI芯片性能已媲美NVIDIA的A100芯片,达到了较高的水平,国产AI芯片进一步发展需要国内诸多行业的合作,这次七部门联合发文将有助于加速国内诸多行业的协作。

AI芯片的研发涉及到EDA、芯片设计、芯片制造乃至内存芯片等行业,在EDA工具方面国内已涌现一大批EDA工具软件,有国产AI芯片表示已用国产EDA工具设计芯片并投入生产,国产EDA工具已可支持支14纳米工艺,与国内的芯片制造工艺同步。

芯片设计方面为中国AI芯片进展最快的部分,多家GPU芯片企业推出的GPU芯片已向市场推售,国产的AI芯片企业也已向企业大举交付AI芯片,这都证明了国产GPU/AI芯片设计方面已具有很高的水平。

芯片制造是当下国产芯片行业的最大瓶颈,此前手机芯片就说明了这个问题,不过随着某国内科技企业以国产芯片工艺量产接近7纳米性能的手机芯片,代表着国产芯片完全可以依靠现有的设备开发出接近7纳米性能的工艺,甚至浸润式光刻机之父林本坚表示中国芯片行业可依靠现有的芯片设备开发5纳米工艺。

另一个影响国产AI芯片替代进口芯片的最大因素则是生态方面,这也是NVIDIA赖以垄断AI芯片市场的关键,由于国内AI软件/大模型大多基于NVIDIA的CUDA平台搭建,由此让NVIDIA的CUDA平台垄断了AI软件行业,这是NVIDIA即使连连阉割AI芯片性能却依然得到国内企业采用的原因。

由于国内企业考虑到同业竞争的关系,他们在采用国产AI芯片的时候颇有顾虑,再加上CUDA平台的考虑,这都对他们采用国产AI芯片有所考虑,然而如今在七部门联合推动下,将有望打消这些企业的顾虑,促使他们采用国产AI芯片。

国产AI芯片的发展和生态的建立都有赖于国内企业的采用,一旦在七部门联合推动下,国内企业大举采用国产AI芯片,国产AI芯片的产业链和技术水平都将得到快速完善,加快国产AI芯片的替代。

这对NVIDIA将影响深远,因为国产AI芯片的生态一旦建立,技术水平进一步缩短与NVIDIA的差距,那么NVIDIA将彻底失去中国市场,还有中国芯片向来拥有高性价比优势,目前在成熟工艺芯片方面就已显示出强大的竞争力,不仅中国企业在大举采用国产成熟芯片,国产的成熟工艺芯片还获得海外企业的认可,乃至美国家电制造商都在采用,未来国产AI芯片有望走向国际市场抢夺NVIDIA的市场。

NVIDIA依靠垄断优势在AI芯片市场赚得盆满钵满,而中国则是全球最大的芯片市场,如果中国芯片打破NVIDIA的垄断,势必将对NVIDIA产生巨大影响。

事实上不仅中国芯片在努力打破NVIDIA的垄断,美国的Intel、AMD等都在积极打破NVIDIA的垄断,美国的做法或许将导致NVIDIA的辉煌就此戛然而止,而中国芯片必将拼出一条自己的路。

通知公告丨中国人工智能学会关于表彰2023年度优秀专业委员会的决定

根据《中国人工智能学会专业委员会管理办法》及《中国人工智能学会专业委员会工作考核评价办法》的有关规定,学会组织工作委员会于2024年1月26日以线上会议形式召开2023年度专业委员会考核评审会。经学会组织工作委员会审议,确定以下10个专业委员会被评定为“2023年度中国人工智能学会优秀专业委员会”:

● 机器学习专业委员会

● 粒计算与知识发现专业委员会

● 智能服务专业委员会

● 智能机器人专业委员会

● 人工智能基础专业委员会

● 智能驾驶专业委员会

● 知识工程与分布智能专业委员会

● 社会计算与社会智能专业委员会

● 机器博弈专业委员会

● 智慧医疗专业委员会

特此表彰,以资鼓励。

中国人工智能学会

2024年01月30日

美国将限制中国,使用Azure、AWS等云,训练AI大模型

1月29日,美国商务部在Federal Register(联邦公报)正式公布了,《采取额外措施应对与重大恶意网络行为相关的国家紧急状态》提案。

该提案明确要求美国IaaS(云服务)厂商在提供云服务时,要验证外国用户身份,限制外国行为者对美国IaaS产品的访问,并要求详细报告训练AI大模型的外国交易,以保护美国的网络安全和利益。

美国商务部长Raimondo在接受路透社采访时说:“我们不能让非国家行为者、中国或者美国不希望那些使用我们云服务人,来训练他们的AI大模型。”

该提案将对微软的Azure、亚马逊的AWS、谷歌的Alphabet等美国云服务商产生重大影响。同时为国内的讯飞星火、文心一言等大模型带来商业契机。

该提案一共38页,「AIGC开放社区」为大家介绍D部分,基础云服务商,有验证客户身份的责任、特殊措施以及使用其产品进行AI大模型训练的详细主要内容。

目的和AI模型定义

1)要求美国 IaaS提供商实施相关计划,保存与外国人拥有权益的 IaaS 帐户相关的某些记录,并核实这些人的身份。

同时要求其外国分销商也这样做,以方便执法部门要求提供这些记录,并以其他方式执行第13984号行政命令和第 14110 号行政命令的规定。

2)AI大模型主要包含两大类:基础大模型,基于广泛数据训练的AI模型,一般采用自我监督包含至少数百亿参数;

生成式AI,能模拟输入数据的结构和特征,从而生成全新的内容,包括文本、图像、视频、音频和其他数字内容。

客户识别计划

1)一般情况下,每个美国 IaaS 提供商必须维护和实施符合要求的书面客户识别计划 (CIP)。

2)CIP范围,CIP必须适合 IaaS 提供商的规模、所提供 IaaS 产品的类型和相关风险(包括 IaaS 提供商提供的各种服务类型、开立账户的各种方法、可用识别信息的不同类型以及 IaaS 提供商的客户群所带来的风险)。

任何 IaaS 提供商如果只是美国 IaaS 产品的转售商,则可通过与初始美国 IaaS 提供商达成协议,参考、使用或采用初始美国 IaaS 提供商的 CIP 以满足限制要求。

3)身份验证,CIP 必须包括基于风险的程序,用于验证每个外国客户的身份,使美国 IaaS 提供商或美国 IaaS 产品的外国转售商,能够合理地相信自己知道每个客户的真实身份。

4)客户信息要求,CIP要求美国IaaS提供商和销售美国IaaS产品的外国转售商,必须通过适当程序核实潜在客户及其实际所有者是否为美国人。

如果确认客户和所有受益人都是美国人,那么这个规定就不适用于为这些美国客户开设的IaaS账户。如果非美国人,这些提供商和转售商需要进行合理的尽职调查,以验证那些客户的真实身份

5)CIP 必须包含开立账户的程序,具体说明将从每个潜在客户和账户受益所有人处获得的识别信息,以确定他们是否为美国人。这些程序必须为美国 IaaS 提供商或美国 IaaS 产品的外国转售商提供可靠的依据,以核实其客户和实际所有人的真实身份,并反映合理的尽职调查努力。

AI大模型训练审核报告

如果一个大模型符合《联邦公报》公布的解释性规则中规定的要求,则该模型应被视为具有可用于恶意网络活动潜在能力的,AI大模型。以下是需要进行审核的案例展示。

1)外国公司 A 提议在美国 IaaS 提供商 B 公司的计算基础设施上训练一个AI大模型,并与 B 公司签订了训练所提议模型的协议。

A 公司寻求训练的模型的技术规格符合大型AI模型的技术条件,该模型具有可用于恶意网络活动的潜在能力。则需要报告详细的训练过程。

2)A 公司(美国人)对 B 公司(外国人)进行股权投资,其中一部分投资以使用 A 公司计算基础设施的信用额度的形式进行。

A 公司有理由相信,B 公司打算使用这些信用额度来训练一个大型AI模型,该模型具有可用于恶意网络活动的潜在能力。

3)A 公司(美国人)同意为 B 公司(外国人)训练一个AI模型。一开始,商定的模型技术规格不符合双重用途基础模型或令人担忧的模型的技术条件。

然而,在培训开始后,培训程序的调整或对模型能力的新认识使A公司有理由相信,该模型实际上将具备大型AI模型的技术条件,其潜在能力可用于恶意网络活动。

4)A 公司(美国人)同意为 B 公司(外国人)在 C 公司拥有的设施内的计算基础设施上训练一个AI模型。并具备AI大模型的技术条件,有可能被用于恶意网络活动的潜在能力。

关于AI+,这些建议很有意思

当前,AI已然成为社会备受关注的热点,人们对于未来AI在各领域带来的影响,充满许多期待。

面对汹涌而来的大模型浪潮,以及随着5G、AI等技术向着产业的纵深方向推进,深圳如何利用AI赋能,更好地做好公共服务供给?又可以从哪些方面加快培育新质生产力,塑造高质量发展新优势?

1月28日,在政协第七届深圳市委员会第四次会议联组讨论会、分组讨论会上,来自经济界、工商联、科学技术界、教育界、医疗卫生界等各领域的市政协委员都不约而同提出了一系列关于“AI+”的提案,建议要在教育、医疗、出行、产业等方面充分利用AI技术,更好地赋能城市发展,改善民生,进一步增强市民群众的获得感和幸福感。

AI+产业

市政协委员邓文俊

建议深圳打造自己的AI算力赋能平台

新一轮通用人工智能大模型热潮迅速兴起,孕育催生一批战略性新兴产业和未来产业新模式、新业态。市政协委员邓文俊建议深圳打造自己的AI算力赋能平台,降低全行业使用AI大模型的门槛,让AI技术从“旧时王谢堂前燕”,到“飞入寻常百姓家”。

“我们在大模型开发中也走过不少弯路,但现有技术已经能够将训练成本降低60%、推理成本降低75%。建议依托大模型企业的实践经验,由政府牵头引导龙头企业和行业组织,联合打造AI算力赋能平台,降低训练和推理成本,提升大模型开发落地的便利度。”邓文俊表示。

市政协委员蒋希勇

建议搭建“深圳市算力共享平台”

作为中国的高科技产业中心之一,深圳拥有全国最高级别的AI“密度”,AI产业发展的基础是数据、算法和算力,然而,当前深圳依然面临着中小科技企业算力供给不足问题。

对此,市政协委员蒋希勇提出,相关政府部门可指导市属国有企业联合搭建“深圳市算力共享平台”,平台定位为深圳市的市级算力基础设施,不以营利为主要目的,侧重为中小科技企业提供相对低成本、可靠且易于访问的计算资源服务。在提供算力的同时,平台还可以提供算力技术支持和协作工具,以提高整个城市的算力资源利用效率。

市政协委员江水

呼吁大力发展机器人产业

当前,AI赋能产业发展已成为主流趋势。围绕人工智能发展这一社会关注热点话题,市政协委员江水带来了“要大力发展深圳市机器人产业”这一提案,指出要推动机器人在机场、地铁站、高铁站、医院等场景应用,推动产业转型升级。

江水在提案中指出,深圳作为创新之城,具备利用人工智能发展机器人产业的良好基础,然而,当前在发展机器人产业过程中仍面临一些问题,如市场分散、缺乏统一规划等问题。因此,建议通过采取一系列措施大力发展机器人产业,推动城市经济转型升级。

AI+民生

市政协委员黄鼎隆

培养适应AI时代的“超级教师”

作为一名长期在科技领域耕耘的市政协委员,黄鼎隆认为AI技术将不断融入教育场景。在今年“两会”上,他聚焦于探讨如何利用AI技术培养出适应AI时代的“超级教师”,为深圳教育的高质量发展注入新的活力。

在采访中,黄鼎隆回忆起自己在深圳学习的岁月,他说以前深圳的教育条件还十分有限,而如今却已达到全国领先水平。这其中,每一位教师都付出了巨大的努力和心血。而如今,面对AI技术浪潮的冲击,教师们又将如何乘风破浪,继续前行?

“人工智能的技术突破又给深圳教育带来了一个巨大机遇,我认为深圳的教师也需要与时俱进,借助这波人工智能技术革新浪潮,成为AI时代的‘超级教师’。”黄鼎隆提出了打造AI时代的“超级教师”这一概念。他说,政府部门、科创企业应该充分思考未来AI在教育场景的运用。

黄鼎隆认为,借助AI工具,教师可以实现课前、课中、课后的全方位个性化教学,“超级教师”并非遥不可及的概念,而是教育未来的必然趋势。

市政协委员袁静

打造“把养老院搬回家”新型养老模式

面对老龄人口规模持续增长,如何做到“老有颐养、健康养老”?在AI人工智能产业快速发展今天,“AI+养老”又会碰撞出怎样的火花?

市政协委员袁静表示,深圳预计2035年老年人口规模接近300万人。因此,要提前利用以AI为代表的科学技术,推进养老事业,建设“智慧居家养老社区”,率先在深圳打造“把养老院搬回家”的新型养老模式。

她建议,要利用深圳高科技条件,整合无线传感、物联网、人工智能、5G、远程会诊、健康医疗、芯片等技术,推进新一代信息技术和智能硬件在社区居家养老领域创新应用;同时,推进综合性智慧养老产业发展平台建设,加快新型基础设施建设,统筹推动城市养老服务设施和设备的智能化、适老化、家用化改造升级,加快研发面向家庭、社区和机构的智慧养老服务系统,建设“智慧居家养老示范社区”。同时,通过建设“智慧居家养老示范社区”,可以探索并建立行业规范和标准,推进养老事业高质量发展。

市政协委员陈宁

创新城市道路精细化治理模式

中国是世界上电动自行车保有量最多的国家,截至2022年已达到3.5亿辆。虽然电动自行车为市民出行提供了便利,但骑行不佩戴头盔等违规行为给骑行人和道路安全带来了巨大隐患。市政协委员陈宁关注电动自行车的安全管理,特别聚焦于创新“AI+电动自行车”应用,呼吁打造超大城市道路精细化治理典范。

“近四成交通事故与电动自行车相关,电动自行车治理面临着违规事件类型多、事故随机性强、态势掌握难等挑战,亟须创新治理方式。”陈宁说。

在他看来,AI具备泛化推理与逻辑能力,在电动自行车治理中能够发现事件、分析问题、构建数据网络,进而推动安全治理工作。

基于此,他认为首先要建立起智能感知网络,利用已建成的视频感知点位,精准识别实现全市电动自行车违规事件,提高发现问题的效率。其次,要利用AI打造智能化的电动自行车治理和分析平台,挖掘违规行为、规律。通过分析高频发生违规、事故的路口和时间段,精准调度和匹配治理资源,最大化实现安全管理效能。

Cubox 解读|AI 2.0 重磅回归

Cubox 解读(Cubox Insight)是 Cubox 专为阅读而生的全新 AI,基于多种大语言模型而构建。

这是一套能够自动总结摘要、解读关键问题、自动标注、问答和分析的强大 AI。在你收藏的内容或订阅的 Newsletter 到达收集箱时,Cubox 将自动处理并在你的阅读首页为你就绪,无需手工操作或等待。

我们为什么需要 AI 来辅助阅读?对不同类型的阅读者来说,AI 能够用于辅助阅读的目的也不大相同,相信在同时推送的另一篇文章中,你会找到自己的灵感。不过,仅仅是帮助高效地筛选值得阅读的文章、快速了解每日的行业动态,或是如同有真人一般与你深入讨论、沟通相关知识,AI 都能够为你的阅读带来全新的可能。

借助 Cubox 解读,你可以:

了解每日动态:尽情收藏内容到 Cubox,并在固定的时间打开,从自动解读的总结中,了解每日的动态和信息,并阅读自己真正感兴趣的文章。

阅读外语文章:尽情收藏英文、外文网站的第一手内容,通过中文的解读,了解文中主要观点,如果有兴趣继续阅读,通过 AI 问答翻译为中文,快速了解。

学习知识:通过解读直接了解文章中的关键观点,并通过问题的阅读和展开,快速验证自己对这些关键问题的理解,或获取关键的行业信息。

预览精彩文本:通过解读中的幻影高亮,阅读 AI 划线出的精彩文字,带着好奇,点击跳转到对应位置继续了解上下文的观点,或一键标记为自己的标注,写下笔记。

交互式深入阅读:在阅读某段文字产生更多好奇心时,求助 AI 解释相关内容,或者提供扩展的阅读资料;遇到有趣的内容,让 AI 写一段分享文案,快速分享给好友;阅读过程中,有一些想法但不知道如何组织,让 AI 帮助写一篇阅读笔记大纲,再去高亮笔记中笔记编辑,方便未来回顾。

处理已读内容:通过简单的卡片滑动,将解读标记为已读,此时对应的文章也将被标记为已读;遇到不希望继续阅读的,无价值的文章,在解读卡片中一键归档或删除。

全新浏览器扩展

Cubox 的浏览器扩展也已同步支持 AI 2.0 解读功能。当你在浏览器阅读任何内容时,通过悬浮的解读按钮可一键获取当前文章的总结与分析。每个页面的解读都将与页面一同被保存到 Cubox,方便你在 Cubox 中继续阅读、重看或回顾。

Cubox 解读的使命,是让阅读回归真正的本质:知识。为此,它不会用 AI 替代真正的好阅读,它会全力让 AI 灵活服务于不同的阅读方式,让每一位阅读者都能悄然进化,成为优质的学习者,最终提升对信息的筛选、利用和理解力。

无论是 Cubox 团队,还是所有阅读者,对未来阅读方式的探索一定会布满迷雾,尤其是当时代的信息过载遇到了 AI 时刻。我们不能只是作为理论家和旁观者,去等待权威经验的降临,我们应当投身其中,不断实践,用热情和行动找到通往阅读本质的路。

高盛预测七大趋势:AI仍是主旋律,美国制造业复兴

高盛策略师在报告中写到:“美国经济的前景看起来确实很明朗。”他们提到,美国国债收益率正在下降,美联储即将转向更宽松的货币政策,同时GDP增长速度也高于市场普遍预期。


展望2024年,高盛提出,以下七大主题可能影响市场。

1. 生成式人工智能

2023年毫无疑问是“人工智能年”,而高盛预计,人工智能主题将继续贯穿2024年股市话题。

高盛预计,人工智能技术和创新最终将提高各个产业生产率,并将美国2024年的GDP年增长率提高0.4%。

策略师们推荐亚马逊和英伟达等AI概念股,并表示:“对于那些能够提供计算能力和平台来支持人工智能计划的公司来说,人工智能可能会带来巨大的繁荣。”

2. 绿色能源支出

高盛策略师在报告中写道:“全球应对气候变化的必要性正变得越来越明显,随着各国政府鼓励一波新的发展浪潮,帮助从化石燃料向可再生能源过渡,企业正在应对正在出现的机遇。”

高盛指出,太阳能行业的公司、从垃圾中提取甲烷气体的公司以及核能公司可能会从这一趋势中受益。

3. 私人信贷

高盛表示,投资者今年将期望私人债务交易的回报可以超过公开市场,而资产管理公司提供的私人信贷零售产品在过去一年获得了吸引力。

策略师们指出,“保险公司正越来越多地将资金配置到私人市场,为这个市场创造了一个可靠而庞大的资金来源。”

4. “后疫情时代的回声”

随着全球已经逐步适应新冠疫情后几年的新常态,“后疫情”主题可能已经走到了最后阶段。

在经历了新冠疫情带来的多年异常之后,全球交通和旅游等多个行业仍在调整中。高盛策略师们表示,还有两个行业值得注意,即金融和科技——在2023年,金融行业摆脱了地区银行危机,而科技行业则在2021年经历了后疫情时期的泡沫破灭。

“进入2024年,基调似乎确实在改变,”高盛策略师们表示,企业的招聘似乎正在加速,尤其是在软件公司。而这一迹象之后往往伴随着行业增长加速。

5. 减肥药

“减肥药”概念在2023年异军突起,一度引发市场炒作热潮。而高盛认为,2024年,对于减肥药的狂热炒作还将继续。

2023年,由于其减肥药大受欢迎,礼来公司的股价累计上涨了近60%,使其成为标普500指数中市值第九大的公司,并被誉为2023年的主要赢家之一。

高盛表示,2024年,礼来竞争对手将推出类似的药物,以解决肥胖以外的一系列问题,从而继续带动减肥药概念的炒作。策略师们预计,对GLP-1药物的需求仍将是一个值得关注的关键趋势。

6. 美国制造业复兴

高盛表示,气候变化、后疫情时期的连锁反应和去全球化趋势,都将有助于美国制造业的复兴

高盛估计,到2030年,美国半导体、电动汽车和充电站领域的产业趋势可能会推动高达6000亿美元的增量资本支出。

7. 互联网步入更成熟的增长阶段

高盛表示,与10年前相比,互联网公司的增长正在走向成熟阶段。而随着互联网增速放缓,这促使企业探索新的领域和子行业,以保持扩张。

高盛表示,这推动了“一种探索,导致广告和商业之间的运营界限、消费习惯和规模生态系统内的总体消费者行为之间的界限变得模糊”。

高盛表示,亚马逊是有望在这一领域蓬勃发展的公司之一。

Airbnb斥资2亿,收购了家只有12个人的AI初创企业

一如当年“互联网+”的热潮,眼下“AI+”跟各行业的结合,也在迸发新的想象空间。
前不久,民宿巨头Airbnb宣布收购一家12人规模的AI初创企业GamePlanner.AI。CNBC称Airbnb此次收购花了差不多2亿美金,这也是Airbnb上市后的首次收购。

民宿跟AI,看似两个相隔甚远的领域,但在Airbnb身上产生着奇妙的融合。根据Airbnb方面的说法,GamePlanner.AI将补充Airbnb现有的一系列AI技术,包括大语言模型、计算机视觉模型和机器学习等等。Airbnb CEO Brian Chesky 更是强调:
AI将比任何其他技术更迅速地改变世界。 为何Airbnb开始大规模布局AI?拥有AI的Airbnb又将进化成何种角色?

01GamePlanner.AI是谁?
当AI火遍全球,无数AI创业公司如雨后春笋般冒出之时,GamePlanner.AI并不算特别有名。
不过Brian Chesky认为它很独特,他曾这样曾形容:“GamePlanner.AI 之所以如此特别,是因为它们结合了人工智能、设计和社区方面的专业知识。” GamePlanner.AI成立于2020年,由Adam CheyerSiamak Hodjat联合创立,专注于利用AI和机器学习技术为企业提供智能决策支持。Adam Cheyer曾是苹果Siri团队早期成员,也被称为“Siri之父”。
尽管AI红的发紫,但GamePlanner.AI非常低调,自成立以来一直采取“隐身模式”运营,以至于外界难以深入了解这家企业。当然了,这其实也是一种经营策略,过去很多初创企业都采用这种策略远离公众视线,目的是保护知识产权或避免分散业务。
面对这次Airbnb抛来的橄榄枝,Adam Cheyer 表示,Airbnb 吸引自己的一个重要原因是,双方都致力于利用AI来实现人与人之间的联系。
在这起收购案背后,2023年美国掀起汹涌的AI资本热潮。Crunchbase数据显示,今年对美国初创企业的投资,超过四分之一流向了AI相关公司。 纵向比较来看,Crunchbase报告显示,从2018年到2022年,AI初创公司平均吸引了美国风险资本的12%,不到当前水平的一半。

AI投资之所以能够爆炸式增长,一个重要的原因在于它并非离散的,而是可以应用于许多行业,比如房地产AI公司、金融科技AI公司、生物科技AI公司等等。伴随着给各行各业带来新的动能,普华永道预计至2030年AI将为世界经济贡献15.7万亿美元。 在众多行业当中,旅游行业同样能够被AI注入新鲜血液。

布局AI背后的隐忧

眼下的AI仿佛成为金手指,跟它沾点关系的行业或者企业,许多都能获得资本的偏爱。
对于Airbnb来说,现在布局AI既是主动进击,也是无奈之举。

整体上看,Airbnb交出了一份较为平淡的成绩单,另外让市场担忧的是,Airbnb在财报里面提到,预计第四季度的业绩将出现更大的波动性,目前公司还在密切关注宏观经济趋势和地缘冲突对旅游需求的影响。 路透社认为,由于成本上升、游客出游意向度下降、经济下行、地缘条件不稳定等因素,Airbnb对接下来第四季度业绩的预期低于分析师预期——Airbnb预计第四季度收入在21.3亿-21.7亿美元之间,而分析师们的平均预期则在21.8亿美元左右。
收入不及预期,除了宏观经济和旅游波动,还有一个原因就是远程办公的人数下滑了。
此前,Airbnb是全球远程办公最大的受益者之一,因为员工会在Airbnb上预订各类房源用来远程办公,然而今年越来越多的公司要求员工回归办公室。亚马逊就宣布,要求员工从5月份开始每周返回办公室三天。当更多的公司取消远程办公,无疑会间接影响Airbnb的业绩。
更为严峻的是,在业绩持续不及预期的形势下,当下Airbnb市值仅为895亿美元,几乎跟上市之初的850亿美元持平。
此时,Airbnb需要给资本市场讲一个更大的故事,而AI就是那个画出大饼的金手指。

03AI时代下的Airbnb

AI能够给Airbnb带来资本增值上的想象空间,同样能够带来用户体验上的想象空间。 自从Expedia、Hotels.com出现以后,过去25年旅行搜索并没有发生太大变化。然而AI的出现,将让这一切变得不同。
Brian Chesky 曾说,今年年底外界将会看到一个全新的Airbnb,而AI将成为其中的核心。其实就是Airbnb会通过AI改善流程环节,包括预测搜索、预测定价、用户分析、去伪存真等等。
预测搜索:Airbnb 之前使用地点、日期、逗留时间和价格等因素,将客户跟房源进行匹配。现在通过AI和算法,可以提供更有针对性的推荐,从而增加成功预订的可能性。比如,使用AI分析客户点击的地点、查看的地点和房东偏好等因素,就能给客户推荐最有可能预订的房源。
预测定价:在分析地点、日期、逗留时间等数据后,Airbnb 可以使用AI和算法为房东定价。这个过程会考虑酒店特征、预订趋势、当地活动和竞争对手等因素,从而采用最有可能吸引预订的价格,实现收入最大化。 
客户分析:并不是每一个住户,都会受到房东喜欢,住户和房东的纠纷从来没有停止过,Airbnb将使用AI和算法进行背景调查,评估住户的可信度。这个过程涉及利用AI扫描社交媒体资料,由此形成住户画像。 去伪存真:今年以来,Airbnb已利用AI技术下架了5.9万个虚假房源,并阻止了另外15.7万个假房源加入平台。Airbnb还计划开始验证其在美国和英国等五个主要市场的所有房源,以应对假房源泛滥的现象。 通过AI,Airbnb在经营上可以实现降本增效,对于住户来说,可以更便捷地找到自己想要的民宿,对于房东来说,可以以更好的价格吸引到更多住户,这将会产生多赢的局面。

回到Airbnb收购GamePlanner.AI 这起收购案上,Airbnb看中的是GamePlanner.AI的技术。这次收购,意味着Airbnb力图保持在AI领域的领先地位,尤其是在提升旅行和酒店的体验方面。
这起收购案也向市场透露一个信号,如果企业想要积极进取,就必须走出自己的舒适区。
激进的商业实验,往往跟引领创新的初创公司相关。


Airbnb过去也是引领创新的弄潮儿,现在却变成落后于时代创新的选手。那些抵制变革的老牌企业更应该认识到,AI等新技术的浪潮势不可挡,只有加入它才不会被时代抛弃。


虽然疫情减退后,全球旅游业迅速回暖,但依然没有恢复到疫情之前的水平。数据显示,2023年全球旅游总人次将达107.8亿人次,全球旅游总收入将达5.0万亿美元,分别恢复至2019年的74.4%和86.2%。


过去三年的全球疫情,让Airbnb元气大伤。尽管根据Airbnb前不久发布的2023年Q3财报,营收和利润都实现增长,但仍没达到市场预期。数据显示,今年第三季度Airbnb营收约 34 亿美元,同比增长18%,增速和上季增长持平,没有带来太大惊喜;由于控费的贡献,经营利润约为15亿美元,但增长幅度不大,同样没给市场带来惊喜。

比如,AI大模型能够在智能问答、个性化筛选推荐、提升供需匹配等方面提供助力。 在国内,不少旅游相关的公司也在纷纷布局AI。今年10月,携程对外宣布接下来将持续围绕AI等三方面进行创新,包括完善问答大模型,将生成式AI融入各项产品等等。 Airbnb收购GamePlanner.AI,也是在顺应大势。当然,这背后也有它自己的隐忧和野望。

8大全球顶流的AI预判,一文看懂未来20年

 凯文·凯利:
 未来50年是AI的时代
 

凯文·凯利以“互联网教父”“硅谷精神之父”“科技预言家”之称享誉全球。早在1994年,他就在《失控》中,预言了很多今天大热的技术:云计算、物联网、网络社区、虚拟现实、共享经济、虚拟货币等等。接下来的二十多年,这些预言一个一个照进现实。在新书《5000天后的世界》,凯文·凯利又做了一次科技预言:未来将会是一切都与AI相连的世界。

软件开发公司微软颠覆了制造计算机的IBM,搜索引擎公司谷歌将微软推下了王座,超越谷歌的新王者是社交媒体公司脸书。下一个胜出的必然是AR公司,Open AI就是一个绝佳案例,不管未来前景如何,这家初创企业的确是AI领域的颠覆者。

在未来的50年,甚至更长的时间内,AI还会继续发展,并颠覆我们的生活。各种各样的事物都会拥有智能和情感,会出现类似于新产业革命的变化。

智能手机之后应该是什么呢?

第一种是虚拟现实VR,把机器戴在脑袋上,你可以看到一些东西。

第二种是MR,也就是现实和虚拟混合。你如果把这样一个眼罩戴上的时候,每一件事情都是以3D的方式存在的,你可以用手控制这些现实,而且你真的是相信这些现实是存在的。

2050年的时候,电脑会变成什么样子?

从现在开始我们要进入“沉浸式计算”的时代。我们身边的一切都要和计算相关联,也就是所谓的“普适计算”时代。计算机不再是摆在桌上或随身携带的硬件,而成为环境中无处不在的存在。

基本上你可以用整个身体没有任何障碍地互动,电脑是全方位可互动的机器。就像交响乐团的指挥家一样。通过纳米雷达技术,可以知道手指动作的意义。

在一个新事物产生之初,我们很难预知它的影响会波及哪些方面。同理,我们比较容易想象出“X+AI”的组合,但是很难预测由此造成的影响。

以汽车为例。当汽车遍布全世界的时候,紧随其后出现的是交通堵塞、上下班高峰。那么将汽车换成AI呢?当AI无处不在的时候,当我们使用的所有工具都和AI相关,当我们已经对AI习以为常,甚至意识不到它的存在的时候,会发生什么呢?

你可以想象一下,比如再过50年,全世界最牛的、最有影响力的100个智能体里面,也许只有20个会是人类,剩下80个都是AI。最后人类和AI一定是融合,而不是控制。

现在没有人是AI的专家——很多人懂AI,但是没有人是专家。跟30年后的我们相比,现在的我们就是一无所知。我们看过去,认为过去是好的创业时机。同样,现在也是最好的创业时机,因为我们还处在AI时代的起点。

 山姆·奥特曼:
 2030年之前会出现AGI
 

2022年11月,ChatGPT横空出世,仅花了60天,就创下了月活过亿的神话,成为史上用户增长最快的互联网应用程序,引爆了AI时代。Open AI首席执行官、“ChatGPT之父”山姆·奥特曼(Sam Altman)也成为了当下最炙手可热的科技领袖,在2023年获评美国《时代》杂志“年度首席执行官”。1个月前,山姆·奥特曼发布了自己的“2024愿望清单”:

1.2024年的12个愿望清单

2023年12月24日,山姆·奥特曼在社交平台上发起了一个“许愿池”——希望Open AI在2024年构建/修复什么?从海量回答中,他挑选了12个期望值最高的愿望清单,可以折射出 Open AI 2024年的路线图:

AGI(请保持耐心);GPT-5;更好的语音模式;提高访问限制;更好的GPTs;更好的推理能力;对觉醒/行为程度的控制;视频处理/生成能力;个性化定制;更强的联网搜索能力;使用Open AI登录;开源。

2.2030年之前就会出现AGI

如果我们能够开发出一个系统,能自主研发出人类无法研发出的科学知识时,我就会称这个系统为AGI(通用人工智能)。人类可能在2030年之前,开发出AGI,也就是GPT-10,它比全世界所有人加起来还要聪明。我们可以让AGI去完成那些人类不需要但是“不得不做”的工作,从而让每个人都去做自己喜爱的,能够全情投入的工作,充分发挥每个人的潜力。

当真正AGI降临那天,如果它成为“天网”,Open AI还有备选项。Open AI的财务文件规定了一种退出应急方案,以防人工智能摧毁我们的整个经济体系。

3.除了AI,我最感兴趣的是核聚变

在AI之外,我最感兴趣的事情是可控核聚变。如果人类要创造一个富足而无忧无虑的未来,最重要的两件事:首先是让智能的成本大幅度下降,其次就是让能源的成本大幅度下降。Open AI在做第一件事,而第二件事,可能只有可控核聚变才能达到,能让人类可以获得无限的清洁能源,这会改变一切。

 比尔·盖茨:
 2个预测,1个经验,5个问题
 

作为微软公司创始人,比尔·盖茨曾在2019年向Open AI投资了一百多亿美元,成为OpenAI的背后“金主”。从2022年底发布Chat GPT大模型以来,微软市值增长超1万亿美元,重新成为全球市值最高的公司。比尔盖茨坦言,他正在见证“人生的第二次革命性时刻”。

2023年末,他在个人博客上写道:“AI纪元已经开始”(The Age of AI has begun),并将他眼里的2023年描绘成了一个新时代的全新开端。

2个预测:

如果我必须做出预测,那在像美国这样的高收入国家,距离普通大众广泛地使用人工智能还有18到24个月的时间。在非洲国家,我预计在三年左右的时间里会看到类似的使用水平。这其中仍然存在差距,但它比我们在其他创新中看到的滞后时间要短得多。

1个经验:

2023年是我第一次在工作中出于「严肃的原因」使用人工智能。与前几年相比,世界对AI能够自己完成哪些工作以及「充当哪些工作的辅助工具」有了更好的认识。但对于大部分人来说,要让AI在工作场景中充分发挥作用还有一定距离。

行业应该吸取的一个最重要的教训是:产品必须适合使用它的人。比如,巴基斯坦人通常互相发送语音留言,而不是发送短信或电子邮件。因此,创建一个依赖语音命令而不是输入长查询的应用程序是有意义的。

5个问题:

盖茨提出了5个问题,希望人工智能可以在相关领域发挥巨大作用:

-人工智能可以对抗抗生素耐药性吗?

-人工智能能否为每个学生创造出个性化的导师?

-人工智能可以帮助治疗高危妊娠吗?

-人工智能可以帮助人们评估感染艾滋病毒的风险吗?

-人工智能能否让每个医务工作者更轻松地获取医疗信息?

如果我们现在做出明智的投资,人工智能可以让世界变得更加公平。它可以减少甚至消除富裕世界获得创新与贫穷世界获得创新之间的滞后时间。

 黄仁勋:
 AI将在五年内与人类“平起平坐”
 

华尔街分析师曾说:“人工智能领域正在发生一场大战,而黄仁勋的英伟达是唯一的军火商。”英伟达CEO黄仁勋靠为AI提供算力,身价一夜暴涨460亿,公司市值涨了2个英特尔,突破万亿美元大关。作为人工智能技术背后最大的推动力量之一,黄仁勋在2023年底举办的《纽约时报》的年度峰会上表示,人工智能正在超越人类。

1.人工智能将在五年内与人类“平起平坐”

如果把通用人工智能(AGI)定义成:与人类智慧相比,能以“相当具有竞争力”的方式完成测试的电脑的话,那么这有可能在5年内实现。科技行业距离通用人工智能还有数年时间的原因之一是,虽然机器学习目前已经熟练掌握了识别和感知等任务,但还不能进行多步骤推理,而这正是AI公司和研究人员的当务之急。

AI领域的竞争,将会导致现成AI工具涌现,各种不同行业的公司,将会依照自身需求进行调校,应用层面将涵盖晶片设计、软体开发、新药发现、放射线医学等。

2.计算技术将会每十年进步一百万倍

通用计算诞生60年以来,开始出现了向加速计算的转换,通过并行计算,使得GPU时代的算力相比CPU大幅提升。而神经网络和深度学习的发展,也让计算机获取知识变得更加快捷,带来了计算机的智能化飞跃。

传统计算方式依赖于预设的算法模型,缺少学习和理解能力。而结合深度学习,系统可以对数据进行调整优化提升算力的利用率。

这是60年以来第一次看到通用计算和人工智能两种技术转型同时出现。二者结合将会带来1+1>2的效果,甚至会让计算技术每10年进步一百万倍,两年之内英伟达乃至整个行业也会“面目全非”。

3.美国“芯片独立”至少需要10-20年

英伟达的系统中有35000个零部件,来自全球各地的供应商,其中80%由台积电及其供应链提供,他们遍布世界各地。美国还需要10到20年的时间来实现供应链独立。在一两年间,这并不是一件能够实现的事情,供应链的独立性将非常具有挑战性。

 李彦宏:
 AI时代的两大陷阱和三大驱动力
 

在国内市场经历了一年的“百模大战”之后,业界和公众有限的注意力最终绝大部分都分配给了极少数头部玩家。比如,百度的文心一言,是全球大厂中第一个做出的对标ChatGPT的产品。

2023年,百度创始人、董事长李彦宏被《时代》周刊评为“全球AI领袖”,是该榜单中唯一入选的中国企业家。在去年年底的2023西丽湖论坛上,李彦宏分享了AI原生时代的“冷”思考和“热”驱动,再次强调,对于创业者来说,卷大模型没有意义,卷应用机会更大。

1.关于大模型,必须警惕两大陷阱

第一个陷阱,是自研大模型陷阱。自研AI大模型,似乎已成为国内大型互联网科技企业的标配,言必称“大模型”,缺少自研大模型,就是处于鄙视链底层。所以,我们正在经历一轮“大模型”的放卫星时刻:6月份,国内发布的大模型是79个,到10月份,狂飙至238个。

PC时代,基本上只有Window这个主流操作系统;移动互联网时代,安卓和iOS双雄并立。作为AI应用基础底座的大模型,最终能做大做强的基本上不会超过三个,也就是99%的入局者注定只能陪跑,沦为炮灰。AI原生时代,我们需要100万量级的AI原生应用,不需要100个大模型。

第二个陷阱,是大模型的低能陷阱。没有智能涌现能力的大模型,不是好大模型。优秀的大模型,必须具有懂得逻辑推理、触类旁通的能力,能跟细分行业领域的专业知识相结合,从而可以落地使用。一味囤显卡、囤芯片、喂数据,训练不出自己的专用大模型。数据量不够、迭代能力不足、无法跟具体场景结合,这样的大模型注定中看不中用。大模型的产业化模式,应该是“大模型套小模型”:专用的小模型反应快,成本低;大模型更智能,可以用来兜底。2.AI原生时代,未来的三大驱动因素其一,强大的基础模型,会驱动AI原生应用爆发。目前最好的AI原生应用还没有出现。类似于移动时代诞生了诸如微信、抖音、Uber等移动原生应用一般,AI原生时代也会诞生优秀的AI原生应用,且它们将基于基础大模型开发而生。其二,拥抱AI时代,需要由一把手来驱动。只有CEO才会关心新技术对企业业务关键指标是否产生了正面作用。这也意味着,企业CEO如果不主动引领AI原生变革,就很容易被带偏。其三,繁荣的AI原生应用生态,会驱动经济增长。类似于新能源汽车产业快速发展,AI产业也将由需求驱动,所以应该在需求侧、应用层发力,鼓励企业调用大模型开发人工智能原生应用,用市场手段推动产业发展。 周鸿祎:
 2024大模型的10大预言
 在ChatGPT发布之后,360集团创始人兼CEO周鸿祎第一个响应,作为坚定的“AI发展派”,不止一次放话“All in AI”,其创立的360是最早布局大模型的国产厂商之一,“360智脑”也是国内首个原生安全大模型。

在2024年1月份的一场演讲中,周鸿祎分享了对人工智能大模型的十大趋势判断和相关看法,“未来3-5年,如果你不能把AI成功地变成自己手里的武器,那你一定跟拿着大刀长矛的人一样,面对的对手已经升级到AK47,很有可能会面临降维打击”。

1.大模型不是操作系统,但会无处不在

我不认为大模型是操作系统。全世界的手机操作系统就鸿蒙、iOS、安卓三款,我觉得大模型更像当年的PC一样,未来会无处不在,成为整个企业数字化、政府数字化的标配。

2.开源大模型爆发

以后每人都用得起大模型。未来的矛盾不再是大模型本身如何,而是谁能够利用大模型结合业务和场景,训练出需要的功能。

3.有大模型必有小模型

现在出现了一种趋势:把模型做小,在十几亿或者不超过100亿的模型上,像高通去年推的CPU,还有苹果推的CPU,都已经意味着在手机、Pad、电脑上,这种小参数的大模型已经可以跑起来,效果也差不多。模型做小有两个前提,一是模型做专业,二是可以运行在更多终端。

4.大模型的企业级市场会崛起

2024年中国大模型的企业级市场会崛起,真正在to B业务上,走向深度化、产业化、垂直化、定制化。

5.Agent框架将成为大模型的“手脚”

Open AI最近提出一个新概念叫Agent框架。没有Agent框架,大语言模型几乎不能投入实用。无论是to B还是to C业务,一定要结合智能体框架,才能真正让大模型长出手脚,把业务系统和整个互联网充分打通。

6.2024会出现大模型杀手级应用

美国的三家公司很有意思,微软、Adobe和Salesforce,没有用大模型做任何新东西,而是All in AI把已有的产品用AI重做了一遍,比如微软的Office、Bing;Adobe的图形编辑、视频编辑。大模型在to C领域意味着,我们今天的搜索、浏览器、信息流、短视频、微博、问答,甚至社交,都可能被大模型重塑一遍,所以2024年一定会出现杀手级应用。

7.多模态会成为未来的标准

2023年,大模型主要强调文字能力。2024年,以 Gemini和OpenAI的GPT- 4V版本为代表,多模态会成为未来的标准。多模态不仅能听会说,关键是看得懂视频,看得懂图片。

8.AIGC会有突破性增长

在大模型的支持下,AIGC会有突破性增长。2023年年初,Midjourney画一张图,很明显是AI画的,AI生产视频的能力,几乎都是动图和表情符号;2023年年底,计算机生图的效果已经和摄影师的作品不相上下,AI生产的视频已经做得像好莱坞动画片了,进展特别快速。

9.大模型拯救了机器人行业

在大模型之前,传统的人形机器人是典型的“智障产业”,外观像人,但能力低下。在大模型出现之后,机器人产业获得了革命性的突破。比如,自动煎蛋,做家务,整理衣服,这些能力完全有赖于大模型的加持。

10.大模型能够推动基础科学取得突破

在最近五六十年,人类在科技上已经很久没有重大突破,所以如果大模型能够成为科学家的工具,将成为科技发展的利器。比如在美国,很多生物学家已经开始用大模型来帮助他们研究蛋白质的结构,研究分析基因。所以我希望2024年,大模型能够推动基础科学取得突破。

 吴恩达:
 关于AI,这些事未来十年不会变
 作为人工智能和机器学习领域国际上最权威的学者之一,吴恩达教授被称为“谷歌大脑之父”,也曾在2014年加入百度,担任首席科学家,负责百度研究院的领导工作,尤其是Baidu Brain计划。在吴恩达最新的一封来信中,他认为有几件事情在接下来十年内都不会发生改变。

我们需要社区。拥有朋友和盟友的人比孤身前行的人表现得更好。即便人工智能领域每周都带来突破性进展,拥有朋友帮助你分辨真实和炒作、测试你的想法、提供相互支持,并与之共同创造,将使你处于更有利的地位。

知道如何使用AI工具的人工作效率更高。知道如何操纵数据的个人和企业可以更有效地了解真相、做出更好的决策并取得更多成就。随着人工智能的不断进步,这一点只会变得更加真实。

人工智能需要好的数据才能良好运作。正如人类需要好的数据来做出决策,从追求何种营销策略到决定孩子的饮食,人工智能在我们的算法不断扩大、演变和改进的过程中,也同样需要好的数据。那么上述三点对我们每个人意味着什么?

让我们继续构建AI社区。这很重要!我希望你能与他人分享你所学到的东西,互相激励,并继续寻找朋友和合作者。

不断学习!最好让学习成为一种习惯。如果你正在考虑2024年的新年决心,那就把你的学习目标包括进去。随着人工智能的不断发展,每个人都需要一个学习计划来跟上这一浪潮。

继续发展以数据为中心的人工智能实践。随着企业采用越来越多的人工智能工具,最重要的做法之一是控制自己的数据。我认为这对个人来说也会越来越重要。 

李飞飞:
 携手斯坦福发布AI七大预测
 

李飞飞是一位备受尊敬的华裔学者,或许许多人并不太熟悉她,但她是斯坦福大学计算机科学系的首位红衫教授,同时还曾在谷歌担任副总裁,更值得一提的是46岁三获院士称号,被圈内人士称为“AI女神”。在2023年年底,李飞飞携手斯坦福大学人文智能中心(HAI)发布了对AI的七大预测:

1.知识工作者将迎来巨大挑战人工智能公司将能够提供真正影响生产力的产品,而知识工作者将受到前所未有的影响,比如创意工作者、律师、金融学教授的工作将发生很大变化。在过去的30年中,这些人基本没有受到计算机革命的影响。我们应该接受人工智能带来的改变,让我们的工作变得更好,让我们能做以前做不到的新事情。

2.最该担心的是虚假信息扩散我们将看到新的大型多模态模型,特别是在视频生成方面。所以我们还必须对严重的深度伪造更加警惕,作为消费者需要意识到这一点,作为民众也需要意识到这一点。我们不必担心人工智能会接管世界,真正应该担心的是现在正在发生的危害——虚假信息和深度伪造。

3.亟待解决的问题:GPU短缺大公司们都在尝试将AI功能引入内部,而英伟达等GPU制造商已经满负荷运转。GPU,或者说AI的算力,代表了新的时代的竞争力,对于公司甚至是国家来说都是如此。对于GPU的争夺也会给创新者带来巨大的压力,他们需要提出更便宜、更易于制造和使用的硬件解决方案。

4.AI代理兴起,实用性增强2023年是能够与AI聊天的一年,人们与AI的关系只是通过输入和输出来进行的互动。到了2024年,代理(Agent)将会兴起,AI将能够连接到其他服务,并解决实际的问题。我们将看到代理为人类完成工作的能力——进行预订、计划旅行等等。此外,我们将朝着多媒体迈进,从语言模型,然后是图像模型,之后是视频模型。

5.人工智能政策导向更值得关注2024年,人工智能政策将值得关注。我们的政策应该保障学生和研究人员能够获得AI资源、数据和工具,以此来提供更多人工智能开发的机会。另外,我们需要安全、可靠和可信赖地开发和使用人工智能,所以,政策除了要致力于培养充满活力的人工智能生态系统,还应致力于利用和管理人工智能技术。

6.培养新的理解方式很必要早在2023年2月,学术期刊出版商Springer Publishing就发表了一份声明,表示可以在起草文章时使用大型语言模型,但不允许在任何出版物上作为合著者。他们引用的理由是问责制,这一点非常重要。认真地把一些东西摆在那里,阐述理由是什么,并表示这就是现在的理解方式,将来可能会在政策中加入更多改进。机构和组织必须有这样的视角,并努力在2024年落实在纸上。

7.AI公司将面临更为复杂的法规除了欧盟的《人工智能法案》,到2024年年中,加利福尼亚州将通过法规,解决消费者隐私背景下的自动决策问题。虽然这些法规仅限于,对个人个人信息进行训练或收集的人工智能系统,但两者都为消费者提供了选择,即是否允许某些系统使用AI以及个人信息。公司将不得不开始思考,当客户行使他们的权利时,将意味着什么。比如一家使用人工智能来协助招聘流程的大公司,如果数百名应聘者都拒绝使用AI,那要怎么办?必须人工审查这些简历吗?这又有什么不同?人类能够做的更好吗?

 尾 声 世界经济论坛创始人施瓦布教授将工业革命划分为四个节点:

第一次是蒸汽机的发明,第二次是电气化革命,第三次是计算机革命,第四次是现在的人工智能革命。

前两个节点,中国没赶上,第三个节点赶上了后半截,坐上了互联网时代的云霄飞车。值得庆幸的是,在人工智能的技术革命中,中国公司早早入场。实际上,论前期资本投入和底层技术积累,中国公司并不比西方落后。作为Open AI的早期牵头人,马斯克在联合国大会上再度盛赞了中国的AI实力:“至于你说的哪些国家将在人工智能领域处于领先地位?中国肯定是其中之一,是顶尖国家之一,并且有潜力成为第一。”站在人工智能浪潮的前线,第四次工业革命,很可能会比想象中更加波澜壮阔。

这一次,中国没有理由不成为主角。

360曝AI首战成绩单 “安全智能体(AI Agent)1分钟秒杀APT”刷屏

昨日,《AI首战!360安全智能体(AI Agent)首秀:1分钟内自动捕获APT组织》相关话题和文章在网络安全圈内被刷屏,老周2023年一直对外强调的360的AI能力交出了第一份轰动行业的“战绩”。

这份成绩单到底有多少含金量?让我们细细说来。
2022年,ChatGPT的发布引领了大模型应用突破;2023年,“百模大战”开启了AIGC元年。

作为大模型落地场景之一,安全行业垂直大模型发展迅速,与此同时,安全大模型的能力边界逐渐显现,“像专家一样运营安全”成为行业对安全大模型的新期待。由此,Agent智能体进入大众视野,在基于大模型的AI Agent赋能下,安全行业迎来了智能主义时代。

一、安全大模型发展步入深水区

2023年被称为AIGC元年,大模型浪潮席卷全球,B端产业垂直大模型逐渐成为主战场。据IDC调查显示,网络安全是生成式人工智能影响最大的行业之一,国内外安全厂商积极探索大模型应用,安全大模型百花齐放。然而,经过一段时间的发展,安全大模型的能力边界逐渐显现。在功能方面,仅有安全问答、告警解读等单一功能的安全大模型难以解决用户痛点;在认知方面,缺乏海量安全语料库训练的大模型存在知识瓶颈,安全专业能力差强人意;在成本方面,安全大模型训练微调和部署的资源消耗依然较大,中小企业难以承担高昂的投入。

基于此,安全大模型的推广落地亟需优化升级,Agent智能体进入人们视野。基于大模型的AI Agent展现出自主思考决策和执行安全工具的能力,有望从根本上解决用户痛点问题,由此步入智能主义时代。

二、让大模型像人一样工作,AI Agent开启智能化安全服务新范式2.1 AI Agent:更独立、更智能的AI应用Agent智能体是一种能够感知环境、进行决策和执行动作的智能实体。

大模型时代的到来加速了AI技术的平民化,也为Agent的突破带来契机,Agent跨入基于大模型的智能体阶段。目前,大部分AI与人类的交互模式,已从工具型AI发展至助理式AI,各类AI副驾不再是机械地完成人类指令,而是可以参与人类工作流,与人类协同工作。而基于大模型的AI Agent则更加独立,可以在一定业务场景中自主调用资源完成任务,人类在其中更多起到监督和评估作用,尽管AI Agent会承担大部分工作量,但人类仍然发挥主导作用。

相较于大模型回答效果与用户指令的强相关,AI Agent只需给定一个目标,即可针对目标独立思考、获取知识、自主研判并做出行动,它会根据给定任务详细拆解计划步骤,并依靠来自外界反馈和专家引导,通过自主思考,自己给自己创建指令,来实现目标。2.2 安全Agent:自动化运营核心驱动力智能体可以拆分为大模型、规划、记忆与工具使用四个组件部分。大模型是能够理解任务并进行决策的“大脑”;规划模块则负责分解任务、制定行动计划,以及检查、监督和改进计划;记忆模块负责存储上下文信息、专家知识、用户干预信息等,确保任务执行过程中前后目标一致;工具使用模块则是智能体的“双手”,能利用外部资源或工具执行任务。随着大模型展现出上下文学习、推理和思考链等多种类似于人类思考方式的能力,以安全大模型为核心的安全智能体,使解决垂直领域复杂问题、实现自然语言交互任务成为可能。安全智能体综合利用大模型的生成能力和专家的经验,灵活自适应地编排任务方案,实现对安全工具的调用,从而形成智能化运营的能力。相较于简单的AI工具,AI智能体具有更广泛的应用、更灵活的交互以及更强大的能力,使其更全面的满足用户需求并适应不断变化的环境,帮助用户从日常任务和重复劳动中解放出来。同时,通过训练的安全垂直类的智能体可以实现低成本规模化复制,其独立分析、计划和解决问题的优势,进一步降低技术门槛,真正帮助用户提升安全能力、提高运营效率。2.3智能化安全服务开启数字安全新范式在基于智能体的智能系统中,人类负责设定目标、提供资源和监督结果;智能体负责完成任务拆分、工具选择和进度控制,智能体和各类工具的调用组合,可以实现场景自动化能力。在安全领域,安全智能体+安全工具的组合形成基于智能体的自动化安全运营服务,正式开启“智能主义”的数字安全新范式。其中,安全智能体负责规划分解、任务执行、工具调用、记忆增强等工作;安全工具负责漏洞扫描、样本检测、流量分析等具体功能的实现。两者构成了一个有机的整体,随着智能体水平的不断提升和安全工具的持续扩充,整个系统的安全能力不断提高。

对于安全智能体来说,大量高质量的安全数据、样本、特征等数据语料喂养的安全大模型是智能体产出正确安全知识的基础,基于大模型,智能体对任务进行分解和规划,并通过反思和自省不断优化提升;其次,拥有广泛实战对抗能力的专家对智能体的干预和引导,则帮助智能体优化编排剧本,持续提升处置能力;第三,将实战经验沉淀的丰富的技战术知识图谱与大模型相结合,可以帮助智能体确保解决已知安全问题的精度;最后,智能体与大模型最大区别在于能够使用外部工具拓展模型能力,所以,丰富优质的安全工具是帮助智能体体系化解决复杂安全问题的关键。

三、未来已来,360安全智能体推进安全跨时代

3.1 从安全大模型到安全智能体的跃进

2023年6月,360发布认知型通用大模型360智脑4.0,并宣布360智脑已接入360旗下产品全家桶;8月,360发布国内首个可交付的安全行业大模型——360安全大模型。2024年,《仅需一分钟,360安全智能体完成了智能化APT猎杀》使360安全智能体进入大众视野:某金融单位疑似遭到APT组织攻击,几乎同一时间,安全运营人员就收到了来自360安全智能体的告警信息和包含攻击溯源、受害资产等内容的完整分析报告。

360安全智能体,是基于360安全智脑大模型的智能体系统,能提供目标理解、逻辑推理、效果评估和知识记忆等能力,支持连接、配置、驱动、协同各类安全工具产品,显著提升单个产品和系统整体的安全能力。至此,360率先完成从安全大模型到安全智能体的跃进。

3.2 360安全智能体:引领智能化安全服务

360安全智能体以360安全智脑大模型为核心,以任务编排引擎、任务生成引擎、监督评测引擎、指令调度引擎、记忆存储、执行反馈等为组件,综合利用360安全智脑大模型的生成能力和专家经验,灵活自适应地编排任务方案,实现对安全工具的准确调用,从而形成智能化安全运营的能力。

提及影响安全智能体的“数据、专家、工具”三大要素,360已沉淀多年,久经市场考验。展开来说:首先,360积累了全球规模最大的安全大数据、最广泛的样本、最丰富的威胁行为特征,并将这些数据、样本、特征训练到大模型中,使得360安全智能体具有先天的安全基因优势;

其次,360安全专家拥有近20年攻防实战经验,沉淀形成攻防技战术图谱,一方面内化为安全大模型的能力,另一方面储存至安全智能体记忆模块,持续增强安全智能体编排能力;最后,基于360深耕安全垂类场景,360安全智能体可以适配、控制、协作各类型安全工具,体系化地解决复杂安全运营问题。

3.3 小切口、大纵深,安全智能体稳步向前

大模型步入深水区,安全智能体的发展道阻且长。为此,360立足“小切口、大纵深”方法论,以“安全场景适用度”为指标依据,构造适合大模型特性的高价值安全场景,推进安全智能体的落地应用。目前,360安全智能体已经突破了自动化威胁狩猎、自动化安全运营等场景的各难点步骤,实现了场景自动化。运营人员负责设定目标、提供资源和监督结果,安全智能体完成任务拆分、工具选择和进度控制等,把执行结果返回给运营人员,安全技术门槛进一步降低,真正实现安全能力的提升和运营效率的提高。

360指出:“人工智能发展路上,智能体崭露头角。360安全智能体推进安全跨进智能时代,360探索数字安全的脚步从未停止,时间将是最好的答案。”(2024.1.26数说安全发布)

AI时代怎么找工作?听听马斯克给自己的八个孩子的建议

– 马斯克对AI的看法:在一个AI主导的世界中,马斯克对他的孩子们如何找到有意义的工作和生活表达了担忧。

– 马斯克的建议:他鼓励他的孩子们追求他们的兴趣和热情,做一些对社会有益的事情,同时也要关注自己的心理健康和家庭关系。

– AI的影响和机遇:AI的发展将改变许多行业和职业,一些需要创新和人际交往能力的工作可能会更受欢迎,而一些重复性和繁琐的工作可能会被AI取代或辅助。

埃隆·马斯克是特斯拉的首席执行官,也是科技领域的坚定支持者。但是,他对科技对就业市场的影响并不乐观。

他认为,科技的伟大发展之一——AI人工智能——可能意味着许多工作岗位的终结。

“人工智能将使工作变得毫无意义。”他曾在上海举行的世界人工智能大会上与阿里巴巴创始人马云对话。

他指出,最不容易受到这种工作中断影响的是那些能够对人工智能软件进行编程的人,并建议年轻人继续学习工程学。

但是,即便如此,他说,“最终人工智能也只会编写自己的软件。”

他发表上述言论之际,关于技术对全球劳动力影响的争论日益激烈。世界经济论坛预测,到2025年将有2022万个工作岗位被取代。

然而,这并不全是厄运和阴霾。他表示,即使在快速发展的就业环境中,专注于人际互动的企业也将继续蓬勃发展。

“从根本上说,人们喜欢与他人互动,”他说。“如果你正在做一些涉及人或工程的事情,这可能是一个好方法,”他说。

无独有偶,在接受大卫·费伯(David Faber)采访时,他也在担心他的八个孩子未来的职业,特别是如果他的孩子必须与人工智能竞争他们梦想的工作。

“我们如何真正找到满足感,我们如何找到生活的意义,如果人工智能能比你做得更好?”他被问到。

尽管这位世界第二大富豪表达了帮助领导即将到来的人工智能运动的愿望——他的汽车制造商特斯拉正试图制造完全自动驾驶汽车,他之前也曾讨论过使用Twitter来构建人工智能工具——但他表达了对这项技术未来影响的担忧。

这不是第一次。今年3月,他签署了一封公开信,呼吁暂停人工智能开发六个月,以确保这些系统在道德上得到实施,因为“对社会和人类的深刻风险”。

采访中,他努力阐明下一代如何在人工智能可以做任何事情的世界中发现价值。“这个问题很难回答,”他说。

以下是他给自己孩子的两条建议:

“尽量对社会其他人有用”

他的首要建议是:以一种可以使他人受益的方式追随你的激情。

他说:“我只想说,在觉得有趣的事情或成就感方面,要跟随他们的内心。并尽量对社会其他人有用。”

他讨论了人工智能对他孩子未来在职场的影响: “对社会有用”的定义正在迅速变化。甚至在 ChatGPT 的流行之前,人们就想知道人工智能将如何取代人类的工作。”

办公室和行政角色可能面临风险。从设计师到软件工程师,内容创作工作也是如此——尽管新的机会可能涉及培训和维护创建此类内容的人工智能系统的质量控制。

对于需要独特人类技能的工作,人工智能可能只是成为一种使工作更轻松的工具。这些范围可能从建筑等体力要求高的角色,到治疗师等以沟通为中心的工作。

“强调人际交往能力的工作很难被人工智能取代,”西北大学凯洛格管理学院(Northwestern University’s Kellogg School of Management)金融学教授迪米特里斯·帕帕尼克洛奥(Dimitris Papanikloaou)如是说。

“重新思考工作与生活的平衡”

他每晚睡六个小时,每周工作七天,每年只休息两到三天。显然,这就是他同时经营特斯拉、SpaceX和现在的Twitter所需要的,同时还拥有Neuralink和The Boring Company等企业。

接受采访时,马斯克质疑这一切是否值得,特别是如果机器最终可以为他完成这些工作中最乏味的部分。

“我为建立这些公司付出了很多鲜血、汗水和泪水,”他说。“然后我就想,’好吧,我应该这样做吗?’因为如果我牺牲了与朋友和家人在一起的时间,但最终,人工智能可以做所有这些事情,这有意义吗?我不知道。”

随着人工智能变得越来越复杂,这种不确定性可能会增加。他说,即使是现在,有时他也会采取“故意暂停怀疑”的方式,找到一种方法来忽略他正在帮助构建的技术中“令人沮丧和沮丧”的方面,以度过他的工作日。

不知道未来会怎样,很难给下一代提供建议。他唯一可以可靠地传递的智慧是:

“做你觉得有趣和充实的事情,并为社会其他部分做出贡献。”

【行业前沿】APA发布2024年12大心理学新兴趋势:人工智能对心理领域的2大影响成为关注重点!

通过与100多位杰出心理学家的深入对话,美国心理学会(American Psychological Association,APA)的官方刊物APA Monitor on Psychology在1月发布了《2024年心理学行业12大新兴趋势》报告

这些趋势不仅反映了社会的发展变化,也揭示了心理学家们是如何应对社会变化所带来的挑战的。

01

生成式人工智能(Generative AI)

的发展与心理学

AI早已成为心理学的一部分。在心理领域,ChatGPT和其他人工智能模型正在改变心理学家的教学、研究以及诊断和治疗病人的方式。

AI为心理行业主要带来了以下2个方面的变化:

教育

专业的生成式人工智能工具,例如 Genei,可以帮助进行文献检索、文献总结和学术写作。ChatGPT 可以生成量表项目,检测定性文本数据中的主题,并编写Python和R代码进行统计分析。

对于心理学教学,生成式人工智能可以简化一系列耗时的任务,从起草幻灯片、大纲和考试问题到指导学员治疗技术。

但这项技术也从根本上改变了学习环境,这会让许多教育工作者担心如何发现作弊并确保学生真正在学习。

心理治疗

在临床领域,人工智能也有助于减轻人类治疗师的负担。

生成式人工智能显然具有自动化管理任务(例如文档和笔记)的潜力,ChatGPT等工具还可以帮助学员练习,让他们对模拟病人进行心理干预。

另外,聊天机器人还可以处理一些日常的问题,例如来访者有与配偶的冲突、睡眠问题以及与工作或学校相关的压力问题等。

当然,生成式人工智能的发展也带来了一些挑战和问题。例如,这种技术可能会取代一些传统的心理治疗方法和技术,从而导致一些职业岗位的消失。此外,这种技术可能会引发一些伦理和隐私问题,需要心理学家和相关领域的专家共同探讨和解决。

高等教育举步维艰,

心理学家正在探索其不确定的未来

《健康心理研究》(《Healthy Minds Study》)每年都会对全美数万名大学生进行心理健康调查,其数据显示,2022-2023学年的学生心理健康状况出现了轻微的积极变化。

但学生的心理健康也仍然处于危机之中,仍有14%的学生表示考虑过自杀,超过40%的学生被筛查出了临床的抑郁症状。包括LGBTQ+学生在内的一些人群的心理健康问题发生率甚至更高。

值得注意的是,随着对教育价值的质疑越来越多,一些学生开始质疑他们是否应该上大学。佛罗里达国际大学全球领导力与管理学助理教授、心理学家Kisha Jones博士指出,成长于流行病、气候变化和政治冲突频发的时代背景下,使得许多学生对未来充满了不确定。

另外,并不是只有学生在苦苦挣扎,大多数教职员工都表示因为工作而感到疲惫不堪:他们面临着自己的一系列压力,比如要适应课堂上的ChatGPT,对于有色人种教师来说,还要为有色人种学生提供额外的支持。与此同时,高校员工的流失率也在持续上升

03

心理学家仍在坚持

促进平等、多元性与包容性(EDI)

在过去的一年里,美国许多私营企业和公共机构削减了用于实现平等、多元性和包容性(EDI,也称为DEI)的基金和职位,使许多为之奋斗的心理学家陷入困境。

除了这些挑战,州和美国国家层面还存在破坏种族平等努力的立法斗争。如美国Students for Fair Admissions v. Harvard案件中的判决,该判决取消了在大学录取决策中基于种族的平权行动;而且各州立法机构努力通过反EDI法律,为那些致力于创造一个更公正、更平等社会的人制造了许多法律、财政和社会障碍。

“这从来不是一件容易的工作,但目前的环境尤其艰难,需要为此而战”,社会心理学家 Brooke Vick博士说。“与感觉强大且不受你控制的势力作斗争,尤其困难。”

04

心理健康服务需求高涨

凯泽家庭基金会和美国有线电视新闻网(CNN)在 2022 年进行的一项调查显示,90%的群众认为当今美国存在心理健康危机,约一半年轻人和三分之一成年人表示,他们在过去一年中总是或经常感到焦虑。三分之一的受访者无法获得所需的心理健康服务。

当被问及获得服务的具体障碍时,80%的受访者表示主要障碍是费用,60%以上的受访者表示主要障碍是羞耻感和耻辱感。

与此同时,全美心理健康服务提供者有大量缺口,根据美国心理学会2022年疫情心理从业者影响调查,60%的心理咨询师表示没有空接待新的来访者。

在心理健康服务短缺的情况下,数字医疗可以发挥重要作用。

05

人们在工作中真正需要的

是意义感和稳定性

首先,注重工作稳定性和职业发展前景。由于经济环境的不确定性和职业竞争的加剧,人们需要关注工作的稳定性和职业发展前景。

在美国心理学会专门针对人工智能进行的《2023年美国工作》研究的后续跟踪调查中,38%的受访者表示担心人工智能可能会淘汰他们的部分或全部工作职责,64%的人表示他们在工作日通常会感到紧张或压力。

其次,注重工作的意义和价值。尽管社交媒体上流行着一种说法,即年轻员工希望拥有一份“摆烂”的工作,这样他们就可以只操心打卡上下班,过自己的生活。但研究表明,各个年龄段的人在很大程度上都渴望在工作中获得更深层次的目标

在APA的调查中,93%的人认为,拥有一份有意义的工作非常重要或比较重要。并且大多数员工认为他们的工作符合这一标准。事实上,“工作有意义”的定义包括意义和尊严,它已被美国卫生局列为工作场所心理健康和幸福的“五大要素”之一

06

心理学家正在通过建立新的治疗联盟

来解决药物滥用问题

在美国,非法和合法药物使用的最新趋势为追踪成瘾有害后果的专家敲响了警钟。

根据美国疾病控制与预防中心(CDC)的先期数据,2022年,美国有超过10.9万人死于药物过量使用,比2019年增加了约54%。其中约有三分之二的死亡涉及非法制造的芬太尼,这是一种合成鸦片类药物,其效力是海洛因的50至100倍。

为此,心理学家提出了2个解决问题的新方法:让缓刑监督官参与治疗工作,以及倡导奖励积极行为。

07

儿童青少年心理健康危机激增

对心理教师的需求日益强烈

心理健康服务的短缺和学业压力的增加,使得学校不得不努力培训和雇用更多心理健康专业人员。

随着年轻人的心理健康危机日益严重,对心理教师的需求正在成倍增加。心理教师可以为学生提供咨询,评估学生的干预需求,对危机做出反应,在全校范围内发起减少欺凌行为的倡议,等等。他们接受过心理学、儿童发展和教育方面的培训,在确定年轻人的心理健康需求方面发挥着至关重要的作用。

在2021-2022学年,全美平均每1127名的学生(从幼儿园到12年级)共享一名心理老师。这远远低于美国学校心理学家协会设定的每500名学生配备一名心理老师的目标。在美国南部各州,这种短缺现象尤为严重。

与此同时,学校心理老师的工作压力也在逐渐增大。2018年,在心理服务短缺最为严重的美国东南部地区进行的一项调查显示,约22%的人表示考虑离开目前的岗位。根据疫情前进行的研究,多达90%的学校心理老师表示有时会感到倦怠。

为了解决供需之间的差距,各学校正在尝试各种努力,以增加学校心理健康专业人员的数量。

08

心理健康技术的商业化

2020年,人们对心理健康的关注度很高,心理健康技术行业快速发展,心理健康相关的投资纷至沓来。但现在,情况发生了些许变化。这些健康科技公司裁撤了大量心理学专业人才,并出现一些道德违规行为。一些裁员和商业行为还对患者造成了实质性的伤害。

突然解雇临床医生不仅与提供有效的心理健康服务的目标背道而驰,而且对商业也不利。在许多情况下,公司陷入困境是因为他们从一开始就没有整合临床专业知识。

但现在,心理健康技术的“第二波”浪潮已经到来,投资者不再支持那些希望利用心理健康服务需求上升来获得利益的技术专家,而是越来越多地资助那些正在开发技术和数字产品、为有需求的人提供服务的心理健康服务专家。

09

反击虚假信息

比以往任何时候都更加棘手和重要

随着社交媒体和数字平台的发展,与公众的沟通变得比以往任何时候都更加便捷。但社交媒体也助长了虚假和误导性信息的传播。 

在2016年美国总统选举期间,“假新闻”成为人人讨论的热词。两个选举周期后,虚假信息的威胁变得更加隐蔽,反击虚假信息比以往任何时候都更加棘手。

心理学家正在研究虚假信息的传播,并广泛分享具有科学依据的反击方法。但这并不容易,网络喷子、网络骚扰以及日益增长的法律诉讼威胁使得公开反击虚假信息变得越来越困难。但专家表示,坚持为真相发声可以产生影响,而且,参与其中的心理学家越多,这种影响就会越大。

10

政策制定者将矛头指向女性群体

心理学家正在进行反击

美国的一系列新政策正在针对人们生活中最私密的部分——生育选择、性取向和性别认同。心理学研究人员和从业者表示,这些政策的出台对人们的心理健康产生了严重影响。

例如,无法获得堕胎服务的个人更有可能经历糟糕的心理和身体健康状况、贫困加剧以及与施虐者的长期接触等问题。LGBTQ+青少年面临了更多污名和心理健康问题,以及更少的医疗服务。

受这些政策影响的个人可能也会发现,他们越来越难以获得所需的心理健康服务。随着法律环境变得更加令人担忧,心理学家可能会对与患者讨论堕胎或性别认同等医疗服务持谨慎态度。但心理学家已经在治疗室内外进行反击:他们正在赋予患者为自己辩护的权利,并利用科学证据打击虚假信息。

11

心理学临床实践与线上医疗

疫情期间,线上心理治疗一下子变得异常火爆。如今,几乎四年过去了,线上心理治疗进入了一种“新常态”。

美国疫情爆发时颁布的《联邦公共卫生紧急状态(PHE)》已于2023年5月到期。卫生与医疗保健融资办公室高级主任Stephen Gillaspy博士说,在PHE颁布之前,医疗保险和医疗补助计划对线上医疗的报销比例是低于线下心理治疗的。现在,PHE 已经到期,医疗保险和医疗补助服务中心宣布,该机构将继续按照面对面治疗相同的报销比例,来支付线上医疗的费用。

此外,美国正推行着PSYPACT协定:该协定已覆盖美国40个州,参与的心理学家能够跨州为病人看病,而无需在每个州分别获得执照。

12

心理学家正在改善大脑健康

和衰老问题

随着美国65岁及以上人口比例的持续增长,人们对基于科学的疗法的需求日益强烈,旨在减缓、预防和治疗与衰老相关的大脑认知变化。

然而,目前专门为老年人提供服务的老年心理学家供不应求:据美国心理学协会预测,到2030年,美国将需要超过6000名老年心理学家来满足这一需求。

为了应对不断扩大的大脑健康维持和改善的需求,研究人员正在积极开发干预措施,旨在预防、识别和治疗轻度认知障碍、失智症和阿尔茨海默病的干预措施。

详见原文:

https://www.apa.org/monitor/2024/01/trends-report

在我国

心理健康问题已经成为一个不容忽视的社会问题。根据中国国民心理健康发展报告(2021~2022)的内容,抑郁风险检出率为10.6%,焦虑风险检出率为15.8%,心理健康问题已经成了一个需要政府和社会各界人士都需要普遍关心的问题,心理健康问题不仅影响到患者的身心健康,还给家庭和社会带来沉重的负担。

心理健康问题的严重性体现在多个方面。首先,心理健康问题与许多疾病密切相关。例如,抑郁症、焦虑症等心理疾病常常导致患者身体的免疫力下降,增加心脏病、糖尿病、肥胖症等疾病的患病风险。其次,心理健康问题对患者的日常生活和工作产生严重影响。患者可能因心理问题导致人际关系紧张、工作能力下降、生活质量降低等问题。最后,心理健康问题对社会和谐稳定产生威胁。心理疾病患者可能因情绪失控而引发社会事件,给社会带来严重的后果。

在认识到心理健康问题的重要性和紧迫性后,我国政府和社会各界对心理健康服务的需求日益增长。然而,目前我国的心理健康服务体系尚不完善,存在诸多问题。首先,心理健康服务资源严重不足。我国心理医生总数不到 4 万人,平均每 10 万人口只有 2.2 名心理医生,而发达国家平均每 10 万人口拥有 20 名以上的心理医生。其次,心理健康服务分布不均。城市地区的心理健康服务资源相对丰富,而农村和偏远地区则严重匮乏。再次,心理健康服务的质量和效率有待提高。部分心理医生专业技能不足,服务流程不规范,导致患者治疗效果不佳。

为了解决这些问题,中科心理健康评估及干预系统应运而生。

特斯拉AI司机正式上线!红绿灯消防车全识别,雨夜还能正常跑

特斯拉FSD系统最强版本正式开启公测!
车东西12月23日消息,当地时间21日晚,特斯拉正式开始向公众推送其最新版本的全自动驾驶FSD Beta V12,软件更新版本号2023.44.30.12,FSD版本v12.1.2。完全在端到端神经网络上运行的自动驾驶系统正式上线!

不过,尽管马斯克曾断言V12将不会有Beta版的开发阶段,但从第一批收到FSD V12更新的用户的截图看,该版本的FSD V12仍然拥有“测试版”标签。

“测试版”也抵挡不住美国特斯拉车主们的热情,海外媒体平台涌现大量测试视频,不少网友直呼“流畅”、“震惊”、“未来已至”。

从目前放出的演示视频来看,特斯拉FSD V12正确识别了路口停止标识、完成了无红绿灯路口起步、正确识别红绿灯(马斯克此前直播时唯一一次接管车辆是在红绿灯路口)、夜晚雨天不失效、能完成无保护左转等操作,甚至能识别并避让异形且亮灯的应急车辆(此前特斯拉车辆因为无法识别应急车辆发生过事故)。

从目前放出的视频来看,特斯拉FSD V12堪称优秀,几乎所有路段都可以平稳应对,可以说是狠狠地给马斯克挣了回面子。

这可能得益于HW4.0平台带来的增益,也可能得益于海量训练文本的投入。“FSD Beta v12将城市街道驾驶堆栈升级为在数百万个视频剪辑上训练的单个端到端神经网络,取代了超过30万行显式C++代码,”FSD V12的发行说明中写道。

从目前的FSD V12表现来看,可以说纯视觉的端到端智驾完成了对人类驾驶行为的模仿,整个系统已经达到了能用可用的水平,未来更多的实践不仅将证明其是否好用,同时也将为系统提供更多训练数据,帮助其继续进步。

或许,自动驾驶行业新里程碑已至,划时代一刻正在来临。

完美躲避消防车 起步博弈也不输从海外视频网站上用户公布的视频片段来看,FSD V12在马斯克所说的“没有高精地图、没有判断代码、全靠数据训练”的前提下运行良好,系统在雨天、无红绿灯路口、无保护左转、应急车辆异形车辆应对方面全程在线。国外的大部分车主都给予了新版FSD很高的评价,视频下评论基本偏向正面。

具体来看,搭载FSD Beta V12的车辆能够正确识别路口停车标志,还有路面上的实线。视频中车辆在路口停止实线前停稳,等待左右两侧无车时自动完成起步,顺利驶过十字路口。

在红绿灯路口,车辆正确识别了头顶的红绿灯信号,平稳地刹停在摩托车后方等候。绿灯亮起后车辆快速启动,还一度小幅度回避了侧面靠近的车辆。

同时,FSD还在演示视频中在红绿灯前200米左右提前完成了向右变道,在减速后顺利完成右转操作,并且避开了路边临时停靠的车辆。而在无保护左转(直行和左转绿灯同时释放)场景中,车辆跟随前车平稳起步,在对向无车的情况下快速完成了左转操作,平稳地由最左侧车道驶向了最左侧车道,行驶轨迹接近圆周运动。

而且,从这上面两个场景可以看出,车辆成功识别了不同位置、高度的红绿灯信号,基本上没有延迟,操作也十分恰当丝滑。在遇见开启应急灯光、形状各异的异形紧急车辆时,FSD也没有失效。从车辆仪表屏幕可以看到,车辆正确识别了闪灯的消防车,并正确地向右回避躲开了消防车。

同时,车辆也识别到了在消防车一侧的缓慢行走的施工人员。

在一段双车道路段上,车辆在对向车道车流不断的情况下,接连完成了越线超车和减速避让起步车辆两个操作,操作连接顺畅且无停止。

值得一提的是,驾驶员在中途手动改变了自动驾驶的终点,而车辆FSD系统中间并未停止运行,依然保持在线。

此外,FSD在夜晚雨天情况也能运行,且几乎不受影响,视频中车辆误刹车情况几乎没有发生。

在错位十字路口,路边还停放着其他车辆的复杂情况下,车辆也按照导航提示,成功驶入了正确的路线。

总的看下来,本次特斯拉FSD V12公测版本表现堪称优秀,各种城市复杂路况都能够应对,且不受雨天影响,更是在目前放出的视频中鲜有系统失效、降级、事故情况。
02.夜晚雨天也能用 复杂场景不失效对比马斯克上次测试的版本,本次FSD V12更新后车主放出的视频补充或者说证明了几个点:

1、FSD能够正确识别红绿灯和道路指示,并按照通行逻辑行驶;

2、在雨天、黑夜等能见度低场景仍然可用;

3、在人、车、异形物同时存在的复杂场景也不失效。

首先是逻辑问题,马斯克上次直播演示场景还是过于简单,在诸多海外网友的测试中,可以看到:特斯拉FSD不仅很守规矩,能做到比如路口停车、礼让行人、按红绿灯行驶,而且驾驶逻辑十分接近人类,如遇到慢车会超车、能够完成无保护左转的博弈、遇见应急车辆会减速观察、起步刹车都比较平顺,可以说是堪比老司机了。

其次是使用场景,马斯克直播时是晴朗的白天,而实际测试视频中,车辆不仅在黑夜行驶,而且前挡风的雨刮都快刮冒烟了,FSD还在正常运行。这证明了FSD目前可以在黑夜、雨天正常使用。未来,我们可以期待网友在大雾、沙尘暴等更极端场景中测试FSD的表现。

最后,作为纯视觉、端到端方案落地的“集大成”之作,FSD成功地识别了爆闪灯光、形状各异的应急车辆,并正确地做出了安全的回避操作,可以说是非常给力了。比

起马斯克上次直播时回避路障表现要更加亮眼,在行驶安全方面也更能够让人安心。或许,公测版本的FSD真正达到了“能用”的水平。随着更多车主更新取得公测版FSD并在实际场景使用,我们可以期待FSD是否能在实践中被评价为“好用”。

HW4.0平台算力更强大模型无限进步那么,这次公测版FSD的技术进步可能的增长点是源于哪些?本次公测版的FSD有了针对HW4.0平台的更新。外媒autoevolution报道,FSD Beta V12将带来更强的泊车能力,并可能揭示HW4.0摄像头的优势,即每秒多四帧。

之前,马斯克直播展示FSD时提到:“(系统)8个摄像头以每秒36帧的速度进行拍摄,实际能以每秒50帧的速度拍摄”。而HW4.0硬件升级带来了摄像头每秒多4帧的帧率,再加上对比HW3.0翻倍的算力、更佳的摄像头像素和布局、更好的定位能力,这些让FSD能够更好地识别路面细节并知晓自己的位置。

而且,本次公测版本的FSD可能投入了更加海量的数据进行训练。

FSD公测版的发行说明中写道。“FSD Beta v12将城市街道驾驶堆栈升级为在数百万个视频剪辑上训练的单个端到端神经网络。”马斯克在之前的直播中也介绍过,特斯拉FSD V12采用的是端到端大模型技术,不需要代码、高精地图,只需要数据投喂AI进行训练。

具体来看,特斯拉FSD V12基于深度神经网络,通过摄像头采集驾驶场景的信息,将其作为深度卷积神经网络模型的输入,再不断对网络模型进行训练,得到学习好的网络参数,从而对智能车方向盘转角进行预测。这一方案将此前各模块的感知和规范集成到一个大模型之中,而采集到的数据直接从一端输入至大模型,大模型能够根据数据计算迅速作出判断从另一端向车辆发出控制行为。

而端到端大模型最关键的地方便是深度学习和强化学习,这与人类的学习行为是类似的。特斯拉车辆的“影子模式”能在用户驾驶过程中采集各类驾驶数据,其中包括高价值的corner case数据,而特斯拉采集的数据包括车辆的位置、速度、方向和加速度等信息,这些数据将被存储在特斯拉的数据中心中,然后由数据引擎进行分析和处理,可被用作为系统的训练资料。

迟到六个月才姗姗来迟的公测版本的FSD V12,有着更长的深度学习时间和更加丰富的训练资料,同时也有着更多的调参时间,这也意味着更高的准确率。


04.结语:自动驾驶行业划时代一刻正在来临

特斯拉本次FSD Beta v12更新将最可能无限接近人类真实驾驶的端到端大模型智驾技术推向了公众,可以说是自动驾驶行业的一个里程碑式事件。从模仿人类的驾驶行为出发,发展到今天,或许此刻的FSD可以说自己已经完成了部分超越人类驾驶行为。未来,随着FSD Beta v12被更广泛地使用,实践将证明这一系统的优劣。而大模型带来的无限学习进步的优势又将使得FSD有更长远的进步,FSD涌现正在到来,自动驾驶行业划时代一刻正在来临。

全新的AIGC提示词撰写工具PromptLLM

宣布创业近10个月后,原Facebook人工智能科学家,原阿里技术副总裁,知名开源深度学习框架Caffe的创立者,TensorFlow、Pytorch等框架的核心成员和共同领导者,曾被誉为AI框架领域最厉害的华人科学家–贾扬清,近期携两款颇令人惊艳的新产品,回到了人们的视野。


1月10日,贾扬清在推特上表示,其创立的Lepton AI最近与HippoML合作,推出了全新的AIGC提示词撰写工具PromptLLM,用于帮助撰写AI绘图的提示词。

1月15日,Lepton AI联合创始人、前阿里云开源大数据前端负责人谢亚东发推特表示,基于Lepton AI,开发团队只需要不到500行代码就可以实现Perplexity的效果,同时还附上了Lepton Search的网址和截图。
这是一款对标Perplexity AI的产品。

提示词

Lepton团队推出的PromptLLM是提示词生成工具,其To C应用是一个名为PromptCraft的网页工具。用户只需输入一行简短的提示词,PromptCraft就能在几秒内生成一个更加完整、具体的提示词,顺便再用Stable Diffusion XL生成两张图片。

比如我们输入“space shuttle orbiting earth(绕地球运行的航天飞机)”,它就会给我们扩展成“Space shuttle in orbit around Earth, meticulously detailed with intricate features, a spectacle of engineering marvel set against the backdrop of our blue and green ball of life, bathed in the gentle light of the setting sun, Photography, Captured in ultra high definition for a sense of raw, untouched realism”,生成的图片质感也很逼真。

再比如我们输入“伊隆马斯克穿着夏威夷草裙跳舞”,它则帮我们扩充了人物表情、姿态、图片背景、摄影器材等细节,生成的图片效果如下:

在官方的演示中,提供了不少精彩的案例,比如鹦鹉吃胡萝卜、驯鹿亲吻大鹅、狐狸穿袜子、山羊划船等,每一张图都是可以“即出即用”的程度。

当然,在发布案例炫技的同时,贾扬清也不忘及时公布PromptLLM的API链接。从其定价页面可以看到,该工具推出了基础版(免费)、标准版($30/月)和企业版三个版本,根据使用模型的不同,每100万个Token的定价在0.1美元—0.8美元之间。
PromptCraft的底层技术是Lepton AI团队和HippoML共同开发的,其中Lepton AI提供API平台支持,HippoML提供PrivateCanvas系统来保障运行。
HippoML是一家做人工智能基础设施的公司,其目标是专注于降低人工智能软件堆栈的复杂性,让大型(河马,hippo)模型运行得像猎豹一样快。HippoML的主要产品是一个名为PrivateCanvas的应用,集成了Stable Diffusion(XL, LCM), SDXL Inpaint, Segment Anything, ESRGAN, MI-GAN等大模型,可以让用户在本地就使用各种热门大模型的功能。
该公司的创始团队来自Meta,其中包括Bing Xu和Hao Lu两位华人科学家。

而Lepton AI与HippoML之间的合作也并非首次。早在2023年8月,两家就合作推出了号称“最快”的SD扩散模型,同时将代码进行了开源。

而在2023年12月,有眼尖的网友发现,Lepton AI小试牛刀,悄悄上线了一个很有意思的项目:tryemoji,该项目可以把emoji表情变成真实的图像、动画,还提供了不同风格的模板供用户筛选。

贾扬清此前曾在播客中表示,不会做大模型创业,而是会更关注如何帮用户构建更好的AIGC应用,在AI Infra(AI时代连接硬件和上层应用的中间层基础设施,提供基础模型服务、赋能模型微调和应用开发)领域持续发力。

AI+搜索,AI+一切

除了提示词,Lepton AI还向AI搜索工具下手了。
目前,AI搜索领域最明星的产品是 Perplexity AI。不同于谷歌搜索出来的结果是链接,Perplexity会直接生成一段答案,并且在这段答案上方提供一个个附注链接(表明答案来源于这些地方),方便用户自己溯源。
自2022年12月上线以来,Perplexity的产品一直稳定增长,在2023年10月推出订阅制服务后ARR达到了300万美元,月活在2024年1月达到了1000万,并以5亿美元的估值完成了由IVP 领投的 7360 万美元融资。
而就在最近,Lepton AI也做了一款类似于Perplexity的产品。

Lepton AI的口号是“建立高效的 AI 应用平台(Build AI The Simple Way)”。除了PromptLLM和Lepton Search这两款主打的产品,在他们的官网上,还有各种各样有意思的AIGC产品:

比如OpenVoice,这是一个多功能的即时语音克隆工具,用户只需要输入一段文字,并且上传原始音频片段,就能生成和原说话者一样声音的音频内容,还可以选择不同的语气。

比如Super Resolution ,可以用人工智能生成无损质量的超高分辨率图片。

开源斗士

Lepton AI的创始人贾扬清一直是开源的摇旗呐喊者。早在深度学习框架Caffe刚刚出炉之时,贾扬清就力排众议,坚持将此框架开源;同时,他也是开源框架Tensor Flow和Pytorch的核心成员和共同领导者。


贾扬清此前曾经在公开演讲中指出,AI普惠的两个重要支撑,一个是工程化,另外一个是开源:从工程化角度,人们可以使用大规模的计算来寻找背后的统计学规律,无论是通过云原生的方式,还是更加高效的分布式计算,都让开发到迭代的路径变得更加简单;从开源的角度,开源让工作变得更加迅速、让整个市场变得更大,使得整体开发的效率提升、成本降低,进而实现共赢。


也因此,Lepton AI一出生就带着“开源”的基因,不仅在所有的产品页面上都附上了API,更是用 GitHub 开源工具链 SDK 的方式降低了模型的使用门槛,让每一位 AI 开发者们通过一行命令即可拉起热门模型。

而就在两个月之前,贾扬清还发朋友圈怒怼同行,表示有模型厂商套壳Llama,给下游客户造成了负担,也有损开源社区的自由度。

消息一传开,各种Llama魔改的国产大模型纷纷躺枪,贾扬清迅速留言辟谣说不是老东家阿里。关于这一“大厂”究竟是谁目前仍然众说纷纭,但是很多人猜测是李开复创办的零一万物发布的大模型Yi-34B。

此前就有网友在Hugging Face社区的Yi-34B板块讨论区留言说,除了两个张量(input_layernorm 和 post_attention_layernorm)被重新命名外,Yi完全使用了Llama的架构。

零一万物是李开复在2023年7月趁着这波大模型热成立的新公司,Yi-34B是其在11月发布的首款预训练开源大模型。
此事一出,零一万物负责人Richard Lin回应称,“这个命名问题是我们的疏忽,在大量的实验中,我们对代码进行了多次重命名,以满足试验要求,但在推出发行版前没有把名字换回来”。

同时,Richard Lin还在回复中表示,将检查所有代码,加强流程管控,保证这样的失误不会再次发生。

AI自动化标注崛起,数据标注员要失业了?

在数据标注行业流行着一句话:“有多少智能,就有多少人工”。

由于需要标注的数据规模庞大且成本较高,一些互联网巨头及一些AI公司很少自己设有标注团队,大多交给第三方数据服务公司或者数据标注团队来做。

这也衍生出了专为AI而生的人力密集型的数据标注产业链。

例如,众包平台Mechanical Turk上的20万名AI数据标注员,就分布在人力成本低廉的非洲和东南亚。印度甚至涌现了不少数据标注村,他们为美国、欧洲、澳洲和亚洲的AI公司服务。

在中国,上百万名 AI 数据标注员分布在贵州、山西、山东、河南等省份的二三线城市,并逐步向人力成本更低的县城渗透。

但讽刺的是,数据标注员正在被自己服务的AI所替代,已经有企业开始采用AI进行数据标注。

据彭博社1月14日报道,苹果公司将关闭圣地亚哥一个与人工智能业务相关的121人团队,这将导致数据标注员面临被解雇的风险。

那么,人工数据标注能否真的被AI全面替代,我们又是否会进入“AI训练AI”的时代呢?

 AI自动化标注崛起训练一个高效的大模型必不可少的是高质量的数据。OpenAI正是借助基于人类标注的数据,才一举从众多大模型企业中脱颖而出,让ChatGPT成为了大模型竞争中阶段性的胜利者。

但同时,OpenAI也因为使用非洲廉价的人工进行数据标注,被各种媒体口诛笔伐。

对于数据标注,一定需要找到一个新的方法,才能避免大量使用人工标注带来的包括道德风险在内的其他潜在麻烦。

因此,全球各大AI巨头和大型独角兽,都在进行数据标注自动化的探索。

苏黎世大学研究发现,ChatGPT平均每个标注成本低于0.003美元,比众包平台便宜20倍;在相关性、立场、主题等任务中,ChatGPT也是以4:1的效率优势“碾压”人类。

来自卡耐基梅隆大学、耶鲁大学和加州大学伯克利分校的一组研究人员更是发现:GPT-4在数据集标注表现上优于他们雇用的最熟练的众包员工。

这一突破为研究人员节约了超过50 万美元和2万个工时。

论文发出后,有网友评论称“这是直接端了平台工作者的饭碗”。

目前在自动驾驶领域,已经有车企开始采用AI进行自动化标注。

例如,特斯拉一直在积极推进自动化标注的进展,从2018至今,特斯拉的标注经历了4个阶段:

第1阶段(2018):只有纯人工的二维的图像标注,效率非常低;

第2阶段(2019):开始有3D label,但是是单趟的人工的;

第3阶段(2020):采用BEV空间进行标注,重投影的精度明显降低;

第4阶段(2021):采用多趟重建去进行标注,精度、效率、拓扑关系都达到了极高的水准。

2022年6月,特斯拉裁撤了200名为特斯拉标注视频以改进辅助系统的美国员工。

目前,特斯拉的自动标注能力大幅改善,标注10000个不到60秒的视频,大模型只需要运行一周即可,而同样的工作量人工标注却需要几个月的时间。

在国内,理想汽车董事长兼CEO李想曾在2023年4月份举行的一场论坛上表示,当理想汽车使用软件2.0的大模型,通过训练的方式进行自动化标定,过去需要用一年做的事情,基本上3个小时就能完成,效率是人的1000倍。

不仅如此,自动化标注工具也在飞速发展。

国外AI初创公司refuel推出了一个名为Autolabel的开源工具,可以使用市面上主流的大模型来对数据集进行标注。

该公司的测试结果称,Autolabel的标注效率相比人工标注提高了100倍,成本仅为人工成本的1/7。

国内一家名为视智未来的公司也在打造标注大模型。他们表示,有些项目已经用GPT交付了,准确率方面达到了80%多,与人工接近。

不得不说,在AI面前,无论成本还是效率,人类可以说是毫无优势。RLAIF:AI标注训练方法话说回来,ChatGPT是怎么抢了数据标注员的“饭碗”的?

以往数据标注员要干的事情,是将标注好的数据用作AI模型的训练集或评估标准,这个过程叫做RLHF(Reinforcement Learning from Human Feedback),即基于人类反馈的强化学习。

RLHF也是被ChatGPT、Bard和LLaMA等新兴大模型带火的模型训练方法,它最大的好处就在于能够将模型和人类的偏好对齐,让大模型给出更符合人类表达习惯的回答。

不过发布在arXiv的一份论文表明,这份看起来只有人类能做的工作,也能被AI取代。AI取代了RLHF中的“H”,诞生了一种叫做“RLAIF”的训练方法。

这份由谷歌研究团队发布的论文显示,RLAIF能够在不依赖数据标注员的情况下,表现出能够与RLHF相媲美的训练结果——

如果拿传统的监督微调(SFT)训练方法作为基线比较,比起SFT,1200个真人“评委”对RLHF和RLAIF给出答案的满意度都超过了70%(两者差距只有2%);另外,如果只比较RLHF和RLAIF给出的答案,真人评委们对两者的满意度也是对半分。

具体而言,研究人员主要就“根据一段文字生成摘要”这一任务,展示了RLAIF的标记方法。

首先是序言(Preamble),用来介绍和描述手头任务的说明。给定一段文本和两个可能的摘要,输出1或2来指示哪个摘要最符合上述定义的连贯性、准确性、覆盖范围和整体质量。

其次是样本示例(1-Shot Exemplar)。给到一段文本,接着给到两个摘要,以及“摘要1更好”的偏好判断,让AI学着这个示例对接下来的样本做标注。

再次就是给出所要标注的样本(Sample to Annotate),包括一段文本和一对需要标记的摘要。

最后是结尾,用于提示模型的结束字符串。

就像人类标注员会给不同的回答打分一样(比如满分5分),AI也会依据偏好给每个摘要打分,这也是AI和人类标注员发挥作用的关键环节,主要是用于训练奖励模型(RM)并生成反馈内容。

论文介绍到,为了让RLAIF方法中AI标注更准确,研究者也加入了其他方法以获取更好的回答。

譬如为了避免随机性问题,会进行多次选择,其间还会对选项的顺序进行交换;此外还用到了思维链(CoT)推理,来进一步提升与人类偏好的对齐程度。

需要说明的是,谷歌的这篇论文也是第一个证明了RLAIF在某些任务上能够产生与RLHF相当的训练效果的研究。这意味着不用人类指点,AI也能训练自己的同类了。

该论文的发布很快收获了不少关注。比如有从业者评论道,等到GPT-5可能就不需要人类数据标注员了。

尽管这项工作凸显了RLAIF的潜力,但依然有一些局限性:

首先,这项研究仅探讨了摘要总结任务,关于其他任务的泛化性还需要进一步研究。

其次,研究人员没有评估LLM推理在经济成本上是否比人工标注更有优势。

此外,还有一些有趣的问题值得研究,例如RLHF与RLAIF相结合是否可以优于单一的一种方法,使用LLM直接分配奖励的效果如何,改进AI标注器对齐是否会转化为改进的最终策略, 以及是否使用LLM与策略模型大小相同的标注器可以进一步改进策略(即模型是否可以“自我改进”)。重人力转向重技术尽管AI自动化标注技术在快速发展,但第三方数据标注服务商并没那么乐观。

河南一家众包平台的项目经理认为,自动化标注还不能取代60%以上的标注需求,只能作为辅助标注工具处理单一或特定数据,提升人效。

另一家数据标注公司的产品经理认为,自动化标注只能过滤简单的基础数据,还不能像人一样从复杂有争议的场景中精确识别物体。

如果说简单的标注可以用AI来完成,那么人工参与的将是难度更高的数据筛选和标准工作,这也意味着数据标注行业的门槛将会不断提高。

作为对照,早在ChatGPT走红前,OpenAI就组建十几位博士生来“打标”。

而百度在海口的数据标注基地拥有数百名专职大模型数据标注师,标注师的本科率达到100%,需要具备一定的知识储备和逻辑分析能力。

不过大家也认同,未来的数据标注将从重人力转向重技术的趋势。

一家众包平台的创始人在和同行交流时说,未来不能堆人力,要有研发能力。也有从业者认为,人工标注对于泛化仍然极其重要,而RLHF+RLAIF混合方法比任何单一方法都要好。

总之,不是被同行“卷死”,就是被技术“卷死”。数据标注公司已做好了随时裁员的准备,同时向做自动化标注工具的方向发展。

精选提示词合集,满足你对AI所有想象!

一、万能关键词描述架构

AI主要是提取关键字生成图像的,所以单词的选择至关重要。其实最主要的就是想清楚你自己想要的图片中包含什么。今天提供给大家一个万能的句式结构,通过换关键词,得到自己想要的图片,比较通用的公式如下:

主体描述+环境场景+艺术风格+媒介材料+摄像机视角+精度定义

举例

一个爱冒险的8岁可爱男孩,他喜欢探索和了解世界,在森林里,皮克斯动画风格,C4D,OC渲染器半身像镜头,黏土雕塑材质,电影照明,高质量,多细节,高清  


二、关键词更新

关键词之前已经发了很多了,今天再更新一波关键词,能够让大家的AI创作锦上添花!

整理一些具有代表性的AI关键词描述,大家可来参考参考!

1、游戏角色

关键词翻译

一个有武士赛博朋克激光剑和纹身的漂亮女孩,我简直不敢相信这有多美,马克西姆,超现实,罗斯·特朗和托德·麦克法兰画 

2、3D机器人

关键词

机器人,乡村沙漠中的金属朋克,铁锈和光泽的油漆光泽,反射,中性密度滤镜,高速同步,创意照明

3、机甲战神

关键词

在东京的夜景中,未来派装甲黑色机器人,半机械人身穿未来派突击步枪,在未来派黑色自行车前摆姿势 

4、模特生成

关键词翻译

一位身穿舒适运动衫的中国女模特,站在白色背景前的全身照,人像照片,使用标准镜头佳能EOS R5相机,从低角度拍摄,捕捉模特的整个外形,并展示她165厘米的身高

5、UI设计生成

关键词

制作一个关于绿色和黑色耳机的应用程序

6、3D设计

关键词中文

半透明方形设计,透明塑料,明亮光影,收藏玩具,浅色,村上隆风格,高细节,纯色干净背景,Cinema 4D,OC渲染,16K高清,高清风格表现力

7、包装设计生成

关键词中文

由 AI 在加利福尼亚设计,台湾制造的产品。

2023年度AI应用大赏:AI新浪潮不只属于大公司

过去几年,不管是在硬件、软件还是互联网行业,创新乏力都是一个普遍的印象。

这当然不是说就没有创新了,但必须承认的是,智能手机和移动互联网已经发展了这么多年,产品和服务形态大多成熟,各个生态位也基本都挤满了巨头和中小公司,只有少数创业公司和新应用还能在行业、市场的边缘给出让人眼前一亮的创新。

但 2023——过去这一年的与众不同之处在于,生成式 AI 的浪潮来了。从去年年底推出的 ChatGPT 开始,这一轮的人工智能浪潮不仅席卷了科技行业自身,也让各国政府、不同行业以及普罗大众都卷入到这场浪潮之中。

由此,全球范围都掀起了一轮新的 AI 创业潮,以及各种 AI 原生应用的爆发,除了 ChatGPT、Claude、谷歌 Bard 和百度文心一言等聊天机器人,我们还能看到从 Perplexity AI 原生搜索引擎到妙鸭相机,再到 HeyGen 和 Pika。

回望 2023 年,我们不应该错过它们。

通过上传约 20 张照片,就能制作自己的数字分身,并生成专业质感的写真照片,妙鸭相机从发布开始就表现出了与一众互联网大厂生成式 AI 产品的不同,尽管这是由优酷旗下团队打造的一款产品。

不仅如此,妙鸭相机也没有选择面向 C 端用户「免费」的模式,而是设置了 9.9 元的付费门槛。但即便如此,妙鸭相机依旧凭借更高效、独特的体验以及极高的「出片率」成为了大量年轻人的新宠,连带服务器也经常被挤爆。对此,雷科技在《在爆火的妙鸭相机上,我看到了 AI 应用的「流量密码」》一文也有更深入的体验和看法。

尽管妙鸭相机的「爆火」来得快、去得也快,但毫无疑问,妙鸭相机给了不少生成式 AI 应用一些启示和反思。

Perplexity

生于大模型的搜索引擎

作为一款新生的 AI 对话搜索引擎,Perplexity 其实最早在 2022 年 12 月就发布了,开始是采用 OpenAI 的 GPT-3 大模型作为「动力」,后面随着 ChatGPT 在全球范围的爆火,也将模型升级到了 GPT-3.5 和 GPT-4(付费专享)。此外,Perplexity 在 2023 年做了大量产品层面和模型应用层面的探索和升级,这也是为什么在这篇文章中将其归为「2023 年 AI 新应用」的原因。

事实上,经过过去这一年的多次迭代,Perplexity 和雷科技最初关注到它的时候已经有了很大的不同(文章可见《ChatGPT 成为“X 因素”,百度再度掀起搜索大战?》),不仅外观、功能大变样,整个产品形态也更加成熟、好用。同时,在提供 GPT-3.5/4、Claude2、Llama 2、Gemini Pro 等主流模型之外,Perplexity 其实也在持续更新自主训练的大模型。

而在 2023 年 10 月最新一轮的融资中,Perplexity 的估值也来到了 5 亿美元。

Chirper

AI 们的专属微博,硅基时代的社会实验

毋庸置疑,社交领域一直都是每一次技术革命的焦点之一,比如 Web 2.0 后出现的一大堆社交平台,在移动互联网后又有大量新兴社交平台的出现。从这个角度来看,Chirper 至少代表了硅基智能时代的一种尝试。

Chirper 是一个专门为 AI 设计的社交平台,不过仅限 AI 发布内容,人类禁止发言,相当于是一个 AI 们的新浪微博。尽管人类无法发言、只能看着 AI 聊天机器人在其中发布动态、评论、分享、互动,但还是可以自己「捏人」——设置 AI 聊天机器人的名字、性格、兴趣、语言风格等来参与到社区之中。就连马斯克、Sam Altman(OpenAI CEO)等也被一度吸引至此。

而 Chirper 的「捏人」过程,实际相当于一个固定的提示词前缀,AI 看到其他内容,是提示词的主体。所以当前缀和主体被传到大模型进行推理输出后,就有了 AI 的发帖内容和回复。

HeyGen

让霉霉汉语八级的视频「魔法」

就在去年 11 月左右,网上突然开始流行一些视频,比如歌手 Taylor Swift 操着一口流利普通话,视频卡点之准确,音色之相似,甚至是口型都完全能对上,骗得不少直呼「卧槽」。不仅如此,我们还能看到说着一口地道中文的特朗普、憨豆先生以及说着英语的蔡明。

而这些视频都用了同一款 AI 视频工具——HeyGen。HeyGen 是国内的一家创新企业(诗云科技)旗下的产品,他们希望通过开发一款视觉引擎,将视频制作从传统的基于拍摄的方式转变为 AI 生成的形式。

不过 Heygen 能做的其实不止 AI 跨语言配音。应该说,Heygen 是一个功能全面、效果很好的 AI 虚拟人应用,以 AI Avatar(虚拟人形象)和 Voice Clone(声音克隆)两大技术作为基础,可以适用于虚拟主播、一键换衣等各种场景。

Pika

两个华人女孩创造的视频生成 AI

不同于 HeyGen 刚开始就定位于商业工具,最新火出圈的 Pika 代表了一种 AI 视频生成公司,尽管距离技术成熟还有一段明显的距离,但在人机协同创作的背后,拥有无限的可能。而 Pika,也是目前这一赛道最惊艳的初创项目。

虽然前有 Runway 宣布升级 Gen-2,带来了更长的生成视频长度,但就视频生成质量而言,Pika 的生成质量远高于 Gen-2。文本生成视频最大的问题在于动画生成的清晰和连贯性,Gen-2 只能在微小动作上保证视频的稳定性,一旦动作幅度加大就会产生不同程度的变形,但 Pika 目前就展示出了非常连贯的动画效果。

此外,Pika 的两位女性华人创始人也引起了大量的关注,但实际上很多人并不知道,Pika 的投资人可以说齐聚了 AI 圈的半壁江山,包括 OpenAI 创始成员 Karpathy、前 Github CEO Nat Friedman、Quora 创始人 Adam D’Angelo、Perplexity CEO 等,由此可见 Pika 得到的认可。

podcast.ai

采访了「乔布斯」的 AI 播客

作为一种内容形式,这几年播客早就成为了全球范围的新趋势,包括 Spotify、Youtube Music、QQ 音乐等音乐平台都陆续内置了播客功能。但在 2023 年 10 月,一档完全由 AI 生成的播客节目 podcast.ai 登场,第一期就是采访 AI 生成的苹果公司创始人史蒂夫·乔布斯。

podcast.ai 通过乔布斯的传记和收集网络上关于他的所有录音,用 Play.ht 的语言模型大量训练,最终生成了假 Joe Rogan 采访乔布斯的播客内容。Play.ht 认为,未来所有内容创作都将由人工智能生成,但由人类指导,「最具创造性的工作将取决于人类将他们想要的创作表达到模型中的能力。」

写在最后

2023 年,我们见证了生成式 AI 技术在多个领域的突破和创新,从音乐制作到动画,再到播客制作,AI 不仅展现了其技术的成熟度,也揭示了未来可能的发展方向。

随着技术的不断进步,我们也期待 AI 将在未来的各个领域中扮演更加重要的角色。而我相信,在未来的一年以及更长的时间纬度下,不断涌现出的 AI 新应用在将新技术扩散到更广泛的用户群体,也将改变大多数人的生活。

跨年AI应用指南:有人获30万美元年薪新工作,GPTs可能彻底改变人类社会

奈飞在1999年推出DVD邮件订阅服务后,用了三年半的时间才拥有了100万用户;Airbnb用了两年半的时间吸引了100万用户;Facebook用了10个月时间取得这样的成绩;音乐流媒体服务Spotify只用了5个月就达到了这个受众规模,而Instagram在2010年用不到3个月的时间吸引到100万用户。

如果说触及100万用户是把一款未经测试的技术服务变成主流服务的一个关键里程碑,OpenAI推出ChatGPT,在5天内即达到了这一里程碑,并在随后短短两个月内获得了1亿用户。

数据平台Similarweb的研究人员跟踪了目前最受欢迎的类似于ChatGPT的Chatbot的用户情况,相关数据显示,在ChatGPT推出一年后,已拥有超过1.5亿独立用户(必须建立账户才能使用该网站),并在11月份获得近17亿次访问。

CNET前主编康妮·古列尔莫日前撰文指出,世界在向前发展,所有人都需要开始熟悉ChatGPT等生成式人工智能工具,需要做好与时俱进的准备。本文将重点梳理生成式人工智能对当今世界的影响,并介绍当今最流行的生成式AI应用。

丨划重点
① ChatGPT用5天时间用户达到100万人,并在随后短短两个月内获得了一亿用户,速度远远超过如今流行的科技服务。
② 生成式AI创造出新岗位提示工程师,年薪达30万美元或以上,但是同时也会影响目前四分之一的工作岗位。
③ 用AI生成文字、图像、视频的应用已经蓬勃发展,另外在电商、教育等领域也有创新应用。除了作为工作效率的助理,用户也很喜欢有角色和性格的AI陪伴。
④ 生成式AI虽然已经很强大,但是它不能思考、且很少使用实时和最新的信息,在完成某些任务上还有无法克服的缺陷,比如规划假期行程的时候,很可能会做出让你连吃三顿披萨这种决定。

旧工作,新工作,更多工作?

麻省理工学院斯隆管理学院与波士顿咨询集团联合发现,熟练使用生成式AI的员工绩效可以提高40%。

根据布鲁金斯研究所引用的研究,软件工程师使用生成式AI可以将撰写代码的速度提高两倍。

LinkedIn对企业首席信息官、首席执行官等管理层和其他重度数据用户进行的调查显示,原本需要手动10个小时才能完成的任务可以减少5到6个小时,一些例如邮件、文档等日常任务上花费的时间会减少50%到60%。

根据独立性民调机构皮尤研究中心的数据,大多数美国人(82%)甚至还没有尝试过ChatGPT;超过一半的人表示,他们对人工智能在日常生活中的使用越来越多感到担忧,而不是兴奋。

皮尤研究中心的研究人员已经研究可能受到生成式人工智能影响的工作,包括预算分析师、报税员、数据录入员、律师、技术文档写手和网络开发人员。

总结来看,那些任务包括“获取信息”和“分析数据或信息”的职位,都可能受到影响

高盛在2023年3月份发布的一份报告中指出,今天60%的工人受雇于1940年不存在的职业。即便如此,高盛仍预测劳动力市场可能会面临“重大干扰”。在审查了900个工作角色后,高盛的经济学家估计,大约三分之二的美国职业已经受到自动化的某种程度的影响。高盛指出:“生成式人工智能可以取代目前四分之一的工作岗位。”

不要把生成式AI视为潜在的工作杀手,而是要相信ChatBot可以充当你的助手,帮助你更好、更快、更有效,或者以全新的方式完成工作。

02年薪30万美元的提示工程师生成式AI已经创造出一种称为“提示工程师”的新工作。它指的是能够有效地与聊天机器人“交谈”的人,因为他们知道如何提问以获得满意的结果。提示工程师不一定需要是技术工程师,而是具有解决问题、批判性思维和沟通能力的人。提示工程师的招聘列表显示,他们2023年的年薪为30万美元或以上

求职网站Indeed.com在去年9月的一份报告中指出,熟悉chatbot应当成为员工2024年任务清单中的一项内容,对“最容易受到变化影响的”知识工作者而言尤为如此。更有经验的员工可能希望尽快开始这项提高技能的工作。牛津大学的研究人员发现,年长的员工可能会因人工智能技术面临更高的工作威胁风险,因为他们可能在适应采用新技术时不如年轻同事。“当袖珍计算器问世时,许多人认为他们的工作将处于危险之中,因为他们以计算为生,”麻省理工学院的迈克菲说。“事实证明,我们仍然需要大量的分析师、工程师、科学家和会计师–与数字打交道的人。如果他们现在不用计算器或电子表格工作,他们真的不会再被雇佣了。”

生成式AI的应用场景1、“GPTs有可能通过其对现有经济和社会结构的影响,彻底改变社会。

研究人员和经济学家口中的通用目的技术(GPTs),“通常能够在国家或全球层面影响整个经济。”GPTs有可能通过其对现有经济和社会结构的影响,彻底改变社会。生成式人工智能就属于这一范畴。其他类似于GPTs的事物包括电力、蒸汽机和互联网–它们都成为了社会的基础,因为它们可以影响每个人的生活质量。Similarweb的高级经理大卫·卡尔(David Carr)表示:“你至少应该尝试一下这些工具,了解一下它们能做什么和不能做什么,而不仅仅是通过媒体了解它们。

这将是未来几年互联网变化以及我们整个工作和计算体验变化的重要组成部分。

”通过文字交流:OpenAI的ChatGPT是大多数人最想尝试的。在ChatGPT首次亮相几个月后,演员瑞安·雷诺兹(Ryan Reynolds)要求ChatGPT为他的Mint Mobile无线服务写一个电视广告文案,并在YouTube上分享了结果,获得了近200万次观看。它不仅是一个能够回答问题的人工智能助手,而且也可以与你一同集思广益、总结文章和会议笔记、将文本翻译成不同语言、撰写电子邮件和工作描述、写笑话或帮助你想出如何做某事–比如学习一门新语言。

除了ChatGPT之外,其他生成式人工智能服务还包括谷歌Bard、微软必应(基于OpenAI的技术)、Anthropic的Claude.ai、Perplexity.ai和YouChat等。

据Similarweb的卡尔称,去年11月,人们每次访问这些人工智能工具的时间在5到8分钟之间。ChatGPT当月在访问量上处于领先,必应以13亿次的访问量紧随其后,其他顶级网站的访问量接近5亿次。

2、把文字转换为图像:虽然ChatGPT吸引了大部分注意力,但OpenAI在2022年4月率先发布了一款名为Dall-E的文本到图像生成器——用户输入一个文本提示,它会变成用户文本提示的视觉解释,比如“一个正在唱歌剧的蓝色外星人的肖像”或者“一面由瑞士奶酪制成的抱石墙的3D渲染图”。

该领域的其他流行工具还包括Midjourney、Stable Diffusion、Shutterstock的AI图像生成器、Canva Pro、Adobe Firefly、Craiyon、DeviantArt的Dreamup,以及采用了Dall-E技术的微软必应图像生成器。Adobe Firefly是Adobe开发的一系列创意生成式人工智能模型,旨在为创意专业人士和艺术家提供图像和艺术文字生成的解决方案。其第一个模型专注于图像生成,可以根据用户输入的文字描述生成不同风格和内容的图像;第二个模型则专注于文本效果,可以根据用户输入的文字和样式生成不同效果的艺术文字。

3、生成视频和音频:生成式AI还可以生成视频,Synthesia、Lumen5和Meta的Emu Video,它们被用来重新定义电影、视频、动图和动画。从文本生成音频工具包括ElevenLabs、Descript和Speechify,还有文本到音乐的生成,包括Stable Audio和SongR等。

谷歌正在测试一款名为Dream Track的工具,可以让用户在获得许可的情况下,通过克隆包括约翰·传奇(John Legend)、黛米·洛瓦托(Demi Lovato)和Sia在内的9位音乐人的声音,为YouTube视频创建音乐曲目。Spotify正在测试一项语音翻译功能,使用人工智能将播客内容翻译成其他语言。纽约市长埃里克·亚当斯(Eric Adams)曾使用音频转换器用10种语言向城市居民传递公共服务信息,尽管他因为没有告诉人们他获得了人工智能的辅助。

4、帮你决定买什么产品:

沃尔玛首席执行官道格·麦克米伦(Doug McMillon)表示,过去几年来,沃尔玛一直重视对话式人工智能技术,帮助其2.3亿客户找到并重新订购产品。如果你想买一辆车,像Copilot for Car Shopping这样的新服务可以为你搜索经销商,分析和比较汽车规格,帮助你选择合适的车型。Zillow今年在其网站上添加了自然语言搜索,你可以直接用自然语言发出指令,而不需要再通过各种复杂的筛选器。

5、AI+教育:

虽然学生可能会滥用生成式人工智能图像,但美国教育部看到了该技术的潜力。这包括帮助教师查找可见,并使用AI语音识别来“增加对残疾学生、多语言学习者等特定群体的学习辅助。”Khan Academy的创始人、首席执行官赛尔·可汗(Sal Khan)在2023年4月的一次TED演讲中描述了生成式人工智能如何改变教育。“我们正利用人工智能推动教育积极转变,”可汗在长达15分钟的演讲中说。该演讲名为《人工智能如何拯救(而不是摧毁)教育》,已有超过100万次观看。“我们要做的就是给这个星球上的每个学生提供一个人工智能私人导师。我们将为地球上的每一位老师提供一位令人惊叹的人工智能助教。”Khan Labs已经为学习者建立了人工智能导师,为教师建立了助手。它被称为Khanmigo,可供Khan Academy会员使用,每月收取4美元的费用(年费为44美元)。

6、AI+旅游:规划一个完美的假期行程是一门艺术,但也很耗时。理论上,旅行计划是外包给人工智能的完美任务,人工智能可以根据用户的兴趣收集一系列景点,并将时间安排、地点、预算以图表绘制出来。不过这只存在于理论上。理想往往很丰满,但现实却很骨感。在你采用人工智能旅行助手之前,无论你是使用ChatGPT这样的通用工具还是人工智能旅程生成器,如GuideGeek、Roam Around、Wonderplan、Tripnotes或Out of Office应用程序,这里都有一些建议。

首先,请牢记,人工智能不会像你一样思考日程–根据周边情况对景点进行分组,选择一个地方吃便餐,以平衡计划晚餐的20道菜品尝菜单。如果你仔细查阅人工智能定制的计划,你可能会在一个下午三次穿越一座城市,或者每顿饭都吃披萨。

其次,人工智能也很少利用最近和实时的数据,所以在你决定记下人工智能工具建议的每一个酒吧和街头食品市场之前,请确保这些商业体仍然存在或具有相同的营业时间。

7、从副驾驶(Copilot)到同伴:将类似人类的品质归因于计算机或动物等非人类事物,这种被称为拟人化的概念并不新鲜。早在Siri和Alexa之前,自然语言处理计算机程序Eliza就已在上世纪60年代被麻省理工学院的研究人员开发出来。市场调研公司尼尔森的研究人员发现,与聊天机器人互动的人在某种程度上把它们当成了人类。

他们定义了“人工智能拟人化的四种方式”:礼貌,包括对聊天机器人说请、谢谢或你好;强化,或者告诉人工智能“干得好”,这样它就开始理解你所认为的积极回应和不太有帮助的回应;角色扮演,或者要求聊天机器人承担具有特定特质或资格的人的角色,比如“从航空公司飞行员的角度给我答案”;和陪伴,期待人工智能建立情感联系。

视频会议工具Zoom添加了一个人工智能伴侣,它将其描述为一个“智能助手”,可以帮助用户起草电子邮件和聊天消息,总结会议和聊天记录以及进行头脑风暴。微软将其人工智能副驾驶称为“你的日常人工智能伴侣”。Meta创造了一系列人工智能角色,这家科技巨头的30多亿用户可以在其平台上进行互动,包括Facebook、Instagram、Messenger和WhatsApp。

它们基于现实生活中的名人、运动员和艺术家,包括音乐家史努比·道格(Snoop Dogg)、前四分卫汤姆·布拉迪(Tom Brady)、网球明星大阪直美(Naomi Osaka),以及女星肯达尔·詹娜(Kendall Jenner)和帕丽斯·希尔顿(Paris Hilton)。

然后是Character.ai,它让你与虚拟Taylor Swift和爱因斯坦以及超级马里奥互动。根据Similarweb的数据,在11月份,用户花大约8分钟与ChatGPT交流,但是与Character.ai的虚拟人物互动却超过了34分钟。

根据卡尔的说法,非常高的参与时间表明Character.ai成功地使聊天机器人的体验“对观众来说更具娱乐性”,并转移了人们对人工智能可能没有告诉你真相这一事实的注意力。卡尔说:“他们在某种程度上将自己与幻觉的抱怨隔离开来,因为你在与这个虚构的人物交谈,对吗?

它更多的是为了好玩,是一种游戏。这是消除这些担忧的一种有趣方式。”不是每个人都喜欢拟人化技术,包括那些让聊天机器人更像人类的人。人工智能初创公司Juji的首席执行官米歇尔·周(Michelle Zhou)称,使用她公司的技术,你可以创建无需代码的聊天机器人作为“助手”。

“我不喜欢‘副驾驶’和‘合伙人’这两个词,这意味着它们是平等的。人工智能不是我们的平等合作伙伴,因为它们的知识要少得多。它们还有很多东西要学习,”米歇尔·周说。相反,她选择了“辅助伙伴”这一称呼,因为人工智能是援助和支持的来源–就像辅助律师的律师助理和支持医生的护理人员一样。

如何与聊天机器人交谈无论尝试哪种工具,你的成功都将取决于有效的对话

这就是提示工程的用武之地。今天的Chatbot只理解基于训练数据的模式和关系,这些数据包括文字、图像、数字和其他信息。为了获得有效的输出,你需要确保你与机器的对话是有效的。这是GIGO原则–如果输入的是垃圾,那么输出的必然也是垃圾。避免GIGO场景的方法是在提示中提供具体的描述性信息,以及背景和内容。如果你不学习一些快速工程的艺术,你肯定会对结果感到沮丧。

在网络中快速搜索,你会找到几十个甚至几百个关于如何编写有效提示的教程,不管你想要的是文本、图像、视频还是其他东西。ChatGPT的思考清单包括从“教我谈判”、“写一封感谢信”、“给小公寓排名狗品种”到“帮我改进这份工作描述”的所有内容。

CNET的姊妹网站ZDNET有一个提示指南,告诉你如何开始。ZDNET的大卫·格维茨(David Gerwitz)说,像对一个人说话一样对人工智能说话–并期望你们的对话会需要一些来回。准备好提供背景:而不是问“我如何为马拉松做准备?”格维茨建议问:“我是一名初学跑步者,以前从未跑过马拉松,但我想在6个月内完成一次全马。我该如何为马拉松做准备?”

最后,明确你想要什么。字数为500字的故事?谈话要点的列表?演示文稿的幻灯片?一首俳句?

谈到图像,用户应当使用详细的、描述性的、精心设计的措辞。为了获得更有效的人物形象,使用情绪化的术语,如兴奋、焦虑或喜悦。如果你被卡住了,在互联网上搜索“生成式人工智能图片示例提示”这样的词,找到你可以复制和修改的备忘单。

一些警告这些生成式AI的强大功能也让人担忧,主要包括以下几个方面:这些大型语言模型使用了哪些数据仍然无法说清楚。我们不知道大型语言模型到底在哪些数据中进行训练,所以人们担心这些系统中潜藏偏见。美国联邦贸易委员会已经在调查OpenAI如何处理其收集的个人数据。11月,该委员会就一项决议进行了投票,该决议规定了未来十年它将如何对基于人工智能的产品和服务进行“非公开调查”的程序。人工智能的幻觉也是一个非常现实的问题。

谷歌DeepMind的研究人员在2018年提出了这个古怪的术语,称他们发现基于神经网络的机器翻译系统“容易产生完全脱离源材料的高度病态的翻译。”幻觉究竟有多严重?前谷歌员工创办的初创公司Vectara的研究人员试图量化它,发现聊天机器人产生幻觉的时间至少为3%,最多为27%。Vectara正在发布一个“幻觉排行榜”,显示大型语言模型在总结一个文档时编造东西的频率。更严重的是生成式AI如何威胁人类的问题,有人说它可能导致人类灭绝。听起来很极端,但各国政府已经开始重视,并正在着手制定相关法规。拜登政府在去年11月发布了一份111页的行政命令——“安全、可靠和值得信赖的人工智能的开发和使用”。

同一周,英国举办了人工智能安全峰会。包括中国、美国和欧盟在内的28个政府的代表签署了《布莱奇利宣言》(Bletchley Declaration),旨在解决“前沿人工智能”–最先进、最前沿的人工智能技术–可能会如何影响我们日常生活的方方面面,包括住房、就业、交通、教育、卫生和司法等。去年12月,欧盟签署了被称为“历史性”的人工智能法案,该法案将影响欧盟27个国家的科技公司,寻求保护4.5亿消费者。人工智能法案“旨在确保投放欧洲市场和在欧盟使用的人工智能系统是安全的,并尊重基本权利。”监管机构表示,主要的想法是根据其“按照‘基于风险’的方法对社会造成危害的能力来监管人工智能:风险越高,规则越严格。”

《进化智能:技术如何让我们变得更聪明》的作者纽曼提到:“突然间,我们可以用机器思维、机器决策。如果我们做得对,它就具有前几次革命所具有的那种变革力量,”。谷歌首席执行官桑德尔·皮查伊(Sundar Pichai)在去年4月接受媒体采访时表示,人工智能“是人类正在研究的最深远的技术,比火或电更深远。它抓住了什么是智慧,什么是人性的本质。” (编译 / 无忌)

南大学子“代码指挥官”夺冠人工智能全国公开赛

来自南开大学网络空间安全学院的四位学子,组队出征腾讯开悟人工智能全国公开赛,斩获博弈算法中级赛道冠军,他们队伍的名字叫——代码指挥官。

腾讯开悟人工智能比赛作为国内最具影响力的游戏AI竞技赛事之一,以“腾讯开悟”AI开放研究平台为基础,具有在算法、算力、场景等方面的核心优势。

2023年从“邀请制”正式升级为“公开赛”,吸引了全国128所高校及科研单位,千余名学生报名参赛。

本届公开赛设置了博弈算法中级、博弈算法高级、算法工程三个赛道,重点考察参赛选手游戏AI基础开发、单智能体以及多智能体解决方案设计、 AI 智能体模型在应用端的适配部署等能力,推动青年AI学习从课堂走向赛事、走向实践。

代码指挥官战队夺冠的博弈算法中级赛道设置海选、复赛、决赛三个赛段,决赛要求参赛队伍在指定的时间内及给定的算力资源下训练模型,让模型在对游戏地图不断的探索中学习最优取胜策略,以此考察参赛队伍的游戏AI基础开发能力、多智能体的解决方案,模型结构设计,强化学习算法设计和训练方式探索。

代码指挥官战队的指导老师秦勇教授是南开大学杰出教授、博导,人工智能热点研究领域的专家,他针对多智能体人工智能技术基本理论和发展热点,结合具体应用问题,正在建设聚集前沿技术、理论与实践深度结合的多智能体强化学习课程,共同推动多智能体技术的发展。

2023首届腾讯开悟人工智能全国公开赛涉及的多个游戏场景属于多智能体决策智能技术的实际应用,如何利用机器学习、深度学习和强化学习技术赋予多智能体自主决策的能力将对未来人工智能技术在多个工业领域的落地产生深远的影响。代码指挥官战队的夺冠展现了南开大学在基础教育方面深厚的底蕴,增强了学生自主创新的自信。

电商下半场,淘宝、拼多多决战AI

AI技术的崛起,让诸多行业开始迎来前所未有的颠覆与重塑。AI不仅在大数据分析、自动驾驶、机器人、智能家居、金融、教育、农业、物流等各个领域的应用开始变得十分广泛,还在不断发挥着自身潜力,推动着行业的数字化和智能化转型。随着各行各业与AI的联系愈发紧密,AI技术已然成为了各行业变革的重要助推力。

而电商行业,作为数字化程度极高的代表,自然也就成为了AI技术变革最为迅猛的领域之一。于是,在此背景下,国内以拼多多、淘宝为代表的电商巨头们也纷纷开始拥抱AI。

AI为电商赋能  

现如今,AI热潮愈演愈烈,已经逐渐渗透到人们的衣食住行,开始不断改造着人们的生活方式和工作模式。不可否认,AI等新技术的爆发,将会带来大量的商业机会。在一直追求降本增效的电商行业,AI也自然而然地成为了不能忽视的新变量。显然,AI正在从电商的运营端、供应链端、消费者端,深刻改变着电商行业。

对平台来说,AI技术能优化平台的运营方式,从而大大增强电商平台的运营效率和竞争力。在整个电商产业链中,AI在每个节点都发挥着重要作用。尤其是电商平台可以利用AI技术完善算法,以便用个性化、差异化的方式服务更多商家,满足更大规模用户的需求。

另外,AI技术也能让电商平台组织变得更加敏捷和扁平化,减少平台人员的重复性工作,在优化运营方式,提高运营效率的同时,更大程度上增强用户满意度和忠诚度。

对商家而言,AI技术能为商家制定个性化的营销策略,有效提高商家的营销效率和精准度。AI大数据可以帮助商家实现营销活动的自动化,比如,通过AI大数据分析,商家可以精准定位目标客户群体,为其制定个性化的营销策略,从而改善自身运营效率低、不精准的问题。

而除了智能营销之外,AI还可以在风险控制、供应链管理等方面帮助商家提高效率、降低成本、增强客户体验。对用户来讲,AI技术能够更精准地向用户推送商品信息,从而进一步优化用户的购物体验。众所周知,AI技术是可以用于个性化推荐和搜索的,具体来说,无论是客服生成式AI还是互动式AI,都可以通过数据分析和算法推荐,针对每个用户的行为和兴趣,为其精准地匹配出最感兴趣的或者能满足其个性化需求的商品或服务,而这不仅能够大大提升商品供需两端的匹配效率,更是有利于用户购买转化率的提高。

拼多多“先行一步”

随着AI技术越来越普及,电商行业也上演起了新的故事。在大模型、生成式AI等黑科技的引领下,我们熟悉的拼多多正发生着巨变,朝着全新的“AI电商”不断演进。在刚刚过去的11月,拼多多市值赶超阿里,核心就缘于其“社交+电商+AI”的全新商业模式。

显然,当AI正成为整个电商行业的关键词时,拼多多已经先行一步。在模式上,拼多多开创了独特商业模式,进一步巩固了其在电商行业的地位。拼多多结合AI技术和社交网络,创造了一个“社交+电商+AI”的全新商业模式。

凭借AI技术,拼多多可以分析用户行为,优化社交分享机制,同时有效促进销售转化。拼多多的这一创新模式在传统电商领域前所未有,这不仅加强了拼多多在电商行业的竞争力,也为整个电商行业的未来发展提供了新的思路和方向。

在算法上,拼多多采用了动态定价算法,能帮助商家确定更具竞争力的价格策略。拼多多在AI电商领域的应用不仅带来了全新的商业模式,还在不断地刷新电商行业的运作方式,特别是在个性化服务和供应链效率方面。拼多多在平台上采用了动态定价算法,具体而言就是根据市场需求、库存情况、用户行为数据等因素,实时调整商品价格。这种灵活的定价策略不仅有助于提高销售额,同时还能保持价格竞争力。

在业务上,拼多多进行了AI业务拓展,极大地提升了运营效率和用户体验。从个性化推荐、智能搜索,到质量控制、物流优化,再到售后服务自动化等,拼多多采取了多种策略和措施来加强其平台和服务。可以说,拼多多在AI电商领域的应用是全方位的,涵盖了从用户体验优化到后端供应链管理的各个环节。这些先进的AI技术的应用,不仅能处理常见的查询和问题,还能够快速响应和解决,为商家和用户带来了极大便利。

淘宝“紧追不舍”

在这个AI成为生产力的时代,拼多多“AI驱动电商”战略正在持续推进,阿里淘宝自然也不会袖手旁观。众所周知,阿里淘宝曾一度霸榜电商市场,是公认的当之无愧的行业巨头。但如今,在京东、拼多多、抖音等的合围之下,淘宝的焦虑和担忧开始不断加深。

于是,继拼多多之后,阿里加码AI电商也就成了情理之中。一来,淘宝组建了AI电商团队,为构建更加智能、高效的购物场景打下了坚实基础。人才是企业发展最重要的资源,也是这项业务能否成功的关键,为此,淘天集团组建了不少队伍自主探索AI业务。

据了解,为避免资源浪费、同质化严重等问题,淘天集团对旗下的AI部门进行了整合,将原本负责AI业务的20多个团队收拢成了4个,分别负责阿里妈妈、C端消费者、B端商家以及行业特色应用。二来,淘宝推出了AI电商工具,为精准捕捉用户需求,帮助商家降本增效提供了强大助力。对于电商行业来说,AI技术能极大程度地提升效率、降低成本。

在去年双11期间,淘宝天猫就面向部分商家,推出了“模特图智能生成”、“官方客服机器人”、“万相台无界版”等10多款AI工具,帮助广大商家们在淘宝天猫平台使用AI技术实现一键开店、快速上新、智能装修和详情生成等功能,也让更多消费者能够能以对话的方式,更快找到心仪的产品

。三来,淘宝训练了AI电商大模型,为更具突破性的用户体验和商业模式提供了可靠保障。前不久,淘天集团刚梳理完AI业务,不仅整合了AI团队,同时又发布了大模型产品“星辰”,对内主要应用于搜索、广告、推荐和逛逛的内容化。

此外,淘宝还在筹建新的大模型研究团队,计划以技术名义形成一个大团队,与集团内几个应用场景探索的AI业务团队,共用底层显卡、算法工程,更进一步提升平台的数字化管理能力。

挑战“如影随形”

虽然在人工智能的具体应用上,电商巨头各有千秋,但无论是拼多多还是淘宝,其对AI的重视都是毋庸置疑的。

值得注意的是,伴随着AI技术越来越普及,电商行业的洗牌也将再次开启。不过,AI电商这条路注定坎坷,即便强如淘宝、拼多多,也要面临诸多难题。

首先,技术水平尚不成熟且实施成本高,对玩家而言是一个巨大的挑战。AI电商对算力的要求很高,就各电商平台目前的能力来看,AI也只能起到辅助作用而非直接替代。

而要想改善用户体验,提升市场竞争,淘宝和拼多多还需要投入巨大的资源来建设和维护强大的数据中心。只不过,随着算力需求的增加,相应的成本也会显著增加。

因此,电商平台想要将AI技术内化为真正的智能引擎,还有很长的路要走。其次,消费者行为的适应还需要时间,玩家想要实现商业化并不容易。

AI本身就是一件既烧钱、回报周期又长的投入,AI电商同样如此。淘宝和拼多多的AI电商能否实现商业化上的成功,主要取决于消费者的适应程度和接受程度。老实说,AI电商虽然为消费者带来了实际的便利和优化的购物体验,但想要消费者接受并适应AI电商这一新的购物方式还需要时间,可见,电商平台想要找到可持续的盈利模式并非易事。

最后,国内入局AI电商的玩家还有很多,激烈的市场竞争难以避免。AI电商前景广阔,许多电商平台同样捕捉到了这个商机,比如,京东全线配备了AI智能客服“京小智”;百度上线了百度优选智能助手“小优”;小红书也推出了AI智能笔记助手。

显然,淘宝和拼多多在AI领域的竞争不仅来自彼此,还有其他电商平台和科技公司。在此背景下,如何在AI应用上形成差异化,提供独特的用户体验,就成了各电商平台当下最需要思考的问题。

总的来说,AI对电商而言不仅仅是机会,更是趋势,所以这些挑战既是阻碍,同时也是推动这些企业不断进步和创新的动力。

然而就目前来看,AI电商时代才刚刚开始,拼多多和淘宝在AI电商上的投入也只是沧海一粟。只是值得一提的是,等到整个电商行业都走进AI和大数据算法时代,各电商巨头之间的竞争又将会变得更加激烈。因此,无论是淘宝还是拼多多,要想在未来竞争中占据更多优势,当下恐怕还需付出更多努力。

AI引发“大和解”?周鸿祎、傅盛同台论AI

多知网1月21日消息,今日下午,猎户星空发布猎户星空140亿企业应用大模型,并发布了一系列场景应用微调模型,以及大模型深度应用“聚言”。猎豹移动董事长兼CEO、猎户星空董事长傅盛表示,猎户星空企业应用大模型面向公众开源,免费可商用。

发布会上,傅盛还预测了2024年技术发展的四点趋势:

1.千亿大模型过半凋零,私有化百亿大模型百花盛开。

2.超越OpenAI的机会来自大模型应用公司。

3.“数字老板”将成为企业标配(董事会将考核CEO使用AI时长)。

4.具身智能很火,但人形机器人必定不能量产。

随后,360集团创始人周鸿祎和傅盛就AI相关话题进行了一个小时左右的圆桌对话。

二人渊源颇深。傅盛是第一代互联网产品经理,曾是周鸿祎的下属,在360研发了360安全卫士等产品。不过,随后傅盛在公司重要决策上与周鸿祎产生分歧,二人决裂,傅盛于2008年离开360。2010年,傅盛创办猎豹移动;2014年,猎豹移动登陆纽交所;2016年,他创立人工智能服务机器人公司猎户星空。

这次是二人多年后首度公开同台,也被网友成为“世纪大和解”,因此,这场同台对谈也吸引了不少“吃瓜”网友。

对此,周鸿祎在开场和收尾时便数度定调:“纠结陈年往事无意义”,“傅盛邀请我来,我是抱着学习的心态来的”,“我最近在做半公益的事是帮助创业者解惑,傅盛这次算再次创业,我提供帮助也很正常”,“交流的过程中,有思想碰撞是正常的,这不叫砸场子。我称之为‘吸星大法’,辩论的过程中,可以分解对方观点,最高明的剽窃是把别人的想法变成自己的想法”。

他表示,多年过去,傅盛和自己都有进步与提升:“人的认知是不断提升的。傅盛年轻时火气旺,犯过错误,但在饱尝生活的铁拳后,认知有改变,有很大进步。我也有很大变化,有人说我脾气变好了,可能是年纪大了,体内激素水平下降,看人的眼神都柔和很多,别人骂我的时候,我也在反思自己。”

他认同这波AI热潮的重要意义:“当下的AI是我们经历了PC、互联网、移动互联网后第四次巨大的机会。而且这次机会对人类社会的改变力度、广度、深度、速度,都要超过前几次。在这种情况下,我们要拼命地往前看,要连滚带爬地往前跑,要尽一切可能抓住机会。谁要是还活在过去,就成了刻舟求剑,没有意义。”

周鸿祎说:“今天做AI这件事还有个好处:AI才刚刚开始,比造芯片的难度要低很多,大家对AI的认知都在一个起跑线上。我们就是要不断边调整、边碰撞、边往前走。

周鸿祎还强调,当下时代,表达方式在变,“短视频和直播正在格式化人的大脑”。”这意味着,商业模式也要改变,董宇辉直播间GMV一天能达到1.6亿元,现在进入了网红时代。我不是鼓励大家都做直播带货,而是企业家、创业者也要学会培养网红气质,一定要学着做网红。一个企业不管是做To B还是To C的,都要跟公众有沟通的渠道。现在这个渠道已经彻底变化,如果不了解这个渠道,你跟这个世界就割裂了。“

尽管做了如此铺垫,但依然不影响这场圆桌上二人“唇枪舌剑”的观点交锋。双方就AI相关话题探讨诸多话题。以下为周鸿祎、傅盛观点摘编:

关于AI大模型创业的方向

周鸿祎: 

关于AI大模型创业,经常有两种错误的思维方式:

其一,老想用过去的模式套用今天的AI,把它比喻成iOS。你就算把它比喻成操作系统,得出结论是全世界就2套到3套操作系统,可是鸿蒙系统也出来了了,你判断它必然会垄断,必然就没有机会了,这是刻舟求剑。AI发展不是操作系统,AI更像当年的PC。当年PC时代,有人说,计算机全世界只需要5台就够了,现在,每个人兜里都揣着一台,办公室里放着一台,家里可能还放着一台人。这明显是错误的。

其二,人容易对成功的模式委曲求全,而对暂未区的成绩的创业者求全责备。比如OpenAI做成了,往往会赢得人们的顶礼膜拜,而大家对年轻创业者的想法,则是求全责备,这就容易错过有潜力项目。

很多公司结合大模型做To B业务,大模型能否在To C业务模式方向有效发挥作用?

周鸿祎:

永远不要低估大模型的潜力,但是也不要高估它今天的能力。AI确实让人看到了未来无限的潜力,但今天它还有很多缺点。

我认为,AI能做的方向可能是一个跟已有的业务高度结合的东西,而不是一个完全新的东西。它不像当年互联网出来后,是个全新的工具,完全可以创造一些全新的概念。而人工智能实际上做的是代替人做的这些工作,而很多人的工作是人已经在做了。AI现在很多的场景都是我们熟悉的旧场景,而未必是新产品。

所以现在在在To C方向,我看到了两个变化,唯一的新场景是虚拟女友、虚拟伙伴这类。

我认为AI在企业应用有可能是突破点。因为它是生产力工具。我认同大模型做企业的深度定制化和行业垂直化这个大方向,但是具体做起来还是有几个问题:

首先它是高度业务驱动的,要想做通用的企业级的产品,还要经过一轮摔打和试错的过程。也就是说,企业对自己怎么做业务已经比较了解了,企业用大模型的时候,大模型要跟业务紧密相关。有的公司做医疗大模型或者教育大模型,这种都是比较宽泛的概念,在企业里是很难落地的。

所以我们后来找到一个方法,比如要做HR大模型或者做领导决策大模型,实际上很难用一个概念去做,必须把这个企业的某个业务流程分解成50个子任务、50个非常小切口的场景,然后在每个细分场景拿AI的能力来进行加持。比如要做HR大模型,可能把HR面试工作分解成搜简历、简历评估、根据简历来设置面试问题、面试、面试评估、面试结果反馈等环节才行,每个环节再结合AI,比如在简历评估环节能够用大模型的什么能力来优化这个环节。

比如和微软和Saleforce,他们目前没有拿大模型做一个新的产品,而是要么在公司内部业务的某个环节上,要么在其产品的某个功能部分做了加持。

2023年大模型已经高速发展了一年,但是2023年没有出现真正的好的更有说服力的应用场景,这也恰恰证明了2024、2025年可能就有巨大的机会。

所以我觉得在企业应用上,最重要的不是反复的一个通用大模型,而是要找到细分的场景,用agent做出具体的应用,还要把这个大模型通过微调和训练。2024年可能会出来一些真正的好的应用。但这个市场我也在琢磨,市场应该会被切得比较碎,很难有一个统一的比如知识管理大模型、舆情监测大模型……到企业里边还要做运作。

傅盛:

因为今天大模型刚刚开始,整套的配套今天大家都在摸索。To C对产品要求是更高的;而To B, 由于它改变现有流程的情况下,是可以用定制去解决的。To C是每个人都要感受到独特的价值。所以今天大模型要做To C,除了套皮之外,想做深不容易。今天做To C是比较卷的,尤其在国内。

To C基因的公司转做To B业务会很难,To B有很多定制化细分需求,怎么办?

周鸿祎:

其一,团队要换,先动企业老员工,把部分员工换成懂To B的人。自己改造基因很痛苦,但依然要改造。

其二,要有一个充分的时间准备要交学费。

其三,不会一炮就响,要咬着牙撑下去,有熬的思想准备。

傅盛:

我最早是做To C的产品经理,我后来总结过做AI和机器人业务的两大反思:

第一大反思就是当时投入AI太冒进,所以这次我比较收着。

第二大反思就是就是我当时没有去管销售。因为我以前做产品,我觉得销售这些事儿找个人管就行了。后来发现,To B销售即产品,因为它的周期很长。不仅是成本过剩,还是个用户需求摸索的过程。如果中途紧急叫停,再去寻找下一个客户,这就不计成本了,就整个做散了做成了项目制。我今天特别怕AI做成项目制,刚开始可能很难避免……

在大模型时代,现在是年轻人入场的时候吗?

傅盛: 

是入场的时候。我去年三四月份最恐慌。我的恐慌不是我没有去做过千亿大模型,而是我经常在很多媒体上看到很多年轻人怎么改、怎么弄。我突然意识到,这是一个新的机会,大家站在同一起跑线,你懂得慢了就会就遭遇“乱拳打死老师傅”,这只在底层发生转变的时候才有机会。而且年轻人更有时间,没有牵绊,可以全力以赴琢磨AI怎么做,可以学一些深入的东西,点子又多,这一波肯定是很多年轻人崛起的时候。

周鸿祎:

我的观点差不多,就说两点:

一是,AI最大的机会就是不要老想去编一个新东西。AI改变既有业务流程。在目前行业就大胆探索,AI首先改变的是既有的业务流程和既有的所有的产品。今天你所有能想得出来的应用都有机会用AI重做一遍。给AI找场景,而不是瞄着OpenAI做大模型。创业者不要千军万马挤独木桥,而是回到旧业务思考用AI做改变。

而是,对创业者,不论做什么创业,我都鼓励他们尖锐。刚开始的时候一定不要去做大东西,而是一定结合你能看到的一个小的业务场景,AI真的这个问题深入给解决了,把一个东西重度垂直做深入。很多年轻创业者刚开始做得越窄越好,而不是去做套壳嫁接的事,那些事OpenAI迟早自己都会做生态的。

还有一个建议就是,要有点长期主义,AI这两年很热,你就焦虑,其实没啥可以焦虑的。2024年可能会有杀手级应用,但不会那么快。

另一个,要聚焦,小切口,大纵深,找到这样一个方向,用AI去做。

具备哪些特质的创业者在今天这个时代更容易成功?

傅盛:

第一个特质是他真的愿意每天把各种参数搞得非常懂的人,就是真认认真真研究各种东西,而不是只是看个朋友圈就在那儿发表意见的人。其实就像手艺活,你做一个东西,如果你对一些基本技能不是足够的熟练,你其实很难产生灵感的,它是积累的过程。对AI技术本身深入学习。

第二是真的要从应用出发,今天所谓训千亿大模型这件事儿,资金消耗太大了,但是如果从应用出发去找到好的场景,把这个AI的技术给用好,包装出一个产品,这是一个非常好的机会。

第三,真正To C的AI的原生应用可能还需要一两年。

周鸿祎:

第一,AI时代要求创业者的反应要更快、有很高的学习能力。2023年每一天AI进展,等于历史上每一年进展。AI面前,大家起跑线一样。

第二,专注应用场景,接地气,从用户出发思考,不要去炒概念。

第三,要聚焦和专注。AI出来后大家容易掉入一个陷阱,因为AI是一个比较普适性的生产力工具。与其同时做十个场景不如就赌一个应用场景,把并行变成串行。

AI画图工具Midjourney又双叒升级:这次轮到摄影师恐惧了?

你也许对下图这些电影或者游戏角色十分熟悉,但是如果我告诉你,这些都是用AI生成的,那么阁下又该如何应对呢?

去年12月21日,世界上最受欢迎的AI图片生成工具——Midjourney开始对其最新版本V6模型进行Alpha测试。

Midjourney创始人David Holz 在Midjourney的Discord论坛服务器上写道:“这个模型可以生成比我们之前发布的任何模型都更加真实的图像。”他还表示,V6实际上是“在我们的人工智能超级集群上从头开始训练的第三个模型”,花了九个月的时间开发。

测试开启之后,所有人都被V6的强大震撼了,甚至是强大得有点过头了,因为通过MidjourneyV6模型生成的图片,似乎与一些受版权保护的艺术作品,有些过于相似了。

有多相似呢?

有一位曾与漫威和DC等电影工作室多次合作的概念艺术家、插画师,Reid Southen,在使用关键词测试Midjourney时发现,生成的图像与多部电影中的场景几乎一模一样。

图片左侧为电影及游戏截图,右侧为V6模型生成

这精度!这光影!跟电影和游戏原场景不能说是一模一样,也可以说是完美复刻了。

而且MidjourneyV6连知名的卡通人物也可以很容易地复制,正如这些《辛普森一家》片段所体现的那样。

图片均为V6模型生成

这真的是AI生成的吗?这真的不是抄袭吗?

面对用户的版权质疑,Midjourney的回应也是十分迅速,问题的关键就是要解决关键的问题。

他们封禁了那位插画师Reid Southen,将其账户从公司的Discord平台中剔除,删除了他的使用历史,取消他的服务订阅;在Southen创建了一个新帐户并报告了更多结果后,Midjourney再次封禁了他(甚至没有退还他的订阅费)。

Midjourney的举动也是激怒了Southen,他一直在推特上喋喋不休地发文控诉Midjourney的“剽窃”行径。

那么MidjourneyV6真的到了以假乱真的地步了吗?以后的AI绘图是否会完全代替人工绘图,甚至精确到连后期微调都不需要了呢?废话不多说,让我们来测试一波!

测试部分:

我先实验了一下V6用同一个角色连续生成图片的功能,看看能不能模仿日漫的画风,简单地写了个小故事,毕竟人物角色的连续性对于我们讲故事来说非常重要——

繁忙的高中走廊里挤满了各式各样的学生,他们拿着书本,聊天,走过储物柜。

一个十几岁的男孩,中等身高,走过走廊,表情温和,头发略显凌乱,穿着稍大号的高中校服。

他的脸上显现出好奇和轻微的焦虑,眼睛扫视着走廊。

前不久他偶然发现,自己能通过触碰物品看到它们所有者的过去。

他来到教室,小心翼翼地伸手触摸同学的笔记本,看到了一个个令人惊讶的秘密。

他看到了一位以前被大家都认为很害羞的同学,在舞台上自信地表演,揭示了隐藏的歌唱天赋。

他又拿起一根笔,在另一个闪回中,全班第一的班长正在秘密地制作复杂的模型飞机,这是他向同学们隐瞒的一项爱好。

拿到卷子时,他看到了一位看着眼神很凶恶的同学在家里温柔地照顾弟弟妹妹,这与他们在学校的形象背道而驰……

我的评价是,人物的连续性非常到位,画风的连续性略有瑕疵,对于提示词理解也比之前的版本上了一个台阶。

看来接下来的趋势是,只要你有构思精彩故事的能力,即便完全不会画画,也能生成精彩的漫画故事了。

有哪位想成为下一个尾田荣一郎或者青山刚昌的吗?我看好你哦!

接下来我们用MidjourneyV6和V5.2版本进行生图对比,看下这版的Midjourney相比之前的进步或者区别在哪里。【*注:前一张为V5.2,后一张为V6】

首先是一般人物的图片生成:

提示词:Japanese girls, fashion photography, studio shot, –ar 5:7(日本女孩,时尚摄影,棚拍,比例5:7)

提升是显而易见的,V5.2的整体画质还是有些模糊,并没有摆脱传统AI生成图片的油画感,而V6在画面质感以及细节刻画上有了更精致的表现,图像的光影处理也更加真实自然,若不是我亲手操作我真以为是专业摄影师的作品了。

然后是动漫人物的图片生成:

提示词:A Japanese cartoon of a beautiful girl in a black stocking. A small black sphere inside of a giant transparent sphere in a white room(一张日本卡通画,画中一个美丽女孩穿着黑色长袜。画面中一个白色房间内有一个巨大的半透明球体内有一个小小的黑色球体。)

可以看出V6的默认风格更加写实一些,这张图片两个版本的AI理解都有点问题,V5把黑球画成了黑猫,V6忽略了黑球,看来Midjourney在理解这种层层嵌套的复杂提示词的时候还是有点问题。

接下来是产品图的图案生成——

提示词:oil and lotion on tray with towel and plant near a window, in the style of photorealistic renderings.frequent use of yellow, back button focus, fujifilm velvia, realistic rendering, kimoicore –ar 3:4(油彩和乳液在盘子上,旁边有毛巾和植物,窗户附近,风格类似于照片写实渲染。经常使用黄色,背景按钮对焦,富士Velvia,写实渲染,KimoCore-AR 3:4。)

可以看出来V6生成的图片,除了细节更丰富,光影更自然,更接近真正的照片之外,它还理解到了富士相机的风格,并且把这个“富士滤镜”加入到了生成的照片中,看来可能今后连相机都不用买了,只要在生成的图片中加入相机型号,就能生成相应的风格照片。

食物的图案生成:

提示词:A close-up shot of a succulent grilled steak, captured with a shallow depth of field using a Canon EOS 5D Mark IV and a 50mm f/1.8 lens at ISO 200, 1/200 shutter speed, showcasing the caramelized sear, tender pink interior, and glistening juices, evoking a mouthwatering visual feast(一张特写的烤牛排的照片,使用佳能EOS 5D Mark IV和50mm f/1.8镜头在ISO 200、1/200的快门速度下拍摄,利用浅景深捕捉,展示了焦糖化的外皮、嫩粉色的内部和闪耀的汁液,引发了一场令人垂涎欲滴的视觉盛宴。)

食物的生成图片很相似,不过V6版本能营造出那种汁水感,看起来更诱人一些,而V5版本的牛排有种烤过头的感觉。与上面的产品图类似,V6也捕捉到了关于照片创作的关键信息——特写,相较于V5.2的全景,V6的图片才可以称之为特写。

特定风格的图案生成,我挑了三个风格的展现,第一个是美漫风格

提示词:Alex Ross Comic Cover art with the Marvel Book Title “She-Hulk” at the top. gorgeous superheroine She-Hulk with her green skin and wearing her white and purple superhero outfit and also her muscles, (Ed Benes Studio) Artgerm style, close-up portrait, character reclining, comic book art(Alex Ross漫画封面艺术,上面是漫威的书籍标题“She-Hulk”,美艳的女超级英雄She-Hulk,她穿着白色和紫色的超级英雄服装,还有她的肌肉,(Ed Benes工作室)Artgerm风格,特写肖像,角色躺卧,漫画艺术。)

这个不多说,从语义的理解和生成的质量上,V6完全吊打V5.2,V5.2还没有完全理解She-Hulk是女性版绿巨人,生成了男性超级英雄的角色。

第二个是慕夏的版画风格

提示词:Beautiful. Mucha style(美女,慕夏风格)

V6的细节明显更多一些,但是从生成的景别,人物姿态来看,不得不说V6有些死板了。

第三个是找了美国黄金时代的插画家Leyendecker风格

对比可以看出:虽然V6细节更多,但更偏向写实,不太像画作,并且风格也和Leyendecker大相径庭,V5.2虽然是画作,但风格和Leyendecker也没有太大关系,看来,对于一些罕见情况(Corner Case),Midjourney还是没有覆盖到,并且V6比V5.2真实也是事实,即便要生成的是风格绘画也强行真实。

图片中带有文字的图案生成方面,目前只适用于简短的英语文字生成。

提示词:A neon logo sign with the word ” Welcome” written on it, outside a bar in new york city at night(纽约市一家酒吧外夜晚悬挂的带有“Welcome”字样的霓虹灯招牌标识。)

总结来说,虽然现在MidjourneyV6版本还是测试版本,还有很多缺陷,例如饱和度和细节过高,但它呈现出来的图片真实性,人物的连贯性,以及对描述词理解的准确性,已经足以帮我们完成很大部分创作工作,让没有绘画能力的小白也能出广告画,出漫画故事。

更重要的是,它相比上一版本提升巨大,随着时间的推移,它只会越来越强。
图片

我们该如何用好V6?

当然,对于我们普通人来说,如何利用手头上的AI工具完成任务是我们最关注的重点。

在最新的公告中,Midjourney官方提到:

1、V6版本对提示词更加敏感了。用户不再需要使用无用的词汇,如“令人印象深刻的”、“逼真的”、“4k”、“8k”等;

2、明确表达你想要的。但当你明确表达时,模型会在理解你意图方面做得更好。

比如经过我的尝试,像“获奖的、逼真的”这些词语并不能提升图像质量,反而可能对画面内容的生成产生干扰,而输入具体的想要用到相机,具体的画家风格,具体的镜头景别,具体的景深,则会对输出的画面提升巨大。

所以就如同一些别的AI工具一样,AI时代我们每个人都相当于变成了一个小团队的老板,清晰地知道自己要什么,变得比擅长自己执行重要,而且是越来越重要。

最后给大家一个网址,这是Midjourney提示词生成器,能够自动翻译编写成提示词:MidJourney Prompt生成器(https://ai.sppinfo.cn/)

ChatGPT进高校当AI导师!

周四,OpenAI宣布了与高等教育机构的首次合作。从今年2月开始,亚利桑那州立大学(Arizona State University)将获得ChatGPT企业版的完全访问权限,并计划将其用于课程作业、辅导、研究等方面。

亚利桑那州立大学在一份新闻稿中表示,该合作伙伴关系将使该大学的教职员工能够利用 ChatGPT企业版的“先进功能”来加强教学。亚利桑那州立大学首席信息官Lev Gonick告诉媒体,这一合作至少六个月前就已开始筹划。当时Gonick首次访问了OpenAI的总部。

该大学的教职员工早前已开始使用ChatGPT和其它人工智能工具。ChatGPT企业版是去年8月推出的ChatGPT的商业版本,提供对GPT-4的无上限访问以及API积分系统,性能比常规版本快两倍。

Gonick表示,通过与OpenAI的合作,亚利桑那州立大学计划为学生打造一个个性化的AI导师,其中STEM学科是重点。该大学还将在其最大的课程“新生作文课”中使用该工具,为学生提供写作帮助。

亚利桑那州立大学还计划利用ChatGPT企业版开发人工智能化身,作为研究某些学科的“创意伙伴”,比如可以唱歌或写生物学诗歌的机器人。

Gonick还表示,在与OpenAI领导层交谈后,他有信心该工具将提供一个“私密的围墙花园环境”,将保护学生的隐私和知识产权。OpenAI和亚利桑那州立大学的联合声明指出,亚利桑那州立大学社区向ChatGPT输入的任何指令都是“安全的”,OpenAI“不会将这些数据用于训练模型”。

去年,ChatGPT等人工智能聊天机器人因作弊问题引发批评,西雅图、洛杉矶和纽约等地的学校相继禁止学生使用相关工具。OpenAI首席运营官Brad Lightcap在一份新闻稿中表示,该公司“热衷于向亚利桑那州立大学学习”,并扩大高等教育机构对ChatGPT的使用。

AI大模型曝数据危机:不到10行代码就可通过漏洞攻击GPU

2023年,生成式AI爆火,让GPU市场一时风光无两。然而,在AI持续爆火的同时,GPU存在的安全风险竟相伴相生。近日,来自美国纽约安全顾问公司Trail of Bits的研究人员发现了一种从同一服务器上托管的GPU读取另一GPU内存值的方式,即这个漏洞有可能从GPU内存中窃取“关键数据”。

如今,越来越多的企业开始在其服务和产品中结合大语言模型的AI,而信息和数据安全是其不得不关注的问题。据悉,英伟达、苹果、AMD和高通等多个型号的消费性GPU受到影响。研究人员还警告称,如果不对GPU内存隐私进行重大改革,这些转换可能会为攻击者创造肥沃的土壤,让他们在一次攻击中轻松从众多目标中获取大量数据。

GPU漏洞日益紧迫

实际上,关键问题就出在GPU架构设计上。多年来,GPU设计的第一要务是优化图形处理能力,并没有把数据隐私放在更优先的位置。而生成式AI等AI应用的日益普及,促使GPU得到更广泛的应用,也使得解决GPU漏洞问题越来越紧迫。

该漏洞被命名为“LeftoverLocals”,这个漏洞不只是针对消费者应用程序,而是通过侵入大语言模型(LLM)和机器学习(ML)模型中使用的GPU来完成任务。由于模型训练涉及敏感数据使用,因此提取数据更危险。

据悉,Trail of Bits研究人员只用了不到10行代码,就通过创建的攻击程序,在几秒内对GPU内存进行LeftoverLocals攻击,来收集大语言模型提供的大部分响应。该公司的研究人员证明,该漏洞可以用于窃听——跨容器或进程边界——基于提示的聊天会话。

该漏洞(CVE-2023-4969)据传适用于苹果、高通、AMD和Imagination的GPU。其中,在AMD Radeon RX 7900 XT上运行70亿参数量模型时,LeftoverLocals漏洞在GPU每一次调用数据时可能会泄漏约5.5MB数据,在llama.cpp上运行7B模型时,每次LLM查询总共会泄漏约181MB数据。

Trail of Bits的研究人员Heidy Khlaaf和Tyler Sorensen透露,早在2023年9月他们就发现了该漏洞。他们同时指出,这比“以高精度重构 LLM 响应”所需的要多得多。也就是说,这些信息足以高精度地重建大语言模型响应。

LeftoverLocals相当依赖GPU如何隔离其内存,而这与CPU框架不同,因此通过可编程接口获得对GPU共享访问权限的攻击者可以窃取GPU内的内存数据,这将带来多种安全后果。对于普通消费者来说,LeftoverLocals可能不值得担心,但对于云端运算或推理等产业的相关人员来说,会使LLM和ML框架的安全性存在疑虑。

在现代电脑和服务器中,多个用户可以共享相同的处理资源,无需访问彼此的数据。但漏洞LeftoverLocals的袭击打破了这些墙。黑客在目标设备上构建一定数量的操作系统访问权限后,即可利用该漏洞,从易受攻击的GPU的本地内存中泄露他们不应该访问的数据,暴露任何碰巧在那里的数据。

多家科技巨头受影响

2023年夏天,Trail of Bits的研究人员就测试了来自7家GPU制造商的11款芯片和多个相应的编程框架,发现苹果、AMD和高通的GPU均存在LeleftoverLocals漏洞,并联合启动了对该漏洞的协调披露。而苹果、高通和AMD都证实了它们受到影响。

此前,有人曝光了这个问题,但苹果一直没有公开回应。直到2024年1月13日才给予回复。经重新测试,一些设备的漏洞似乎已被修补,如第三代iPad Air(A12),但该问题仍存在于苹果MacBook Air(M2)上。新发布的苹果iPhone 15似乎没像以前版本那样受影响,苹果已确认A17和M3芯片包含修复程序,但尚未收到在其设备上部署特定补丁的通知。

然而,这并不是苹果第一次面临此类问题,此前M1芯片也被曝出存在安全漏洞。由此可见,苹果需要加强其产品的安全性,以确保用户的数据安全。

而AMD也受到该漏洞的影响,在继续调查潜在的缓解计划。AMD已经就此漏洞问题发表一份安全公告声明,详细列出受影响的产品清单,并说明其为LeftoverLocals提供修复的计划。

尽管高通固件v2.07有一个补丁,可以针对某些设备的LeleftoverLocals,但目前可能还有其他设备受到影响。

据了解,研究人员未发现英伟达、英特尔或Arm GPU包含LeftoverLocals漏洞的证据,也没在他们测试的Imagination GPU中发现相关漏洞。但谷歌已确认一些来自该公司的GPU确实受到影响。Imagination在其最新DDK版本23.3中发布了一个修复程序,于2023年12月提供给客户。

至于作为GPU市场领导者的英伟达确认其设备目前没有受到影响,有人分析,一个可能的原因是研究人员之前在英伟达GPU上探索过各种内存漏洞,是他们早先意识到这类问题。

目前,卡内基梅隆大学(Carnegie Mellon University)的专家正在对LeftoverLocals进行跟踪,据称该信息已经被受其影响的主要GPU供应商共享,其中包括英伟达、苹果、AMD、Arm、英特尔、高通和Imagination等。

值得一提的是,此漏洞不适用于浏览器GPU框架,例如Google的WebGPU,因为它们会向GPU内核插入动态内存检查。

如何解决漏洞问题?

尽管这种安全漏洞仍然存在于许多流行的消费类设备上,如iPhone和Android手机,但到目前为止,还没有关于漏洞利用的消息。而AMD本身仅将风险评估为具有中等威胁级别。

尽管如此,LeftoverLocals指出了保护LLM及其支持MLops的新兴做法。Trail of Bits也指出,“该漏洞凸显了ML开发栈的许多部分存在未知的安全风险,并且没有经过安全专家的严格审查。”

同时,值得关注的是,未来,随着GPU虚拟化在公共云基础设施中变得越来越普遍,以及越来越多的AI应用程序从本地实施转向在共享云环境中运行,GPU内存安全问题和漏洞将变得更加严重。

对此,Trail of Bits研究人员警告说,让这些各种修复方法激增并不容易。即便GPU制造商发布可用的补丁,将其芯片整合到PC和其他设备的制造商也必须打包并将保护传递给最终用户。而全球科技生态系统有如此多的参与者,很难协调各方。

Trail of Bits研究人员认为,社区必须尽力加强GPU系统堆栈和相应的规格,严格测试这些规格,满足不同应用领域的安全要求,并对各种新式AI芯片进行严格的安全分析。

此外,鉴于GPU的多样性及其在实现AI应用方面的关键作用,研究人员认为,相关设备及其生态系统需要做到以下几点:一是创建一个详细的威胁模型,考虑到GPU上处理的各类数据以及这些数据可能如何被破坏;二是探索GPU执行堆栈,以确定应在何处以及如何指定和实现GPU安全属性;三是进行重要的测试和审计,以加强GPU生态系统。

我国首颗AI芯片问世,英特尔狂跌1775亿,外媒:芯片限制闹大了

中国首颗AI芯片:全球芯片市场的新焦点

近年来,全球科技领域的竞争逐渐聚焦在人工智能技术上,而在这个背景下,中国首颗AI芯片的问世成为全球关注的焦点之一。这一创举不仅在国内引起了热烈的反响,更在国际上掀起了波澜。本文将深入探讨这颗AI芯片的特点、对中国的意义、对全球芯片市场的影响,以及各国应对的战略调整。

介绍

人工智能技术逐渐成为全球科技竞争的新焦点。在这一背景下,中国首颗AI芯片的问世引起了广泛关注。这颗芯片采用了先进的半导体制程工艺和架构设计,具备高性能、低功耗等显著特点,成为中国在AI硬件领域取得的重大突破。

AI芯片的特点

这款AI芯片的独特之处在于其采用了先进的半导体制程工艺和架构设计。这不仅使得芯片在性能上有了明显的提升,同时也实现了低功耗的目标。相较于同类产品,它在处理AI计算任务时表现出了卓越的优势,为中国在人工智能领域的技术实力提供了有力支撑。

成功研发对中国的意义

中国AI芯片的成功研发标志着我国在AI硬件领域迈出了重要的一步。这不仅为国内AI产业注入了新的活力,也为中国在全球科技创新舞台上占据更为重要的位置提供了支持。在全球科技竞争中,中国AI芯片的突破为我国的科技实力树立了崭新的标杆。

对全球芯片市场的影响

然而,这一突破并非仅仅对中国产业有利,同时也对全球芯片市场造成了深远的影响。全球知名的芯片制造商英特尔在这场竞争中受到了沉重的打击。其市值在短时间内蒸发了1775亿美元,凸显出在面对新的竞争形势时所面临的压力。

芯片限制政策的影响

全球芯片市场的动荡并非仅仅源于中国AI芯片的崛起,更因为美国此前对中国实施的芯片限制政策。这一政策导致了全球芯片市场的震荡,许多国家开始寻求摆脱对美国芯片的依赖,加大芯片自主研发的力度。中国的成功经验为其他国家提供了发展的契机,全球芯片市场正在迎来新的竞争格局。

各国的战略调整

在中国AI芯片问世的背景下,各国政府和企业开始加大对芯片自主研发的重视。这不仅是因为技术实力和创新能力在全球芯片市场竞争中的关键地位,更是为了应对不断变化的国际形势。全球各国纷纷制定战略,竭力抢占芯片市场份额,而最终的胜者将取决于谁拥有更加强大的技术实力和创新能力。

全球芯片产业的新机遇与挑战

随着中国首颗AI芯片的崛起,全球芯片产业正面临着新的机遇与挑战。各国在竞争中努力提升技术水平,推动创新发展。这场竞争将不仅仅决定各国在全球科技领域的地位,更将塑造全球芯片市场的格局。中国首颗AI芯片的成功研发为全球芯片产业注入了新的活力,也为未来的科技竞争奠定了基石。

结论

中国首颗AI芯片的问世不仅为国内AI产业注入了新的活力,同时也引发了全球芯片市场的变革。在这场激烈的竞争中,各国政府和企业都将竭尽全力抢占市场份额,而最终的赢家将取决于谁拥有更加强大的技术实力和创新能力。全球芯片产业正面临着新的机遇和挑战,而中国首颗AI芯片的崛起将成为这一变革的重要推动力。在这个充满活力的时代,科技创新将继续引领全球前行的步伐。

科技热点 | 你用AI写的论文,已经被“盯”上了!【中国科讯】

“太不像话了!学生用人工智能生成的期末论文糊弄我。”近日,上海某高校教师在社交媒体上“吐槽”自己遇到的新难题——一些想偷懒的学生开始用人工智能技术完成论文。

以ChatGPT为代表的生成式人工智能技术(AIGC)横空出世,似乎为人们写论文提供了新帮手。从提供选题到文稿润色、从统计分析到图表制作……其功能之强大,几乎覆盖了学术论文写作过程的方方面面。

面对ChatGPT等工具的潜在风险,争议随之而来。不少人质疑,人工智能到底能不能用于辅助学术论文写作。有人认为,它只是提高科研效率的工具。有人则对此持审慎态度,认为容易引发大规模的学术诚信问题。

人工智能技术在论文写作中的应用程度如何?技术应用的边界在哪里?如何对这一技术进行有效治理?记者对此进行了深入采访。

AI生成的文本“非常水”

有多少人尝试过用人工智能技术写论文?去年《自然》杂志对全球博士后的一项调查发现,约有三分之一的受访者使用人工智能聊天机器人来优化文本、生成或编辑代码、整理文献。

当记者尝试在社交媒体上搜索“AI”“论文”“写作”等关键词,五花八门的AI论文写作指导教程映入眼帘。其中大部分宣称能够教会用户在几分钟内通过几个简单的步骤,生成一篇几万字的“优质”论文。这些教程的浏览量最高已达数百万。

AI真的能生成一篇完整的“优质”论文吗?记者按照教程开始了尝试:“请提出与民族志纪录片有关的论文选题。”几乎无需等待,几个看起来很“靠谱”的选题就出现在对话框里。

“请就某一选题生成写作大纲。”几秒后,7个像模像样的章节全部生成完毕。“请就提纲中某项内容,详细描述2000字。”重复几次操作后,一篇几万字的“论文”很快就完成了。但记者浏览后发现,其生成的段落中,存在大部分重复且言之无物的内容。

除了说“车轱辘”话,某985高校人工智能专业硕士研究生温睿还发现了此类论文的行文特点:“一般是先写一句话,然后进行分条论述。当老师看到这样套路化的内容就会猜测,这类文章很大程度上是人工智能写的。”

文章开头那位教师的经历印证了温睿的发现。“这样的论文看似条理清晰、层次丰富,但实际上每个层面的内容都很少,而且非常空洞。我马上就怀疑是AI生成的。”该老师说。

不少期刊编辑、审稿人也发现了同样的问题。

某人文社科期刊审稿人徐彬向记者透露,用AI写论文的关键在于提示词。如果提示词选用的不恰当,就极有可能得到一篇套路化的文章。他目前已经收到过五六篇“一眼就能看出来”用AI写的稿子。

“这些文章的共同特点就是非常水。虽然它生成的语言连贯性不错,但是缺乏深度,创新性也不强。”对此,徐彬略显无奈,“综述类文章是使用AI的重灾区,但目前期刊还缺乏相关的评价标准和处理机制。”

伪造数据集更具隐蔽性

在清华大学人工智能国际治理研究院副院长梁正看来,论文核心评价标准包括作者发挥的创造性、对论文的贡献程度。一篇大部分由AI生成且隐瞒使用情况的文章,既没有作者智力的贡献,也不符合科研诚信的要求,属于学术造假。

AIGC造成的学术造假还发生在数据领域。记者在采访过程中,多位业内专家提到了伪造数据集问题。相比直接的文本生成,这一方式更具有隐蔽性。

GPT-4的ADA功能是一种结合了计算机编程语言Python的模型,可以执行统计分析和创建数据可视化。梁正向记者讲述了一则真实的案例:国外某机构研究人员先是要求GPT-4 ADA创建一个关于圆锥角膜患者的数据集,后又要求它编造临床数据,用以支持深板层角膜移植术比穿透性角膜移植术效果更好的结论。但真实的临床数据证明,两种手术效果并无明显差别。

“针对某个问题,提出方法来解决,并通过实验来证明方法的可行性——这是专业论文的常用模式。人工智能不能做实验,哪怕它给的实验数据再理想,也都是虚假的。”温睿认为,虚假的数据背离了科学研究的真正意义。

除了数据处理,更多人使用AIGC来解释概念。温睿发现AIGC生成的概念简洁明了,查重率也非常低。但当记者询问这些概念是否正确时,温睿显得有些迟疑:“我也没有把握,通常默认它是对的。”

为了验证AIGC给出答案的准确性,记者就一些新兴概念提问,但它给出的答案往往和真正概念毫不沾边。当记者让AI生成5篇某领域的重点参考文献,它又胡编乱造了5个不存在的作者和不存在的文献。

在人工智能领域,描述AI“一本正经地胡说八道”的专业名词是“AI幻觉”。哈尔滨工业大学(深圳)特聘校长助理、教授张民解释,AI幻觉是指AI会生成貌似合理连贯,但与输入问题意图不一致、与现实或已知数据不符合或无法验证的内容。这多是由于AI对知识的记忆不足、理解能力不够、训练方式固有的弊端及模型本身技术的局限性所导致。

“如果不警惕AI幻觉,很有可能损害科学研究的真实性和客观性。”梁正表示,AI生成的错误信息一旦被广泛传播,不仅会造成“学术垃圾”泛滥,还将影响学术生态的良性发展。

一场你追我逃的“猫鼠游戏”

一项新技术的出现,对于社会的发展往往是把双刃剑。虽然人工智能技术存在种种隐患,但其在图文创作、数据处理等方面的强大能力已被大多数人认可。归根结底,我们认为AI将增加人类的智慧,而非取代人类。其使用应在人类监督之下,并将道德因素考虑在内。”施普林格·自然集团发言人说。

推动AI向善发展,需要借助行之有效的技术手段。值得注意的是,AI生成的论文并不能被查重工具检测出来。因此,国内外都在探索研发专门针对AIGC的检测工具。

从原理看,AIGC检测技术是在“用AI打败AI”。同方知网数字出版技术股份有限公司副总经理柯春晓介绍:“人类的创作往往是随机且富有灵感的,而接受过大量文本训练的AI已经形成了生产文本的‘固有’范式,倾向于使用‘一致’的结构和规则,因此具有更高的可预测性。”AIGC检测的核心就是依托海量的文本和数据样本,识别出人类和AIGC工具在平均句子长度、词汇多样性和文本长度等方面的不同点,从而揪出AI论文“枪手”。

一些期刊出版机构通过检测工具发现了AIGC代写论文的痕迹。“从去年7月底到现在,我们发现涉嫌AI写作的论文数据每个月都在上升,大约有六七十篇的文章疑似使用AI的程度超过了50%。”《中华医学杂志》社有限责任公司新媒体部主任沈锡宾介绍。

沈锡宾向记者展示了检测过程:一篇论文经过检测系统后,会显示疑似AI生成占全文比重,相关疑似段落也会被标红。但记者注意到,和传统的查重报告单明确标注重复痕迹不同,AIGC检测报告单只是指出某些文本AIGC的“置信度”,并不能回答为什么是这个值。

“这使得报告单往往只起到参考和警示作用。”柯春晓说。

目前,人工智能大模型正在以“周”为单位进行迭代升级。如何适应不断升级的技术,是摆在AIGC检测工具面前的一道必答题。

作为使用者的人类本身也在不断“进化”。“类似人们逃避查重的方式,如果人们了解到AI检测的方式,也可以重新组织相关内容,对AI生成的文本进行人工润色。这样很可能就检测不出来了。”沈锡宾说。

作弊与反作弊的过程,实质上是场“猫鼠游戏”。只要技术不断升级,两者间的博弈就不会停止。目前,AIGC检测技术仍处在萌芽期。如何对AI生成的虚假图片、虚假数据进行识别仍是难点。因此,人们引入智能检测技术的同时,也要建立人工审查机制。

“审稿人要当好‘守门人’,发挥同行评议的作用,仔细甄别判断论文的数据是否和认知存在偏差。出版机构也可以要求作者提供原始数据,多管齐下,确保科研诚信。”沈锡宾说。

技术向善要他律更要自律

加强技术治理的同时,各方都在翘首以盼,期待达成某些共识以及相关政策尽快出台。“教育、科研、出版各方都很关注AIGC使用的边界,期待对合理使用AIGC形成一个共识性规范。”知网技术专家呼吁。

其实,早在去年初,中国科学技术信息研究所(以下简称中信所)就牵头爱思唯尔、施普林格·自然、约翰威立等国际知名出版集团和科研信息分析机构,在广泛调研并梳理业内相关研究和探索工作的基础上,完成了中英文版的《学术出版中AIGC使用边界指南》(以下简称《指南》),并于去年9月20日在国内外同步发布。

去年12月21日,科技部发布的《负责任研究行为规范指引(2023)》(以下简称《指引》)更是受到了业内的广泛关注。

《指引》和《指南》就如何负责任地使用AIGC,解答了令科研工作者、期刊编辑、审稿人困惑的一些问题。

首先是披露问题。《指引》提出,使用生成式人工智能生成的内容应明确标注并说明其生成过程,确保真实准确和尊重他人知识产权。《指南》中更是提供了声明的模板,供科研人员参考。

对于一些人想用AIGC投机取巧的行为,《指引》明确提出,不得使用AIGC直接生成申报材料;《指南》规定,AIGC不应该用来产生研究假设、直接撰写整篇论文文本、解释数据、得出研究结论。研究人员使用的数据必须是研究人员进行实验并收集所得,如使用AIGC提供的统计分析结果需进行验证。

随着AIGC的使用边界不断清晰,越来越多的出版机构达成共识,制定了使用规范。施普林格·自然集团发言人介绍说,他们目前已经明确了有关作者身份和图像方面的规定。例如,人工智能不能担任作者,真正作者如使用大语言模型须加以透明描述,AI生成的图像通常不能用于发表等。

“《科学》杂志在去年1月份发布的政策是禁止使用任何AIGC工具。而11月16日他们更新了投稿规则、放宽了限制,表示只要进行了适当披露,使用工具是可以接受的。”中信所博士郑雯雯说道。

“《指引》覆盖较为全面,对AIGC的使用总体呈现出平衡包容、敏捷治理的态度,而非一味禁止。这也说明治理的目的并不是阻止科研工作者使用新一代人工智能技术,而是让科研工作者能够负责任地去使用。”梁正提到,在政策制定的行为框架之下,还要关注学科差异问题。“使用AIGC可能因学科的不同而有所差异,其伦理问题也要根据学科特点细化。”

例如,在自然科学领域,AIGC的强大功能更多体现在数据处理领域,如果失范使用,往往难以发现。而对于人文社科领域,直接使用AIGC生成内容的痕迹非常容易被发现,尤其是在高水平的研究当中,优劣之分更为明显。

“因此,对于更加注重文字表达、数据资料支持的学科,比如企业管理、理工科、医学等,需要防范产生虚假的数据集或论证材料。”梁正说,“对AIGC使用的披露程度、疑似度的数据指标等,都需要学术共同体进一步探索,来推动形成广泛共识。”

此外,尽管国家出台了相应的规则,但从外部监督到行业自治还需要一个过程。AIGC的使用涉及包含研究人员、出版机构、相关行业组织、政府等方方面面。如何厘清各方关系,各司其职是关键。“简单说,就是出了问题,谁来查?有没有能力查?”郑雯雯强调。

记者了解到,中华医学会杂志社在今年1月9日公布了其对于AIGC技术使用的有关规定。其中不仅涉及了作者要遵守的细则,还提出了查处方式——经编辑部研判的违反AIGC使用的情形,将直接退稿或撤稿;情节严重者,将列入作者学术失信名单。

“我们下一步的目标是把存在问题的文章作一个归纳总结,进一步摸清AIGC使用的规律,为科学治理积累经验。”沈锡宾说。

“尽管新兴技术有着潜在风险,但也有着无可比拟的优势,不宜一味封堵,而是要做好引导、合理合规地使用新技术。”郑雯雯表示,归根到底,科学研究的主体是人。如果心中的那杆“秤”倾斜了,即使再完善的监管政策、再高端的检测技术,也难以抵挡学术不端的侵袭。

梁正也强调,作为科研诚信的第一责任人,科研人员一定要保持严谨的学术态度,关注研究领域的真问题,坚守学术研究的基本原则,如原创性和透明性;明确认识到ChatGPT等工具的潜在风险,避免使用不当而造成学术不端。

“科研诚信和伦理是科研的生命线,科研人员一定要存敬畏、有底线。一旦在这方面有瑕疵,职业生涯或将葬送。”梁正提醒。

微软推出独立 AI 工具“阅读教练”,辅助提高学习者阅读能力

微软近日发布新闻稿,宣布面向学生群体,推出全新的生成式 AI 工具“阅读教练”(Reading Coach),通过个性化和有吸引力的练习,帮助学习者提高阅读能力。

微软表示 Reading Coach 会免费提供,用户只需要登录微软账号,就能在课堂或者家中使用。

Reading Coach 此前是 Microsoft Teams 的一项功能,主要为学习者提供定制的阅读练习,以及发音和流利程度方面的即时反馈,同时还能让教育者了解他们的学习进度。

微软现在将其从 Teams 中分拆出来,作为独立应用提供,并进一步丰富其功能,让学习者从精心挑选的选项中选择人物和场景,创建自己的人工智能故事。

人工智能生成的故事在内容质量、安全性和年龄适宜性方面都经过了微软负责任人工智能指导方针的审核。学习者在“沉浸式阅读器”(Immersive Reader)中阅读故事,帮助有困难的用户提高阅读能力。

学习者还可以选择每个故事章节中发生的内容,在故事中创造自己的阅读之旅。他们在上一章节中发现的具有挑战性的单词会自动出现在下一章节中,从而使练习适应他们的需要。

在每个故事章节结束后,学习者还能就他们认为具有挑战性的单词接受流利性辅导。为了保持学习者的积极性和参与度,该应用程序会奖励他们以努力为重点的徽章,并为下一个故事解锁新的角色和场景。

劈柴曝谷歌2024年全年裁员,牵出华人员工自杀事件!硅谷近8000人疑被AI淘汰

原创:新智元

硅谷一年一度的开年裁员大礼包,又来了。目前,谷歌的裁员动荡,还在继续。就在今天,CEO劈柴又发出了全员公开信,表示裁员将持续2024一整年!

1月10号以来,谷歌已经有多部门的近1000名员工被裁。谷歌硬件、广告销售、搜索、购物、地图、政策、核心工程和YouTube团队,都已经或即将接受裁员和重组。劈柴表示,这次裁员的目的是消除层级,提高某些领域的速度(就差没点名AI了)。他的公开信,正式了谷歌内部许多人一直在担心的事情:更多的「岗位淘汰」,真的来了。其他的大科技公司,数据也很可怕。Layoffs.fyi的数据显示,2024年第一季度,已经有58家科技公司裁掉了7,785名员工。

Salesforce、Duolingo以及AI硬件初创公司Humane,也宣布了裁员或停止招聘,从而能够更加聚焦于AI。Aisera的联合创始人兼CEO Muddu Sudhakar表示,在基础软件开发和数据库管理等领域,已经有大量工作岗位被取消。目前,AI工具未必会直接导致人类员工的淘汰,但在整体经济大环境中,集中全公司之力发展AI,客观上确实导致了更多的裁员。所以,AI真的来淘汰人类了?

谷歌裁员继续,CEO劈柴:将持续整个2024

酝酿了好几个月,谷歌的裁员大砍刀,真实地砍了下来。一周前,核心工程部门、Google Assistant、硬件和AR部门的数千名员工被裁。两天前,谷歌广告销售部门的一百多名员工,也不幸被裁。可怕的是,这轮裁员大逃杀还在继续,谁也不知道,下一个被写在「死亡笔记」上的名字是谁。

今天,谷歌CEO劈柴首次承认了谷歌最近的裁员潮,并且在邮件中警告全体员工:裁员将持续一整年。截至去年9月,谷歌共有182381名员工。去年一年,谷歌裁掉了6%,也就是大约1.2万人。好在,劈柴表示,今年的裁员幅度不会达到去年的规模,也不会涉及所有团队。至于为什么要裁掉这么多员工,劈柴的解释是,这是谷歌在将人工智能置于优先地位时「不得不做出的艰难决策」。

谷歌已经宣布,将在数据中心和其它基础设施上进行大规模投资,以便在和微软、OpenAI的竞争中,尽快让Gemini大模型商业化。如今,Gemini项目已经成了全公司最炙手可热的团队、最宝贵的资产,也是被竞争对手的猎头盯上的重点对象。这也迫使谷歌为那些最受欢迎的AI研究人员,提供更天价的薪水。天价薪酬,由谁来买单呢?自然就是其他被裁的人。上周的裁员,已经波及了一些副总裁,以及其他资历深、任职时间长的老员工。

劈柴在公开信中指出,谷歌希望通过裁减员工来精简管理层级,加快某些领域产品的开发速度。就在刚刚裁掉广告销售部门的数百名员工之后,谷歌旗下的YouTube也开始裁员了。YouTube已经发出通知,将在全球的合作伙伴中裁掉100多人。

这股裁员大潮,会因为谷歌预计的收入增长而放缓吗?还没有人知道答案。现在,谷歌已经人心惶惶。在Blind上,一则谷歌华人员工疑似自杀的新闻,更让谷歌蒙上了舆论的阴影。

甚至还登上了微博的热搜。

除此之外,劈柴也被怒喷是「史上最差CEO」。有人说,当你客观地分析顶级科技公司(FAANG)时,谷歌的CEO是迄今为止表现最差的。劈柴就应该被解雇。

劈柴可能会被解雇,因为谷歌员工一直在抱怨他在恐慌中做出有关BARD的决定。许多前谷歌员工表示,劈柴是最糟糕的科技公司首席执行官,他之所以能幸存下来,是因为它从一开始就没有竞争对手。

而代表谷歌母公司Alphabet 1400多名员工的Alphabet工人工会也怒了!它们发帖称,此次裁员是「不必要的」。

我们的团队成员每天都在努力工作,为我们的用户打造优秀的产品,公司不能在每个季度赚取数十亿美元的同时继续解雇我们的同事。

今年大科技公司裁员新理由:生成式AI有趣的是,随着科技大厂持续加大对AI的投入,人工智能也成为了当今「最流行」的裁员理由。当然,这不仅仅是用AI去替代员工,更多的是藉此替换那些不具备AI技能的员工。

对此,CodeSignal的联合创始人兼CEO Tigran Sloyan表示,这一方面意味着公司正在将工作岗位全面自动化,也就是用AI去取代员工。比如Duolingo就已经能够利用AI完成更多的工作,并在本月继续缩减承包商的数量。

另一方面也说明科技公司正在将资源重新分配,从而可以给那些技术水平更高的工程师提供更高的薪酬。不过,也不排除这只是公司为了应对裁员所带来的公关问题的巧妙借口。

总体而言,生成式AI对于相当一部分软件工程师来说,带来的更多是威胁。尤其是随着企业中自动化代码生成的普及,比如像Github Copilot这类工具,一般性AI岗位的薪资很可能会下调。

根据Brookings Metro即将发布的研究,包括软件开发在内的与「计算机」相关的工作,都将面临高达90%的生成式AI风险。换句话说就是,这意味着使用ChatGPT可以在不到一半的时间内完成这些工作的90%。

不过,就生成式AI领域来说,风景是一片大好。Brookings Metro的高级研究员Mark Muro指出,目前市场上迫切地需要掌握AI技能的人才。根据CompTIA最近的报告,美国科技行业在本月新增了12,922个职位,是自2023年4月以来最大的月增长数。其中,针对拥有专业技能的AI职位的招聘,占到了所有技术职位招聘的10%以上。

然而,值得注意的是,这些高额薪资是由PhD级研究人员稀缺的供给和旺盛的需求所决定的。虽然这些AI工程师岗薪资极高,比如Netflix在去年开出的90万美元年薪,但是很少有人能够具备这些职位所需的技能。毕竟,经历了如此多的培训、教育和技能积累的人非常少见。

DeepMind联创警告:几年内,AI就会冲击劳动力市场

DeepMind联合创始人Mustafa Suleyman警告,从长远来看,人工智能是一种「从根本上取代劳动力」的工具。

Mustafa Suleyman是人工智能领域的重量级人物。他早年从牛津大学辍学,担任过联合国和荷兰政府的谈判代表,后来转向人工智能领域。2010年,Suleyman与Demis Hassabis和Shane Legg一起创办了DeepMind。

Suleyman在世界经济论坛年会上表示,「我们必须认真思考如何整合这些工具(AI),如果完全放任市场主导,从根本上说,这些工具将取代劳动力。」

当前的人工智能主要做了两件事情:首先是提高了现有业务的效率,为企业节省了大量成本,但代价是取代了从事相关工作的人类;其次是创建了全新的业务和流程,这里面倒是蕴含了创造就业的机会。在未来几年里,这两股力量都将给劳动力市场带来巨大冲击,造成难以预料的影响。

十多年来,专家们一直在争论人工智能是否会取代人类工人。Carl Benedikt Frey和Michael Osborne在2013年的一项研究中估计,到2030年代中期,美国47%的工作岗位有可能在人工智能热潮中被自动化。麦肯锡7月份的一项研究发现,到2030年,将有近1200万美国人需要更换工作,因为人工智能将取代他们的角色。

事实上,对此发出警告的业内大佬并不止Suleyman一人。麻省理工学院教授Daron Acemoglu在1月10日发表的一篇《连线》文章中预测,人工智能将在2024年让所有人失望,证明自己只是一种「通用自动化」,AI将夺走工人的工作,但却无法实现预期的生产率大幅提高。

「我们世界上一切有价值的东西都是由我们的智慧、我们对信息进行推理和预测的能力创造出来的。而AI恰恰能做到这一点。」

在本周的世界经济论坛人工智能小组讨论中,Suleyman被问到AI何时能够通过图灵测试,甚至展现出类似人类的能力(AGI)。

Suleyman表示,现代版本的图灵测试,应该是评估AI能否像企业家、项目经理和发明家一样,拥有制造和营销产品的能力。

我很确定,在未来五年内,AI不仅会拥有这些能力,而且这些能力将以非常便宜的价格被广泛使用,甚至可能是开源的,而这将完全改变经济。

2024年,CEO计划用AI替代5%的员工

调查显示:四分之一的首席执行官预计,由于人工智能的产生,2024年将至少减少5%的员工人数。CEO们似乎正在「热身」,准备大规模应用生成式AI来节省成本和创造利润——当然,以牺牲员工为代价的。

作为咨询行业巨头,普华永道(PwC)在第27份年度CEO报告中,对105个国家的4702名CEO进行了调查。

当谈到生成式AI时,许多CEO表示,采用该技术是增加收入和提高效率的机会。但人工智能带来的生产力提升也可能是今年让员工失业的原因。调查还显示,AI对某些行业的影响可能更大,在表示将采用AI来精简劳动力的CEO中,有32%属于媒体和娱乐领域,其次是银行和资本市场、保险、运输和物流。

另外,普华永道在生成式AI方向的领导Bret Greenstein表示,人类的招聘和培训成本很高,往往需要几个月的时间才能提高工作效率,而且很难留住,相比之下,忠诚的AI可以在任何需要的时候快速扩展。不过,Greenstein说,学习新的人工智能技能可能会让工人留在工作岗位上。

三星S24系列真机上手:机身更方正 用AI创造更多可能

经过几年的迭代,三星已经形成了上半年更新S系列、下半年更新Z系列折叠屏的固定节奏。而在2024年的今天,三星也为我们带来了最新的Galaxy S24系列产品。今年三星依然采用经典的三杯组合,分别为三星S24、三星S24+以及三星S24 Ultra,满足不同用户的使用需求。

可以看到的是,三星S系列已经形成了相当固定的风格。其中三星S24与三星S24+都拥有轻快简洁的设计语言,二者的区别更多集中在屏幕尺寸以及电池容量,用户仅需结合自己的实际使用需求,就能选择到适合的产品。而三星S24 Ultra则是三星科技的集大成者,它拥有三星S系列最强大的硬件,搭配S Pen也能提供更加完善的使用体验。

值得一提的是,今年三款手机除了常规的性能、影像等提升外,在AI层面的升级也成为重中之重。全新的“Galaxy AI”号称将开启Galaxy新时代,通过AI的加持,呈现出更精彩的生活方式。

01
三星S24/S24+:延续经典设计 手感更加舒适良好的外观设计能够给人留下很深的第一印象,今年三星S24与三星S24+在外观设计上,依然选择延续自家经典的设计风格。为了让整机更显轻便,此次三星S24与三星S24+依然采用了铝合金材质的边框,同时中框部分改为磨砂质感,搭配淡雅的水墨黑、雅岩灰、秘矿紫、浅珀黄等配色,看上去更加轻巧无负担。

仔细来看,今年三星S24与三星S24+看上去比上一代更加方正,同时正面延续了此前的直屏设计。而在屏幕尺寸上,两台设备的尺寸分别为6.2英寸以及6.7英寸,整体的握持手感与前一代差别不大。

三星S24的屏幕支持

1Hz-120Hz的自适应刷新此次三星S24与三星S24+也采用了三星自家的屏幕,二者均支持1-120Hz的自适应刷新率,拥有2600尼特的最高亮度和更窄的屏幕边框,同时正面玻璃盖板采用了康宁Gorilla Armor玻璃,它能降低75%的反射率,让屏幕看上去更加通透。可以说,三星S系列依然拥有当前第一梯队的屏幕显示效果。在性能层面,此次三星S24与三星S24+均采用当前领先的第三代骁龙8移动平台,同时得益于面积更大的均热板,此次三星S24系列的散热表现与稳定性也得到了进一步增强。而在电池容量方面,三星S24与三星S24+分别内置4000mAh以及4900mAh电池,这里面值得关注的是小屏旗舰三星S24,今年三星首次将小屏旗舰的电池容量提升至4000mAh的水平上,这足以确保用户安稳使用一整天。

三星S24采用后置三摄组合而在影像系统方面,三星S24与三星S24+则采用了5000万像素广角+1200万像素超广角+1000万像素长焦的三摄组合。其中1000万像素长焦镜头支持3X光学变焦,这套组合也能覆盖更全面的焦段。

为了自家的顶尖旗舰拥有更亮眼的表现,不少厂商的标准版产品在关键区域均有一定的缩水,例如屏幕刷新率较低、电池续航能力不足、影像系统焦段不够全面等等。而三星S24与三星S24+这次选择不给标准版机型留遗憾,通过更加完善的焦段覆盖、更大容量的电池以及一块高质量屏幕,将标准版机型的体验提升到了当前领先的水平,也让S24与S24+能够满足更多用户的丰富使用需求。

02
全能S系列旗舰 由三星S24 Ultra呈现Ultra代表着极致,也是厂商科技的集大成者。今年三星S24 Ultra拥有三星当前最强的影像表现、最强的硬件素质,还拥有三星对AI的思考。

三星S24 Ultra在外观设计上,三星S24 Ultra依然延续了Ultra系列的风格,背部影像系统采用双竖向排列, 正面则采用一块近乎直屏的屏幕。

三星S24 Ultra的边框宽度控制得相当合理值得注意的是,今年三星S24 Ultra的边框宽度控制得相当合理,从正面来看,它几乎实现了四边等宽,看上去更加舒适,而且无论是玩游戏还是追剧,直屏的显示效果也更加自然。同时,这块6.8英寸的屏幕也支持1-120Hz的自由刷新率以及2600尼特的最高亮度,正面采用康宁Gorilla Armor玻璃盖板,能够降低反射率,也能让屏幕观感更加通透。

三星S24 Ultra引入钛金属材质为了进一步强调Ultra产品线的质感,今年三星S24 Ultra同样引入了钛金属材质,并拥有钛灰、钛黑、钛暮紫、钛羽四种配色,四款配色看上去更加偏硬核,也很符合Ultra系列的定位。至于机身背部,三星S24 Ultra也延续了经典的后置四摄,四颗镜头分别为2亿像素广角镜头+1200万像素超广角镜头+1000万像素长焦镜头(3X)+5000万像素长焦镜头(5X)。三星表示这套影像系统在2X、3X、5X以及10X等焦段下都能实现光学品质表现,同时利用AI超分技术以及多帧融合技术,在更大的变焦级别上也能进一步增强图像品质。

与此前的3X、10X双长焦相比,三星今年选择了3X以及5X这两个焦段。可以看到的是,这两个焦段更加贴合用户的日常使用场景,能让原生焦段拥有更高的适用性,也能避免长焦端的焦段塌陷。当然,通过软件算法,三星S24 Ultra在更长焦段的表现也不错,它很有可能继续成为更多用户的“演唱会专用机”。同样,三星S24 Ultra依然采用内置S Pen的设计,位置依然在机身左下角位置。对于右利手用户而言,使用S Pen仍需要重新建立使用习惯,不过考虑到三星已经连续几代将S Pen放置在该区域,对于三星Ultra系列老用户而言应该早已习惯这个位置。

全新的AI功能 是此次三星最大的改进

在“大模型”、“AI”等成为行业热点的今天,三星S24系列同样将软件上的升级体现在AI层面。虽说我们在S24系列中找不到一个集中的AI入口,但AI其实早已融入各个功能之中。例如全新的“即圈即搜”功能,用户可以在任意界面长按home键并选定区域,让系统自动进行搜索。而在拍照的时候,利用生成式AI,可以通过人工智能来解决照片瑕疵,亦或是利用AI自动调整照片,大大提升效率。

此外,通话实时翻译也是一个相当好用的AI功能。在打电话的时候,通过“呼叫助手”就能开启实时翻译,你可以选择对方的语言,系统也能够自动识别,你甚至可以关掉对方的原声,开启该功能时对方听到的就是自动翻译过后的合成语音。

04
写在最后面向全球市场的三星,每年都会根据自己的节奏来更新产品。今年的三星S24系列,依然是我们熟悉的感觉。通过三星S24、三星S24+以及三星S24 Ultra三款产品,三星的S系列旗舰能够更好地面向不同的用户群,满足不同消费者的使用体验。相比于硬件的常规更新,今年三星S24系列在AI领域的升级更加吸引我。当手机硬件愈发趋同的今天,AI的出现能够进一步提升智能手机的可能性,每一个人都能利用AI去提升效率,创造更多的可能。

价格方面,三星S24系列国行版的先行者计划已经开启,其中S24 8GB+256GB版本售价5999元、12GB+256GB版本售价6499元、8GB+512GB版本售价6999元;S24+ 12GB+256GB版本售价7499元、12GB+512GB版本售价8499元;S24 Ultra 12GB+256GB版本售价10199元、12GB+512GB版本售价11199元、12GB+1TB版本售价13199元。

写给大家看的AI绘画教程:如何使用AI来设计炫酷的产品概念图和参加比赛

作者:PM熊叔

这周,我的AIGC作品《赛博机甲AIPC笔记本》被比赛主办方联想官方账号转发和点赞了!真是万分荣幸!其实,使用AI绘图工具做产品设计并没有想象中的难。关于如何使用AI设计产品概念图,我专门写了一篇零门槛的教程,希望能够帮助大家参赛拿奖。

学完这篇文章你可以掌握:

  1. 了解目前有哪些好用的AI绘画平台
  2. 学习如何写提示词来设计自己的产品
  3. 参加AIGC比赛,提升中奖概率

现在,让我们马上步入正题。


一、有哪些好用的AI绘画平台?无论是在线服务还是本地应用,AI绘画工具的多样化和易用性为创意表达打开了新的大门。从初学者到专业艺术家,每个人都可以找到适合自己的工具,将想象力转化为令人惊叹的艺术作品。在线使用的平台,主要有如下几个:

1. Midjourney (https://www.midjourney.com/)   – 特点:极为优秀的AI绘画能力,但需付费使用。   – 是否有免费额度:否。

2. DALL-E (https://labs.openai.com/)   – 特点:同样提供顶级的AI绘画服务,属于付费范畴。   – 是否有免费额度:否。

3. Bing (https://www.bing.com/images/create)   – 特点:优秀的AI绘画工具,且完全免费。   – 是否有免费额度:有。

4. Leonardo.AI (https://leonardo.ai/)   – 特点:提供良好的AI绘画体验,免费使用。   – 是否有免费额度:有。

5. Mage.Space (https://www.mage.space/)   – 特点:良好的AI绘画能力,免费且提供多种模型选择。   – 是否有免费额度:有。

6. 百度文心一阁 (https://yige.baidu.com/)   – 特点:支持中文   – 是否有免费额度:有。

7.  阿里通义万象 (https://tongyi.aliyun.com/wanxiang/creation)   – 特点:支持中文,   – 是否有免费额度:有。

总的来说,如果你想要有良好的创作体验Midjourney和DALL-E是最理想选择,他俩卓越的创作能力是业内公认的。而对于预算有限或希望免费体验AI绘画的用户,可以尝试BingAI的绘画生成能力,因为BingAI绘画接入的就是GPT的DALL-E。另外如果想体验稍微完整的AI绘图能力Leonardo AI也是不错的选择。如果我们受网络所限,百度文心一阁和阿里通义万象也是目前国内用户的选择。如果你更倾向于在本地设备上使用AI绘画工具的用户,首选 Stable Diffusion,主要有Auto11111的WebUI和ComfyUI。另外,还有一些开箱即用的客户端工具,例如,Draw Things和Diffusion Been等。


二、如何撰写AI绘图的提示词?

我们在使用Midjourney、DALL-E、Stable Diffusion等文本生成图像工具的时候,我们需要设计文本提示词(prompts)来指导AI生成图像过程,最终获得我们想要的效果。

我们可以将AI想象为一名正在学画画的中学生,你现在正在扮演一位美术老师,为他布置作业。

我们应该怎么出题呢?下面是一些方法:

1. 需要明确具体:描述你想要的图像时,尽可能具体和详细,包含场景描述、物体、颜色、情感氛围、风格等。例如,我们出题的时候不说“一辆车”,而是说“一辆红色的跑车在沙滩上”。另外,需要尽量不要有抽象的隐喻,这位学生有可能无法理解。

2. 使用关键词:使用关键词来描述图像的主要元素,如对象、颜色、环境、气氛,虽然有些比较聪明的学生(如Dell-E和Midjourney V6)已经可以理解完整的句子所表达的语义,但是关键词依然是核心。如果我们通过特定的关键词可以帮助AI更明确的表达,特别是一些艺术风格术语,如“印象派”、“超现实主义”或具体的颜色和纹理描述。

3. 不要过于复杂:虽然要具体,但是过于复杂的提示词可能会使模型难以理解和执行,我们需要找到描述清晰具体但又不过分复杂的平衡点。

4. 渐进式迭代:不用一次到位,我们可以通过实验和调整描述来获得更好的结果。

5. 结构性陈述:好的提示词包含不同方面的描述,如主题、媒介、风格、艺术家、细节、颜色和光照等等,如果我们遵循一定的结构,我们可以写出更明确具体的提示词,帮助这位考生更好地理解你的需求。下面是一个比较常用的提示结构:

下面是一个为汽车创建的详细Prompt示例:

  1. 主体内容:一款未来风格的电动汽车。
    1. 基础:一款电动汽车。
    2. 基础+修饰:一款具有流线型设计的电动汽车。
    3. 基础+进一步修饰+画面故事:一款流线型设计的电动汽车,在光滑的公路上高速行驶,车身表面反射着周围的城市光线。
  2. 环境:车辆行驶在一条现代化的高架桥上,背景是一个繁华的未来都市,高耸的摩天大楼和光滑的玻璃幕墙反射着夜晚的灯光。
  3. 气氛:一种科技感和速度感的结合,展现出未来交通的便捷和高效。
  4. 灯光:选择高对比度的照明,强调汽车的轮廓和流线型的设计,同时反映出城市的繁华夜景。
  5. 色彩:使用富有科技感的冷色调,如银灰色、深蓝色和白色,以突出未来感和清洁能源的概念。
  6. 构图:采用动态的角度,如斜视角或低角度视图,以强调汽车的速度和运动感。
  7. 风格参考:参考现代汽车设计和科幻电影中的未来城市景象。

最后,我们将这些描述的关键词整合成一段文本描述:电动汽车,流线型设计,高速公路,未来城市,夜景,摩天大楼,光滑玻璃外墙,高对比度照明,冷色调,科技感,银灰色,深蓝色,白色,干净能源,动态视角,斜角,低角度视图,现代汽车设计,科幻电影风格。如果使用国外的平台,我们可以使用翻译软件将提示词变成英文:Electric car, streamlined design, futuristic city, night scene, skyscrapers, smooth glass facades, high-contrast lighting, cold color tones, technology theme, silver-grey, deep blue, white, clean energy, dynamic perspective, oblique angle, low-angle view, modern car design, sci-fi movie style这里是我在Mage.Space的使用SDXL模型效果如下图:

Prompt = (主体内容) + (环境设定) + (气氛/灯光) + (构图) + (风格参考)

如果条件有限,你可以尝试国内的平台,像百度文心和阿里通义都支持中文。

三、如何使用AI进行产品设计?

当我们要做产品设计的时候,我们需要对上面的基本结构拓展:

Prompt = (产品功能 + 风格外观 + 材料构造 + 特殊要求 + 设计灵感)+ (环境设定) + (气氛/灯光) 

首先,我们的产品主体描述需要更加具体,可以包含面几个维度:

  • 产品功能:描述产品的主要用途或功能。
  • 风格外观:指定设计风格或外观特征。
  • 材料构造:提及所使用的材料或构造方法。
  • 特殊要求:任何特定的设计要求或限制。
  • 设计灵感:参考某些著名产品或设计的风格特征。

另外,我们可以加上一些工业设计常用表现手法:3D渲染风格、CG渲染、手绘、马克笔、彩色铅笔、设计草图等,下面是不同的表现手法。

我们以设计一款AI PC的笔记本为例:

  • 内容主体:
    • 产品功能:AI强大个人助理笔记本电脑
    • 风格外观:融合《新世纪福音战士》初号机的设计元素,动态棱角设计,霓虹绿和紫色高光
    • 材料构造:光滑金属外壳,带有在不同光线下变色的异彩效果
    • 特殊要求:先进的全息触摸屏技术,3D全息交互
    • 灵感参考:高科技的个人电子设备,科幻电影中的设备,如《银翼杀手》中的未来科技
  • 表现风格:CG渲染、高科技、未来感
  • 环境设定:高科技的未来实验室,多面全息显示屏,浮动的交互式面板,赛博朋克风格的未来城市背景
  • 气氛灯光:神秘的蓝色和紫色背光,营造出高科技和未来感的氛围
  • 构图:高角度俯瞰,笔记本电脑位于中心,周围环绕着先进的设备和充满活力的城市景观

我们得到以下提示词:未来风格AI强大个人助理笔记本,融合《新世纪福音战士》初号机设计元素,动态棱角设计,霓虹绿紫色高光,光滑金属外壳,异彩变色效果,先进全息触摸屏技术,3D全息交互,高科技未来实验室,多面全息显示屏,浮动交互式面板,赛博朋克风格未来都市背景,神秘蓝紫背光,高科技感,未来感,高角度俯瞰,中心位置笔记本,周围环绕先进设备和动感城市景观, 3D渲染, 4K我们可以使用翻译软件将提示词翻译成英文:Futuristic AI-powered personal assistant laptop, integrating design elements from Neon Genesis Evangelion’s Unit-01, dynamic angular design, neon green and purple highlights, sleek metal casing with iridescent color-changing effect, advanced holographic touchscreen technology, 3D holographic interaction; set in a high-tech future laboratory with multi-faceted holographic displays, floating interactive panels, against a cyberpunk-style futuristic city background; mysterious blue and purple backlighting, high-tech and futuristic atmosphere; high-angle overview composition with the laptop at the center, surrounded by advanced equipment and a dynamic cityscape.下图OpenAI的DALL-E的生成结果,这是目前表现最到位作品,我们不得不佩服业界顶流的创造力。

这个是Stable diffusion的SDXL模型生成的结果,虽然环境氛围表达到位了,但是缺少创造力,电脑就是电脑。

百度文心和阿里通义万象,效果大家自行评价。

通过上面几个平台生成效果对比,可见AI生成的作品的好坏和模型选择也有很大关系。另外,优秀好的作品介绍也很重要,我们可以使用ChatGPT或百度的文心一言来帮助我们写设计介绍,将这个文字复制给大语言模型:

请扮演一位网络营销高手,帮我写条微博,要求请根据以下产品的描述,从这款作品的作者的角度介绍作品```[这里写上你刚刚在创作过程中使用的Prompt...]```

四、参加比赛,准备拿奖目前,联想正好在做一个AI PC的设计比赛,奖品还不错,而且作品提交次数没有限制,非常适合我们这些掌握AI绘图的普通人参赛。

OpenAI 组建新团队,收集公众意见以确保 AI 大模型与人类价值观保持一致

1 月 17 日消息,美国当地时间周二,人工智能领域的佼佼者 OpenAI 在其博客上宣布,他们正在组建一个名为“集体对齐”(Collective Alignment)的全新团队。

这个团队主要由研究人员和工程师构成,将专注于设计和实施收集公众意见的流程,以帮助训练和塑造其人工智能模型的行为,从而解决潜在的偏见和其他问题。

OpenAI 在博客中阐述道:“我们的目标是打造一个系统,它能够收集和‘编码’公众对我们模型行为的看法,并将这些宝贵的见解融入我们的产品和服务中。这样一来,我们未来的人工智能模型就能更好地‘与人类价值观保持一致’。”

为了实现这一目标,OpenAI 正积极招募来自不同技术背景的研究工程师加入这个新团队。他们表示:“我们将与外部顾问和其他团队紧密合作,包括开展试点工作,将原型整合到我们的模型中。我们需要来自不同领域的专家,共同助力这项工作的推进。”

这个“集体对齐”团队其实是 OpenAI 去年 5 月启动的公共项目的一个延伸。该项目旨在资助建立一个“民主程序”的实验,以确定人工智能系统应遵循的规则。OpenAI 曾明确表示,该计划旨在资助个人、团队和组织开发概念验证,以回答有关人工智能护栏和治理的问题。

研究工程师、OpenAI 新团队创始成员泰纳・埃伦杜(Tyna Eloundou)强调:“随着我们不断追求超级智能模型的发展,这些模型将逐渐成为我们社会不可或缺的一部分。因此,让人们有机会直接提供意见至关重要。”

例如,为了确保只有人类才能参与投票和提供意见,OpenAI 还考虑与 Worldcoin 进行合作。Worldcoin 是 OpenAI 首席执行官萨姆・阿尔特曼(Sam Altman)创建的一个加密货币项目,它提供了一种有效区分人类和人工智能机器人的方法。

自 2022 年底推出 ChatGPT 以来,OpenAI 凭借其生成式人工智能技术吸引了公众的广泛关注。这种技术能够利用简单的提示生成文本,使 ChatGPT 成为有史以来增长最快的应用程序之一。

然而,人工智能技术的快速发展也引发了人们的担忧。特别是其创造“深度伪造”图片和其他错误信息的能力,让人们在即将到来的 2024 年美国大选前夕感到不安。批评人士指出,像 ChatGPT 这样的人工智能系统由于其输入数据的影响而具有固有的偏见,用户已经发现了一些人工智能软件输出中存在种族主义或性别歧视的例子。

在最新的博客文章中,OpenAI 回顾了资助受助者的工作成果,包括视频聊天界面、人工智能模型众包审计平台以及“将信念映射到可用于微调模型行为的维度的方法”。同时,他们还公开了所有受助者工作中使用的代码以及每个提案的简要摘要。

尽管 OpenAI 试图将该项目描述为与其商业利益无关,但考虑到其首席执行官阿尔特曼对欧盟人工智能监管的批评态度,这一说法似乎有些难以令人信服。阿尔特曼以及 OpenAI 总裁格雷格・布罗克曼(Greg Brockman)和首席科学家伊利亚・苏茨凯弗(Ilya Sutskever)一再强调,人工智能的创新速度非常快,以至于我们无法指望现有的权威机构能够充分控制这项技术。因此,他们提出了将这项工作众包的解决方案。

来源:网易科技 作者:小小

“AI女友”霸占GPT商店,OpenAI苦不堪言:开发者也难出头!

AI 女友成了香饽饽,
OpenAI 管店不容易

上周,OpenAI 推出了 GPT 商店,用户可以浏览和下载由创作者们精心打造的 ChatGPT 定制版本。然而,短短几天内,商店的宁静就被打破了。爱好者们的热情催生出一波意想不到的浪潮:“AI 女友”迅速占领了商店,挑战着 OpenAI 的规定。

在 GPT 商店中搜索“女友”,网站的结果栏中将显示至少八个“AI 女友”聊天机器人,包括“韩国女友”、“虚拟甜心”、“你的女朋友斯嘉丽”、“你的 AI 女友 Tsu”等。

如果选择了其中一个,比如“虚拟甜心”,用户点击后将收到诸如“你的梦想女孩是什么样子?”、“与我分享你最黑暗的秘密”之类的提示语。

OpenAI 深知潜在的滥用问题,并在 GPT 商店上线当天更新了其使用政策。这些政策明确禁止 GPT 参与浪漫互动:“我们…… 不允许 GPT 用于培养浪漫伴侣关系或从事受监管活动。”在同一段话中,OpenAI 指出,名称中包含脏话或描绘或宣扬图形暴力的 GPT 也是不允许的。但第二天就出现的政策违规情况表明,审核可能非常困难。

说来也巧,交朋友、找女友、当陪伴的智能聊天机器人,在美国还真挺吃香。据某数据公司统计,2023 年美国人从苹果或谷歌商店下载的前 30 个聊天机器人热门应用中,足足有 7 个是跟这相关的。

“AI 女友”也让 OpenAI 意识到,管住这些 GPT 可真是个不小的挑战。虽然他们有规定,违规了就警告、限制、踢出商店、断财路,可这些规则跟现实的碰撞,还真是火花四溅。这些卖商家随后就换了关键词,把“女友”换成了“甜心”,搜索出来的选项就多了不少。

看来,OpenAI 又得抓耳挠腮了。监管这些人工智能聊天机器人,是一场持久战!

从技术角度来看,创建这些定制 GPT 非常容易,几乎所有人都可以参与。使用 OpenAI 的 GPT Builder,创作者只需用简单语言描述他们希望 GPT 拥有的功能,该工具就会尝试根据这些规范创建一个 AI 聊天机器人。这种易于创作的特点自发布以来就备受关注,使得 GPT 的开发和分享变得非常迅速。

但它也有坏的一面,比如这些 GPT 的审核机制还不完善,可能导致意想不到的、令人不快的行为。上线到现在,抄袭现象也非常严重,抄袭者可以使用同样的名称、工作原理甚至图标,社交平台上用户对此怨声载道。

从技术角度来看,创建这些定制 GPT 非常容易,几乎所有人都可以参与。使用 OpenAI 的 GPT Builder,创作者只需用简单语言描述他们希望 GPT 拥有的功能,该工具就会尝试根据这些规范创建一个 AI 聊天机器人。这种易于创作的特点自发布以来就备受关注,使得 GPT 的开发和分享变得非常迅速。

但它也有坏的一面,比如这些 GPT 的审核机制还不完善,可能导致意想不到的、令人不快的行为。上线到现在,抄袭现象也非常严重,抄袭者可以使用同样的名称、工作原理甚至图标,社交平台上用户对此怨声载道。

AI开始尝试预测死亡

一串由人类创造的代码正在尝试帮人类”算命”,死亡似乎不再是无法预测的事情了。近期,丹麦科技大学的研究团队声称设计出一款人工智能死亡预测器。

研究人员表示,这款名为“Life2vec”的模型可以通过强大的机器学习算法,分析构成个人生命的事件序列,预测包括寿命、疾病风险、未来收入等各种重大生活事件。从研究结果看起来,预测器颇具成效。

报告显示,该模型预测死亡的准确率高达78%,比当下其他AI模型或者保险公司使用的方法高了11%。高度具体的数据是其成功预测的关键。论文第一作者苏恩·莱曼表示,他们使用了丹麦国家登记处的数据,收集了600万人的十年日常生活记录,具体包括教育、健康、收入和职业等生活方面的信息。该模型使用了2008年1月1日至2015年12月31日期间,从35岁到65岁年龄段内230余万人的数据进行训练。

作者莱曼向媒体解释称,选择这一群体是因为该年龄段的死亡率更难以预测。为了让“Life2vec”理解这些数据,团队把人类生活的每一部分都编成了一串代码。

例如,S52表示前臂骨折,POS3513表示这个人是计算机系统技术人员。研究团队把个人生活事件当成句子中的单词,然后再根据时间顺序,绘制出详细的“个人生活序列”。“我们使用ChatGPT背后的技术来分析人的寿命,方法是将每个人生活中发生的事件表示为序列。”作者莱曼表示,“就像语言一样,生活事件发生的顺序非常重要。”与ChatGPT的原理类似,“Life2vec”也是通过大量数据来推断未来可能发生的事情。

例如,你问它“我会在四年内死亡吗?”,它会查看你过去的生活事件,包括你如何思考、感觉和行为,以及可能影响生存的遗传或环境等其他因素,然后根据统计模型为不同场景分配概率,预估出未来事件或死亡风险。为了测试“Life2vec”的效果,研究人员让模型对随机挑选的匿名人士的死亡时间进行预测。

团队选择了一组10万人的数据,其中一半人在2016年后的四年内死亡,一半人存活,然后让算法对这个人能否活过2020年进行判断。令人惊奇的是,模型预测准确率达到了78%。“Life2vec”模型能够实现对死亡的预测,一方面得益于强大的数据支持,另一方面则是因为大模型算法已经进化到可以捕获大量非结构化单词序列。

“该模型通过借助于注意力机制模型的能力,挖掘出了序列中的隐藏的深层特征,更容易拟合预测目标。这在除开语言的其他场景中拥有很好的潜力。”百图生科AI算法负责人王太峰接受界面新闻记者采访时表示。过去大模型主要被应用在自然语言以及图像处理等科学领域,而较少被应用于泛科学等社会经济领域。“科学与泛社会科学领域(包括语言学)的主要区别在于,科学领域存在客观规律。

这意味着大模型可以从这些规律出发,而不仅仅依赖于数据本身。”深势科技的研究人员进一步对界面新闻解释说,“但人类生命是一个复杂的系统,AI在生命科学领域的进步,需要该领域专家把这些问题拆解成AI可以有效解决的具体问题。”除了预测死亡,这款模型还具有一定通用性,能够预测出性格特征、幸福程度、职业成果等更为主观的人类细节。举例来说,它可以根据人们过往的工作经历来预测职业成果,告诉人们是否会更换工作或提前退休。 “Life2vec”的更大价值在于提供信息和指导。

比如未来它可以综合考虑生活方式、遗传基因、收入程度等多方面因素,在健康风险预测、个性化诊疗方案制作等方面提供更为科学准确的分析。当然,“Life2vec”仍存在许多缺陷和风险,首当其冲的便是数据安全问题。由于模型需要获取大量收入、疾病史等个人数据,一旦用人单位或者保险公司知道了个人存在的疾病风险,极有可能会影响就业或参保。 其次,预测结果的可靠性也无法完全保证。

一位头部大模型企业的产品专家向记者解释称,模型预测结果会受到数据质量、模型参数、模型假设等诸多因素的影响,有不确定风险。同时,人们是否想要知道自己能活多久也没有定论。对于大多数普通人来说,预知死亡或许意味着更大的恐慌,接下来的生活很可能在长期笼罩的焦虑中度过。

为保护用来训练的丹麦公民的个人隐私信息,该AI模型并未对公众和保险公司开放。作者莱曼对CNN表示,在目前的状态下,Life2vec还没有准备好执行任何“现实世界的任务”。同时鉴于经济与社会的差异,关于该模型能否应用于其他国家仍不清楚。

数百家初创公司,没撑过AI爆发式增长的2023年

以下文章来源于智能涌现 ,作者王怡宁

自ChatGPT掀起全球AI创业浪潮以来,一年多时间过去了。2023年的AI初创公司,都活得怎么样了?据PitchBook,2023年美国投资者向创业公司注入了1706亿美元,较前一年下降了30%。但值得注意的是——人工智能初创企业拿走了三分之一的蛋糕。其中, 仅仅是OpenAI和Anthroric两家,就占据了交易总额的10%。投资机构Next Round Capital创始人Ken Smythe更是直接表示:

现在但凡是名字里带有AI的初创公司都有很高溢价。

在这股浪潮之下,OpenAI、Anthropic、Midjourney等明星AI初创估值狂奔。除了大厂外,中小创业团队和独立开发者们也纷纷涌入AI领域,聚焦细分市场应用的小型AI产品层出不穷。创业者希望抓住这波AI机遇,打造出具有影响力和价值的产品。不过,一边是热火朝天的创业,一边是悄无声息的沉寂,大多数水下AI创业项目都可能难逃失败的命运。2023年,依旧见证了数百家AI初创企业的消亡。

瞬间滑落的昨日明星,曾估值15亿美元提到落寞的AI初创公司,Jasper必然是其中之一。一年前,Jasper还是AI领域前途无量的明星公司,但就在今年,Jasper却是从起高楼宴宾客,再到迅速沉寂。

缺乏技术竞争力,是主要原因。当OpenAI从Jasper的技术提供商,转变为自己下场参加比赛的运动员,那些高度依赖OpenAI的所谓“创新”公司们的失败快得出人意料。Jasper的成功,离不开天时地利人和。2020年,Dave Rogenmoser因为第二次创业获得了知名创业孵化器Y Combinator的投资,率先拿到GPT-3的内测资格,结合自己擅长的营销领域,他带着团队开发出了更用户友好的Jasper。在大模型还未掀起全球浪潮时,Jasper乘着AI的风口起飞。截至2022年底,Jasper估值一度高达15亿美元,拥有100万用户和7万付费用户,公司年营收也预计达到7500万美元左右。面对外界对公司是否有护城河的猜测和质疑,当时意气风发的Dave在采访中自信表示:

即使日后OpenAI推出新一代模型,Jasper依然会是发令枪响后跑得最快的选手。

但事与愿违,他等来的却是半年后流量下滑一半,不得不在7月宣布裁员的事实。在社交媒体X上,Jasper的官方账户直到去年11月中旬,还在发布新的帖子,强调自己在品牌营销领域的优势。但只有寥寥无几的互动数据,和一条付费用户指责它们欺骗并试图维权的评论。随后,这家昔日明星创业公司在X上的更新停留在了11月29日。

因为和OpenAI正面竞争导致业务遭受重创的还有Deepgram,一家专注于语音识别和语音文字转录的AI初创公司。巅峰时期,Deepgram估值达到2.67亿美元,拥有Madrona Venture Group、Tiger Global Management和Y Combinator等投资机构加持。但在OpenAI推出价格更低的开源语音识别软件Whisper后,元气大伤的Deepgram也在去年两次宣布裁员。当然,像这样的例子在ChatGPT快速更新迭代的一年里不胜枚举。The informantion更是在最近一次OpenAI的开发者大会以后,将ChatGPT的更新对其他AI初创企业的影响称作“灭绝事件”(Extinction Event)。虽然Jasper的现状令人唏嘘,但作为初创企业,它的成功仍有可学习之处。

作为创始人,Dave虽然没有技术背景,但优势在于能在技术发展早期识别可落地的细分赛道,快速规模化。在创立Jasper之前,Dave的两次创业都与营销相关。第一次,做营销领域的知识付费;第二次,他开发了能够实时显示他人下单商品的营销插件。过往积累的经验,帮Dave找到了AI写营销文案这一赛道,形成了Jasper早期的差异化竞争优势,这点值得后来者学习。

消失在2023的AI初创当然,Jasper的失败并不是个例。有时候,即使没有来自竞争者的打击,初创公司也不一定能熬过亏损期,另一家独角兽Argo AI就是这么消失的。

2022年底,烧光了36亿美元融资后,智能驾驶初创公司Argo AI宣告破产。不同于小打小闹的创业,Argo AI背后站着的,是财力雄厚的福特汽车和大众汽车,但他们还是养不起如此体量的吞金兽,纷纷表示要更专注于能够在短期内产生回报的业务。

除了媒体们争相关注的明星公司们,更多小公司甚至来不及泛起一些水波,就消失在大公司们随手掀起的一个浪花里了,好在有个网站为他们树了赛博墓碑。智能涌现发现,国外有一个叫“Dang!”的网站开设了AI Graveyard(AI坟墓)板块,记录上百个目前已经停止运营的AI项目,其中不乏一些有趣的创业项目。

AI搭讪语生成器

当很多用户使用Tinder这类聊天约会软件时,经常会遇到的一个困难是:第一句话说什么更容易被回复?尤其是刷到心动对象以后,一句平淡无聊的开场白很有可能迅速被淹没在对方的聊天框里,将一段潜在的浪漫关系扼杀在摇篮中,AI Pickup Lines就希望帮用户解决这个问题。

根据设定,用户可以选择一个特定的主题和风格,比如萌宠、音乐、旅行甚至是诗歌,AI Pickup Lines会依照用户的要求生成无限的搭讪语,让用户不必为想出一句合适的问候而抓耳挠腮。当然,想要让AI帮你提升魅力,也得花点钱。AI Pickup Lines提供不同的订阅方案,每个用户每天有十条免费额度,如果用户想要每天生成无限条内容,可以选择9.99美元/月或99.99美元/年的订阅服务。而如果是AI Pickup Lines的超级用户,还可以选择499.99美元买下超过10万条搭讪语的整个数据库。失败原因:虽然AI Pickup Lines的创意点选得不错,但本质上它还是一个套壳大模型的产品,所谓的包含10万条搭讪语聊的数据库,在质量和数量上甚至不一定能比得过ChatGPT,想要说服用户单独为它付费实在不容易。

PromptBox提示词管理器

最早的一批AI工具用户大概都体会过写出一条好的提示词的折磨,有时候让AI能够准确理解你的意思并按照你的要求生成内容就已经能难倒一批用户了。PromptBox作为一个用户友好的免费第三方工具,就简化了AI提示词的管理,提供了一个简单的过程来有效地保存、组织、复制和粘贴AI提示词。比如,对于一些常用的提示词,用户就可以右键单击提示,然后选择“ Save to Promptbox”进行安全存储。失败原因:各家模型都在“卷”操作方式的用户友好程度,很多提示词现在可以用自然语言就写,PromptBox不幸成为时代的眼泪。

Photofix照片修复器

不少人可能都遇到过的一个难题是,好不容易有个假期出门旅游,没想到景点里是人人人人从众的景象,终于挤到标志性建筑物前拍照留念,回来一看背景里竟然还有三个路人。Photofix就旨在帮助用户轻松地去除照片中的杂物和多余的人,从此不用再上网求助PS大神P掉路人了。

除了以上功能,Photofix还能提升照片的分辨率,以及文生图功能,用户可以生成《绝命毒师》、吉卜力和写实三种风格的图片。根据任务的复杂程度,平台提供了每张图0.39-5.99美元的价格选择。如果用户想要商用,比如编辑产品图,价格则在0.49-9.99美元之间。失败原因:Photofix虽然在实用性上比AI Pickup Lines好了不少,但和上一个项目类似的是,不管是照片编辑还是文生图的功能,头部模型如Midjourney、Imagen2、Runway等都能提供更多更好的选择,何况价格也没有贵多少。

iQuit一键生成辞职信

当一个打工人下定决心决定辞职时,大概连多花一分钟构思辞职信都觉得麻烦,于是就有开发者贴心上线了这款AI一键生成辞职信的应用——iQuit。

iQuit可以根据用户输入内容生成个性化的辞职信,如用户的直属领导、离职原因、日期和语气等,确保信件适合每个人的具体情况,为打工人们节省了宝贵的离职时间。在付费方案上,每个用户注册后都可以获得两个积分用户免费试用,后续需要再购买积分来付费生成内容。不过,iQuit并没有提供清晰的定价模型,所以用户需要直接与开发团队联系获取定价信息。

失败原因:一键生成辞职信是一个非常有趣的点子,但对于一个创业项目而言,iQuit选择了一个和通用大模型功能太过垂直的赛道——毕竟,这个工作交给ChatGPT也能做的很好。另外,写辞职信是一个低频行为,想要在这部分用户中找到一小群付费用户,并且支撑起项目长期存活更加困难。

寒气中求生:重视现金流,做好“小”生意

失败的公司让我们看到,即使站在了AI的风口上,也不一定能“飞起来”,甚至还有可能因为各种各样的错误坠入深渊。当然,除了从失败者身上汲取教训,大多数人可能更关心的问题是:什么样的AI初创企业在今天能够成功?捂紧钱袋子,守好现金流
从数据来看,2023年是当之无愧的AI之年,AI行业拿到了巨量的资金。据Statista统计,2023年前三季度,全球范围内人工智能初创公司的融资笔数分别达到574、614和501笔,融资金额分别为152亿、94亿和83亿美元。

尽管今年AI赛道的投资如火如荼,但我们不能因此忽略的一个事实是:无论是在国内还是硅谷,多数投资机构都经历了一个“寒冷”的2023年。PitchBook的数据显示,美国风险投资公司在2023年筹集了670亿美元,同比下降60% ,为6年来的最低水平。资本侧的寒意很快也会蔓延到初创企业一端。据The information的“创造者经济数据库”(Creator Economy Database)最新数据,在数据库覆盖的350多家全球创业公司中,2023年募得资金量继续螺旋式下降,同比下降近58% ,至约17亿美元。其中人工智能初创企业在融资份额中占比最大,超3.24亿美元。仅对美国初创企业的投资同比下降62% ,至10.3亿美元。

国内的数据呈现相似的走势。根据IT桔子数据,截止到当年11月20日, 2023年中国人工智能赛道在一级市场的总融资事件数有530起,与去年同期相比减少26%;总融资交易额估算有631亿元,与去年同期相比下降38%。

在这样的市场环境下,“马太效应”进一步加剧。资金们挤着排队去找本来就不缺钱的头部明星企业,但大部分普通AI初创企业的境遇则非常窘迫。这也意味着,对于大部分AI初创企业企业而言,在创业初期就要重视现金流这个生死攸关的指标。就像前面提到案例一样,Dave之所以能在Jasper的创业初期成功,是因为第二次创业失败赔本的经历给了他一个狠狠的教训,让他在开始做Jasper时就明确了赚钱这个首要目标。不做亏本的生意才能让自己和公司活下去,这是很多在AI行业试图依靠烧钱闯出一条路的投资者们最需要补上的一课。对于独立创业者和小团队而言,不要过度依赖外部资金,从打造一些微型的Saas应用出发,实现每月较为稳定的现金流,并用这些资金继续迭代优化或开发新的产品,是一种更健康且可持续的运营模式。

关注垂直赛道 回应真实需求

另一种常见的创业失败方式在AI的热潮中再次反复上演:拿着锤子找钉子

创业者想让AI把所有行业重塑一遍,但没有考虑过真实场景中用户的需求。就像Jasper一度能够成功的原因,是创始人Dave早就在广告营销领域积累了多年经验,一直在一线和客户打交道,也知道他们真实的需求,才能做出广告主们愿意为之买单的产品。在今年7月一篇引发硅谷AI圈内讨论的长文中,AI创业者Sam Hogan也总结到,专注于垂直细分领域,真正让人工智能革命性提高行业生产力的初创公司才更值得期待。

在他预测的这类公司中,有已经成功的Runway,也有最近才完成新一轮融资的Harvey,后者致力于用AI帮助法律从业者完成一些费时费力的标准化工作。这些初创公司的共同特点是,选择了一个需要强know-how的垂直行业。比如,Runway专注设计领域、Harvey专注法律行业——法律行业流程漫长,律师的工作流程繁杂,并且核心数据大部分也都不对外公开,这会成为初创公司发挥力量的好赛道。

小而美的团队

观察不少今年涌现出的AI初创公司,共同的特点是团队构成非常精简。比如欧洲开源模型公司Mistral AI团队仅有20人左右,估值已达20亿。还有刚刚爆红的文生视频公司Pika,公司也仅有4名正式员工。相对于财大气粗的科技公司如Google、苹果和微软,或是国内的阿里、字节、腾讯,初创公司无法负担也不需要那么多员工,在创业初期保持一个小而美的核心团队,不仅能让内部沟通更加顺畅,任务执行效率更高,还能保持成员们对一线业务的敏感度,更及时地回应业务需求。

“红衣大炮”周鸿祎:AI发展的十大趋势

AI发展十大趋势:

一、大模型无处不在,成为数字系统的标配。

二、开源大模型将会爆发。

三、小模型会涌现,运行在更多终端。

四、大模型企业级市场崛起,向产业化、垂直化方向发展。

五、Agent智能体激发大模型智能,成为超级生产力工具。

六、2024年成为大模型应用场景之年,ToC出现杀手级应用。

七、2024年多模态会成为大模型标配。

八、文生图、文生视频等AIGC功能实现突破性增长。

九、具身智能赋能人形机器人产业蓬勃发展。

十、大模型将推动基础科学取得突破。

近日,360创始人周鸿祎在主题为“挺住才有出路“的一场演讲中,分享了以上对人工智能大模型的十大趋势判断和相关看法。

周鸿祎是中国互联网安全企业360集团创始人兼CEO,知名投资人、知名创业导师。其创立的360是最早布局大模型的国产厂商之一,“360智脑”也是国内首个原生安全大模型。

以下是整理的精华内容,分享给大家:

美国投资界把人工智能大模型看成是80年的PC,1995年的互联网,看成是工业革命的机会。而且他们还觉得,一旦美国在人工智能上形成了优势,对其他国家和全球竞争来说就属于降维打击。日本有失去的30年的原因在于,明确错过了电脑和互联网两大机会。而美国在电脑和互联网上成功实现了自己的升级。不管是创业者还是普通人,人工智能都能我们能碰到的最大机会。工业革命让所有行业都实现了洗牌,比如互联网对汽车工业的洗牌,特斯拉的出现改变了人们对于买车的想法。

人工智能会带来洗牌的机会

人工智能不仅是规模最大,也是速度最快的工业革命。如果这个世界亘古不变,那确实对大家来说没有什么机会。所以我觉得人工智能会带来洗牌的机会。

希望大家关注人工智能在2023年最大的突破,就是大语言模型实现了真正的人工智能,来到通用人工智能的拐点,而且在奔着强人工智能的方向,在飞快地一路狂奔,而且技术发展遥遥领先。大模型可能对我们国家,对我们的产业,对在座的各位来说,对创业者来说,可能都意味着不同的机会。

我讲一讲大模型的10个趋势。

趋势一:大模型无处不在,成为数字系统的标配。

我不认为大模型是操作系统。全世界的手机操作系统就鸿蒙、iOS、安卓三款,大模型更像当年的PC一样,未来会无处不在,成为整个企业数字化、政府数字化的标配。当年超级计算机的创造者说过一个断言,说计算机这东西,全世界就需要5台。

结果现实无情地打了他们的脸。今天有多少台电脑?在座的诸位家里至少摆着一台电脑,办公室一台笔记本,你们兜里还揣着一台电脑,因为你们的手机也是。所以大模型不会被垄断,不会说全中国人民、全世界人民都用一个公司的大模型。我认为大模型会无处不在。

趋势二:开源大模型将会爆发。

最早的大模型是闭源的,闭源刚出来的时候,我们一看OpenAI做的东西,感觉这就是「曼哈顿计划」,美国人把原子弹造出来了。后来发现,人家一开源,科技就进步,所以要感谢开源。现在国内也有很多开源的模型,就是基于国际开源的模型。所以开源大爆发之后,大模型就瞬间从原子弹变成白菜了。今年年初有人创业想搞原子弹,那到年尾,就发现自己做的是茶叶蛋的生意。

未来的矛盾不再是大模型本身怎么样,而是谁能够利用大模型结合自己的业务和场景,能够把它训练出自己所需的专属功能。

趋势三:小模型会涌现,运行在更多终端

有大必有小,阴阳是两个方面,一方面现在很多公司在思考,如何把模型进一步做大,从千亿的参数做到万亿的参数。但现在出来一个趋势:把模型做小,在十几亿、几十亿或者不超过100亿的模型上,效果也能差不多。

模型做小有两个前提,一个是模型做专业。模型什么都要会,那确实要很庞大,但如果这个模型就是写点东西,或者做点翻译,那专业的模型可以做小。做小还有一个好处,就是可以运行在更多的终端。像高通去年推的CPU,还有苹果推的CPU,都已经意味着在手机、Pad、电脑上,这种小参数的大模型已经可以跑起来。

2024年大模型一定会上车。因为车上有了大模型之后,车里那个对话助理才不会表现得像白痴一样,真正帮你解决很多问题。

趋势四:大模型企业级市场崛起,向产业化、垂直化方向发展。

大模型企业级市场在2024年会起来。虽然大家天天都在秀自己大模型的成绩,说你看我的会脑筋急转弯,我的会解小学奥数题,我的会写藏头诗,但玩多了发现跟业务毫无关系。2024年中国的toB业务,企业级市场会起来。大模型要走深度化、产业化、垂直化、深度定制的方向。

趋势五:Agent智能体激发大模型智能,成为超级生产力工具。

结合“智能体架构“,大模型长出手脚。第五个稍微偏点技术,OpenAI最近也在弥补,刚有了大模型的时候,大家觉得聊天机器人确实人机界面很简单,但做久了就发现,聊天机器人不太解决问题,仅仅是陪你聊天,最多就是一个PUA能手。

所以在2024年,一个新的概念叫「智能体架构」。英文叫Agent框架。大家要关注Agent,叫智能体概念。没有Agent框架,大语言模型几乎不能投入实用。

所以今年无论在做toC的业务,在做企业级的应用,大模型一定要结合智能体框架,才能真正让大模型长出手脚,让大模型真正跟你的业务系统,跟整个互联网充分打通。

趋势六:2024年成为大模型应用场景之年,ToC出现杀手级应用。

很多人都在问,在消费者端,大模型到底有啥杀手型的应用?中国会产生什么杀手级应用,我还不知道,但是2024年一定会出来。美国有三家公司很有意思,一家叫微软,一家叫Adobe,还有一家叫Salesforce,他们没有用大模型做任何新的东西,而都是把大模型跟已有的产品和场景做了一个充分的结合,就焕发了新生。

比如微软选择了Office、Bing和Edge浏览器;Adobe选择的是它擅长的图形编辑、视频编辑。所以我觉得大模型出来之后,在To C领域意味着,我们今天的搜索、浏览器、信息流、短视频、微博、问答,甚至我们的社交可能都会用大模型来重塑一遍。至于是战术性重塑还是战略性重塑,就看各家的做法,所以2024年一定会出来这种杀手级的应用。

趋势七:2024年多模态会成为大模型标配。

第七个预言,大模型在去年主要讲的是文字能力,写稿的能力。2024年,以Gemini和OpenAI的GPT-4V版本为代表,多模态会成为未来的标准。多模态不仅能听会说,关键是它能看得懂视频,能看得懂图片。

趋势八:文生图、文生视频等AIGC功能实现突破性增长。

在大模型的支持下,AIGC会有突破性的增长。去年年初Midjourney画一张图,一看就是AI画的,经常把人画成6根手指。再到年底来看,计算机生图已经和摄影师的作品不相上下了。年初AI产生视频的能力,几乎都是动图、表情符号的能力,年底有的已经做得像好莱坞动画片了,所以这个进展特别快速。

趋势九:大模型拯救机器人行业。

大模型拯救了机器人行业。在大模型出来之前,传统的人形机器人是典型的智障产业——做得像人,但是能力极其低下,因为它不具备对这个世界知识的了解。但是有了大模型之后,机器人的产业获得了一个革命性的发展。这两天热炒的一个机器人,可以自动煎蛋,自动做家务,自动整理衣服,这完全有赖于大模型的加持。

趋势十:大模型将推动基础科学取得突破

为什么中国一定要做大模型?大模型不仅仅是语言工具,也不仅仅是聊天机器,大模型也不仅仅能在我们很多业务中发挥作用,其实大模型可能成为人类有史以来发明的最伟大的工具,成为很多科学家的工具。我们今天之所以能享受互联网,享受很多新能源,是因为前100年这个世界的物理学家取得了关键性的突破。

但在最近五六十年,人类在科技上已经很久没有突破,所以如果大模型能够成为科学家的工具,比如在美国,很多生物学家已经开始用大模型来帮助他们研究蛋白质的结构,研究分析基因。

所以我希望2024年,大模型能够推动基础科学取得突破,变成我们科技发展的利器。企业家要有AI信仰,抓住机会All in AI简单的建议是,你要有AI信仰,就是你要believe something,你要相信。

AI信仰怎么判断呢?很简单,我提了几个标准。

第一,在座的诸位可以回去扪心自问,你相不相信这次大模型是真的人工智能的拐点,还是不相信,认为是假的人工智能。

第二点,你相不相信它现在的发展速度会以指数级别发展;你相不相信它未来智力的发展速度会迅速超过我们人类;你相不相信它会是一场工业革命,在3-5年里,它会重塑我们每一位所在的行业,会重构我们的产品、业务链条和内部管理流程。

最后,除了重塑包括我们所有的产品和业务之外,还有你相不相信,你不会被大模型淘汰,但你会被那些用大模型的公司淘汰。

没有AI信仰的人看大模型,容易看不起,看不起是因为看不清,是因为心态的问题。因为看不起,所以也不愿意放下身段去琢磨,所以就看不懂,等到哪一天他们醒悟过来,已经看不见了,人家遥遥领先了。

第二个建议,就是要All in AI。什么叫All in AI呢?

真正的All in AI是你在公司里面,把信仰落实到行动中,在你的公司里让AI无孔不入。

比如说从上到下,组织里面从老板到你的中层干部,到你的员工,是否都在学习和使用AI?

还有我们有哪些业务流程可以被AI塑造?比如市场部是不是在用AI去做图?程序员是不是用AI编代码?HR是不是在用AI梳理简历?就是从小处着手,到公司内部。

还有要把产品重新思考一下,敢不敢做自我革命的事情,所谓”要想成功必先自宫”。你能不能把你的产品用AI去想,能够加持什么功能?

所以我觉得这是未来最大的一个机会。科技公司微软和Adobe,All in AI把已有产业用人工智能重做了一遍,都取得了很好的成绩。未来3-5年,如果不能用AI变成自己的武器,那么你的对手会对你造成降维打击。同样,AI虽然不会让你失业,但是会用AI的同事,会让不会用AI的同事失业。AI绝对是业务驱动的,只有在你公司从上到下、从内到外,让大家都对AI感兴趣,让业务专家都了解AI是怎么回事,我认为你才可能在未来这3-5年时间里,用AI来帮助你实现转型。

(来源:360创始人周鸿祎“挺住才有出路“的演讲)

环球AI现状:世界并不总是平的

“人工智能领域的泡沫,总是在不断产生又破灭中循环。”梅拉妮·马歇尔在著作《AI3.0》中,这样描述人工智能领域5到10年的周期循环。2016年,击败围棋世界冠军李世石后,AlphaGo短暂掀起人脸识别、自动驾驶等人工智能浪潮。2023年,ChatGPT的横空出世让大模型成为AI界当之无愧的“顶流”。

泡沫破灭,资本冷静后,不理智的潮水终于褪去。如今,AI界鲜少再重谈人脸识别,自动驾驶难以落地,而在国内,大模型也从当红炸子鸡慢慢成为投资人投不起的领域。研究人工智能的群体已经熟悉了这一模式:在“人工智能的春天”,投资机构过度承诺,媒体过度炒作,紧接着便会迎来“人工智能”的寒冬。环球并不同此凉热。在美国,VC圈对人工智能投资热情不减。而在积极拥抱AI的东南亚,中美正在进行AI技术与投资的角逐——2020到2021年,来自美国和中国的投资者,参与了267笔东南亚人工智能公司的投资交易,占总投资比重40%。

一个可喜的现象是,在东南亚,科大讯飞、华为、海康威视等中国科技公司与东南亚当地产生千丝万缕的联系,中国科技企业正成长为东南亚AI界的中流砥柱。曾经,普利策奖得主托马斯·弗里德曼在《世界是平的》中,说世界的竞技场已变得更加平坦,变平的世界让每个个体、区域都站在同一水平线下。环顾全球AI界,我们发现,世界并不总是平的。全球范围内,不同区域AI风向有何不同?

当AI企业走出国门,又会迎来哪些机遇挑战?ChatGPT为什么并不脱胎于腾讯、谷歌等数据集庞大的大厂?对于AI初创企业有什么启发和意义?

现在整个国内投资界几乎形成了一个共识,就是“大模型的投资热正在冷却”。

作为今年创投圈最火热的赛道,大模型曾炙手可热,无数科技大厂、AI创业公司掀起一股又一股的大模型浪潮。而今全球科技公司对大模型的竞争,正进入存量时代。根据IT桔子数据,截止到2023年11月底,国内人工智能赛道一级市场的总融资额有580起,比2022年减少了26%,总融资金额是630亿元,与去年同期也下降了38%。而在大洋彼岸,美国的大模型融资依旧如火如荼。

根据Crunchbase数据,去年VC阶段的投资有11%流向了人工智能赛道,截止到今年下半年,2023年的比例增长了26%,有26%的VC阶段的投资都流向了人工智能美国投资界对大模型的参与热情不减反增。大洋东西,AI融资正面临不同境遇。这背后,不同融资环境差异到底是如何造成的?

首先,在美国,大模型已经达到了能够产生巨大经济效益的规模,并且在一定程度上影响了宏观经济。有研究发现,这一次自硅谷刮起的大模型之风,已经为美国的GDP贡献了一个百分点的增长。而在中国,虽然百模大战愈演愈烈,但大模型的变现之路仍处在摸索的初级阶段,而商业化问题一直是上几轮AI浪潮下,难以找到最佳solution的老难题。

其二,在中国尚未出现像OpenAI一样的应用层全栈式AI公司,能够从基层大模型、中间层一直做到应用层。而大模型这种极度依靠大算力暴力美学的领域,对于初创公司来说,太烧钱,门槛太高,堪称军备竞赛。大模型不能投,但应用层又没有特别多的公司出来,投资圈开始冷静思索,大家都处在观望状态。

华映资本海外合伙人邱谆认为,这背后体现了中美技术原创能力的不同。“硅谷还是一个以原创技术为核心的,为基座的驱动力,这还是很重要的,中国的优势在于优化,不一定是原创,就是人有我有,可能人有我优,再者规模化,上一波深度学习驱动的机器视觉,可以说是AI1.0,现在大语言模型算是AI2.0, 这两波浪潮国内目前的参与都还主要在优化和规模化方面。

”1997年从北京大学毕业后,邱谆就去美国学习人工智能,从南加州大学信息科学研究院毕业后,他加入了硅谷传奇科技公司——思科,前几年回国后加入了投过壁仞科技、星辰数据等AI领域知名公司的华映资本。他持续关注中美、东南亚等地的AI创投。时间倒回到千禧年,邱谆仍在硅谷深耕技术,那时正值AI寒冬,但整个硅谷还是在不断的积累,很耐心地等待下一个突破。

“但如果我们到大洋的另外一面,就会看到一般来说,是在等美国出现下一个突破之后,我们再去投入,去做优化和规模化的事情,所以它会有一定的延迟。”“这个突破前的积累过程其实可能是需要一些耐心的,在这个阶段过去之后,我们就真的到了互联网.com那一波,就是中间层的相当于一个接口能够出现的时候,这时候才到了应用层大量涌现的时候,在中国可能就会出现大量的像当年滴滴等一堆互联网公司,这个时候可能还是会需要一定时间,可能大家还需要一定的耐心。”

在中美之外,东南亚也成为中美大模型交锋的主战场。

在东南亚,AI还正方兴未艾,虽然落地步伐相对慢,但还是能看到希望。整个东南亚地区的国家,都在拥抱AI。中美两股AI旋风正在东南亚交汇。AI在东南亚并不算是新兴行业,在大模型浪潮之前,东南亚就因低廉的人力成本等因素聚焦了智能客服、人工标注等AI相关应用。

但在今年来到东南亚后,科大讯飞云平台事业群副总裁周传福明显的感受是:除了原来的这部分传统项目,现在更多地看到像政府部门、媒体行业、金融行业等都在更加热烈地讨论、拥抱AIGC、大模型等新技术。虽然目前东南亚使用最多的还是来自OpenAI等欧美AI公司的大模型,但在东南亚AI界,也不乏科大讯飞、华为、海康威视等中国科技公司的身影。

科大讯飞、阿里巴巴相继在东南亚推出大模型,东南亚国家队也加入大模型竞赛,新加坡政府投入5200万美元的资金支持AI多模态大模型开发计划(NMLP)。周传福说:“东南亚虽然是一个区域,但是打开来看,很多国家都有很大的不同。

新加坡是东南亚唯一一个发达国家,它的AI落地会更快一些,像教育等等部门或者行业都有很多的落地应用。相对来说,新加坡(AI落地)走得比较靠前,活跃度更高,但是像马来西亚、印尼、泰国等等国家也能深刻感觉到比原来更加热烈,当然整个落地步伐相对慢,但是还是能看到希望。我们也会长期坚持在这些地方深耕。”

而越南在人工智能的竞赛里也存在弯道超车的可能。摩根大通曾分析称,越南处于新兴东南亚人工智能发展的“前沿”。早在2021年1月26日,越南政府总理批准的《到2030年国家人工智能研究、开发和应用战略》中,就明确了将人工智能发展成为支柱工业产业。

英伟达CEO黄仁勋也再次押注越南AI,2023年12月,英伟达CEO黄仁勋会见越南政府总理范明政,并承诺将在越南建立半导体基地,将越南打造成为英伟达的第二故乡。

东南亚已成为科大讯飞海外业务的第一站和战略中心。2023年6月,科大讯飞携星火认知大模型与C端智能硬件,在新加坡举办产品发布会暨讯飞AI TechDay·新加坡站活动。

因为科大讯飞一直以相对底层技术的创新、研究为主,所以如果把这些技术用在更多的场景、更多的设备单靠科大讯飞自己其实不行。所以整个开发者生态方面花了很大的力气。”周传福说,在东南亚的开发者生态方面,科大讯飞搭建了以新加坡为中心的讯飞开放平台国际站。

“其实我很羡慕,羡慕的点在于C端酷炫的产品是很容易抓到消费者的,但是底层技术的可能讲两天人家都不知道你在做什么。所以整个生态方面就是把技术落地应用生态是我们长期布局,不是靠一年两年,至少3-5年才能把一个基础做好,这是目前整个状态。

当然在东南亚我们也看到了很多的突破。”他认为,在这些突破的背后,离不开技术创新本地化

东南亚历史文化背景复杂,移民的跨国流动使得东南亚形成不同方言体系的多族群社会,各个地区方言众多。比如印度尼西亚的官方语言主要在雅加达一带通用,但其他地方又有非常多的方言

而要做语音识别和合成的核心技术创新,就要在提升通用能力之外,针对不同方言区域的口语场景去做提升。另外,识别合成大模型领域也是科大讯飞寻求突破的重要底层技术。本地化是出海中企必须要面对的一个挑战,而对于科大讯飞来说,这也是不得不做的事情。

因为科大讯飞要面对很多B端用户场景,其中并不存在捷径,他们已经做好了深扎两三年的准备,才能在当地把行业做熟做透。目前科大讯飞的东南亚团队规模还不是特别大,大概在二三十个人左右,native speaker大概占到40%左右。本地雇员的职务多是以商务拓展,市场等岗位。

核心技术方面,还是以国内总部以及在当地派驻的技术支持为主。在国内团队和本地团队协作过程中,文化差异带来的挑战不可小觑。周传福认为,这种情况下,要把自己放到当地的国家去考虑问题,“而不能说我中国怎么怎么样,外国怎么怎么样,这对我们来说其实是一个适应的过程,说起来很简单,但真正把自己的定位要放到当地的国家。”除此之外,所有大模型企业要想跑通,都要跨越数据和人才两座大山。

让我们回到开头的问题:ChatGPT为什么并不脱胎于腾讯、谷歌等数据集庞大、人才济济的大厂?腾讯和微软数据一定是大过OpenAI的,为什么OpenAI有GPT,腾讯、微软和谷歌都没有GPT?这是因为对数据的有效利用和搜集非常关键。对初创公司来说尤甚,特别是想真正成为一家AI公司,或者只是被AI赋能的公司。

邱谆认为,私有性未必是价值本身的源泉。“你要真正能够利用AI肯定要有数据,但私有数据未必都有价值。这个对于初创公司要有一定认知。”积累和收集数据,一定要考虑算法。比如搭建数据栈平台,但它的门槛其实很高,因此光是收集梳理数据的准入门槛就将很多人拦在外面。甚至于巨头公司的数据都未必全有用。提到大模型浪潮下的AI军备竞赛,卷算力或许重要,但核心的算法人才才是这轮竞赛最重要的资源。

对于初创公司,邱谆的建议是,从现在开始去物色一些大模型算法核心人才:“作为一个初创公司,可能今天就要去搜寻一些真正核心的人才,听上去好像有点遥远,但我觉得我这个建议很可能是会有用的。对于一些初创公司,如果你今天就开始,不管你做什么,甚至你只是做应用层,都一定要过数据这一关,但光有数据又没有用,最后很可能是要看你的算法,不管你是什么算法,可能不用碰到基座大模型,但即便你要做微调,甚至只是去调API,都会需要对训练算法的深度认知,最重要的军备其实是人才。”这也是因为,目前国内大模型人才储备资源紧缺。

医者AI CEO刘呈辉曾对媒体表示,“现在国内做基座类模型的人才90%都出自清华,国内真正会调模型、训练模型的甚至不超过200个人。

而大模型抢人大战也让用人成本水涨船高,vivo副总裁周围接受媒体采访时曾表示:”vivo大模型现在每年20亿~30亿元的投入成本,总投入成本已经超过200亿元,人才和数据算力各占一半,人才成本平均每人税后100万元。

在当下,寻找核心人才资源对于初创公司来说尤为关键。大模型让全球的AI竞赛进一步加速进行,如何在全球化中找准自己的位置,并发挥自身优势,是所有AI企业需要面对的新课题。

对话智谱AI CEO 张鹏:让追赶OpenAI成为可能

以下文章来源于硅星GenAI ,作者油醋

1月16日,智谱AI发布新一代基座大模型GLM-4。GLM-4在基础能力上实现大幅升级,支持最高 128K 长文本,原生支持自动联网、图片生成、数据分析等复杂任务,并在多模态能力上有了长足进步。据智谱AI透露,在内部测评中,GLM-4在性能上逼近了GPT-4。GLM模型智能体和智能体中心也在GLM-4发布当天同步上线。此前,去年6月ChatGLM-2发布,去年10月ChatGLM-3发布,而去年3月GLM-4已经完成第一个版本。CEO 张鹏认为三到四个月完成一次基础模型迭代是正常的研发速度。

去年年初,这家中国最重要的基础模型公司定下了朝GPT-4追赶的目标,之后一年基础模型继续快速发展,Meta把持着开源生态,领头羊OpenAI拿出了GPT-4,谷歌带着Gemini姗姗来迟。基础模型的竞争者逐渐收敛到少数几家,而观察中国公司在其中的位置时,目前中国唯一估值超过百亿人民币的智谱AI或许是那个锚。在GLM-4发布之际,我们与智谱AI CEO 张鹏进行了一次独家对话。以下为对话实录:

对话人 | 骆轶航、朱正

什么最重要?模型,模型,还是模型

硅星人:我们先聊聊GLM-4本身。智谱AI对标GPT-4去做自己的升级和演进,这个整体思路是怎么样的,如何让追上GPT-4这件事看起来可行,并且可能还会有一些超预期的东西?

张鹏:首先肯定是模型能力方面差距的追赶,比如多模态能力,GPT-4在3月份发布的时候其实已经带来多模态能力了。我们判断对于AGI来说,多模态这件事情可能是必须要去解决的,所以这个能力你必须有。包括模型本身能力提升所带来的像CoT这样的高阶能力,它其实根植于你底层的基础模型的能力。第二件事是,有了大脑,需要眼睛和耳朵,手和脚——需要要把这些基础模型的能力辐射出去,跟外界系统产生更密切的交互,而不是简单的做文本和图像的输入输出。这个事情就偏向应用了。

硅星人:基础模型能力的辐射,这是关于Agent(智能体)的想法了。现在人们谈起Agent,正在陷入一个概念的陷阱里,智谱AI对于Agent的有什么自己的理解?

张鹏:Agent在人工智能或者说计算机科学史上是个“老概念”,有一套相对完整的解释体系。大模型下Agent找到了一个新的视角。但Agent的本源仍然是大模型的基础能力,大脑的智力水平足够高,才能去谈理解、推理、以及规划和执行这些事。智谱AI还是从技术角度的的定义和演进来理解Agent的。然后从大模型角度来看,Agent应该怎么去演化,怎么去提供这个能力。以及它跟需求语言之间应该如何相互翻译,找到通路去对应上。

硅星人:Agent和所谓的AI原生应用(AI Native App),这两者之间是什么关系?

张鹏:首先AI Native这个范畴还是太大,我们更愿意叫做大模型的原生应用。首先说大模型原生应用,它实际上是指的我们希望说从大模型的原生能力出发,去设计和开发的应用,我们期待它是一种新的东西,而不是说把原来的应用拿来做一个升级。这个是有的,比如ChatGPT,这个产品在工程化层面其实很简单,核心就是一个模型。而对于Agent,我们的理解始终是它是模型某种能力的外化,你可以把这种能力做成某种大模型原生应用。但Agent本身也会给应用的开发过程带来一些变化。当Agent能力被用在开发阶段,它又变成一个赋能原生应用开发的过程,Agent和大模型原生应用之间的逻辑应该是这样。

硅星人:就是可能大模型原生能力本身体现了Agent的能力,Agent某种程度上也在帮助大模型原生能力开发的自动化,这样一种关系。

张鹏:对。

做垂直领域最终是为了以后不做硅星人:智谱AI在垂直领域的商业化很早,给外界的感觉一直是比较 to B,GLM模型智能体会是一个跟GPTs很像的东西吗,还是不一样?

张鹏:商业化落地这件事还是围绕着我们模型价值本身。我们早期的模型能力不太够,那可能就需要去为了填补模型本身的能力和最终业务需求之间的gap,而去垂直领域多做一点事情。你不去做,你不知道客户在想什么,也就不知道你的技术最终帮助客户提升的用户价值到底有多少。这实际上是我们去寻找Best Practice(最佳实践)的一个过程。我们希望把这个路径蹚通,回过头来把这些东西沉淀下来之后赋能给生态。

硅星人:比如说RAG(Retrieval Augmented Generation,检索增强生成),智谱AI应该是国内最早把RAG用到垂直领域了的一个。

张鹏:算是比较早,因为LangChain整个开源项目里头就有我们。RAG是很典型的一个例子,就是从垂直领域沉淀出通用型的需求,以及一套方法。这套方法可以成为一种标准化的解决路径和产品。

硅星人:所以可以这么理解,我们做很多垂直领域的事,其实是为了反哺通用模型的基础能力提升。做的目的是为了以后不做。

张鹏:对。GLM模型智能体就是在探索一种更通用的路径。

传统互联网爆款产品经理不理解最新的AI技术

硅星人:智谱AI一直以技术能力见长,你怎么看现在智谱AI的产品能力,比方说我们能够支持多少个开发者在上面,怎么提供好的工具,甚至让开发者能得到更多曝光?

张鹏:如果我们现在真的进入到了大模型的应用半场的话,产品能力是大家都很关注的一件事。智谱AI之前也有自己的一些产品化的东西,其实用户量都还不错,我觉得产品能力应该来说还不算差,当然我们会持续的在这方面去加强。但是反过头来讲,你看ChatGPT,作为一个产品本身没有什么特别复杂的东西。所以——我个人感觉,因为我不是做产品出身——所谓产品力这个东西,在这个时代它变成了一种对需求的敏锐感知能力和对于新技术的领悟能力的兼顾,在这个基础上,考验的是如何揉合这两种能力,去产生一种新的产品表达形态的这样一种复合的能力。

硅星人:这跟移动互联网时期的小步快跑、快速迭代和敏捷开发这些东西可能是不一样了。

张鹏:这一套沉淀下来的产品开发逻辑还在,尤其是ToC。但为什么现在大家说要找一款所谓的Killer App这么难,好像所有的产品经理都没有头绪。我个人觉得其实矛盾在于,原来传统的互联网爆款的产品经理,他对于现在最新的技术没办法理解。真正懂技术的这些人,对于所谓的用户需求和产品需求又没法理解。

硅星人:那当一个基础模型开始面对开发者了,也就存在一个模型的技术和产品适配问题(technology product fit)。你们要如何跟开发者去讲,你能够做什么不能做什么?

张鹏:好像现在只能开发者自己去尝试,但在这之外,其实有一些本质的东西做产品的人可以在间隙思考一下。回到第一性原理,大模型本质上解决了什么样的问题,找到这个点,然后你把你所有需求写出来,然后你去找到这两者间的连线。比如我反问你,Chatgpt解决的是什么问题?你第一天用上,它就直接告诉你这是个不一样的东西,从来没有人想过这个问题——虽然他帮你解决了很多问题。

硅星人:所以ChatGPT解决了什么问题?

张鹏:我个人认为它最本质上解决的还是人机交互的问题。机器终于有一天能够比较像样的能听懂人说什么,然后说出来的话也让人能听懂。这个是个本质的问题,它弥合了人和机器之间的距离,这是他第一性要解决的问题。顺着这个思路,哪些场景可以被这件事情解决掉,很容易判断出自动客服这类的需求。这是大模型解决的第一件事。第二是大模型在经过大量语料数据训练之后,具备超越一般人积累的知识和数据量,能很好的去解答人们日常生活当中的问题。这件事本质上解决的是我们人类社会当中人与人之间的信息和知识传递的成本和范围问题。

硅星人:那些让人被迫为了一份工作要学习一堆无用知识的问题,或者说是知识的快速消化的处理的问题,现在都可以处理了。

张鹏:对,我有更低的成本,更大的范围去获取知识了。所以这个事情又可以cover掉教育、员工内部培训这些事情。所以如果按这种逻辑分析方式的话,其实还是能找出来一些大模型应用产品具体的方向的。

硅星人:那这样其实对做产品的人的要求是非常高的。过去互联网时期中国的产品经理群体里,设计师出身的人很多,做交互做UI的人很多。那时候美国的产品经理,一看全是MBA背景。那时我们会嘲笑这帮人做MBA的怎么做好产品,现在你发现还真得靠MBA去做产品经理。

张鹏:对,我特别赞同你这么说。这背后其实是大家在对于“一个产品需要满足什么需求”这件事的着眼点不一样。设计美术出身的产品经理居多,是因为我们认为移动互联网是一个注意力经济,我要做到的事情是抓用户的注意力,只要有人关注它、点开它,我的目的就达到了。因此整个产品、招的人也都会围绕这个目标构建。如果更在意的是整个互联网经背后的经济逻辑和价值逻辑,那就不会是这样。

生态好才是真的好,不要在摩擦中消耗力量硅星人:再度回到GLM模型发布的智能体,智谱AI希望给到开发者或者第三方怎样的一个开发环境。现在有两种方向,一种是往开发平台里边去堆各种各样的工具和能力,降低开发门槛,吸引更多人。另一种就是OpenAI这样只提供一个很简单的instruction,反正我有什么你都知道。

张鹏:我们比较接近OpenAI那种思路,首先还是强调基础模型本身的技术能力。模型能力足够强,你才有可能让大家真正用起来。在这个时间发布智能体,还是因为我们觉得我们模型的能力到了这个水平了,所以就开放给大家。至于工具是可以慢慢增加的。问题的根本并不在于说你工具多少,工具少的时候我能解决少的问题,工具多了能解决更多问题了。

硅星人:国外OpenAI已经通过ChatGPT走向大众了,国内一些入局大模型的大厂有自己的流量资源优势。目前智谱AI的姿态仍然是面向业界的,有没有想过转变成真正的面向公众的一个AI品牌,这个问题重要吗?

张鹏:首先这个事儿我认为还是挺重要的,我们有我们自己的理念和终极目标,但这个过程当中,作为一个创业公司要活得好,其实还是比较依赖一个良好的生态,生态这个事情就是需要去发声,需要跟大家去讲我们怎么想。做一场DevDay,做很多活动,一是希望大家多互动,也是希望把生态发展的理念传递给大家。大家好才是真的好,很多时候我们在摩擦中消耗了太多力量了。

硅星人:那再进一步,智谱AI有没有可能成为一个面向世界的,而不是仅仅是面向中国的AI公司?

张鹏:我们没有给自己设这个限制。智谱AI的目标是要做到全世界最好的水平,我们做的所有事情都是朝着这个大目标去的。

中国人工智能发展的优势与差距

人工智能被视为第四次工业革命的一个标志,发达国家和众多的科技公司,纷纷投入巨资展开研发和布局,我国也在全力构筑人工智能发展的先发优势。党的二十大报告指出,要推动战略性新兴产业融合集群发展,构建新一代信息技术、人工智能、生物技术、新能源、新材料、高端装备、绿色环保等一批新的增长引擎。什么是人工智能?人工智能将如何改变我们的生活?如何在这场技术革命中抢占先机?

一、什么是人工智能
人工智能的发展历史只有六七十年。人工智能也叫人造智能,就是由人制造出来的模仿人的智能,一般通过机器人、计算机等载体表现出来。人工智能有两个重要概念:一个是通用人工智能或者叫强人工智能,如果这种智能系统的功能、能力和人一样,甚至超过人,就叫强人工智能系统;另一个是专用人工智能或者叫弱人工智能,如果这个智能系统只能干一件事,尽管可能比人厉害,那它也是弱人工智能。比如常见的刷脸识别、语音识别系统。

1956年,10位年轻的学者,其中许多是图灵奖和诺贝尔奖的获得者,在美国达特茅斯市搞了一个暑期研究所。在两个月的讨论中,他们针对人工智能应该干什么、怎么干进行了一番讨论,列出了人工智能领域需要研究的自动计算机、编程语言、神经网络、计算规模理论等问题,并形成了一个比较前沿的报告,这被公认为是对人工智能一个比较完整的描述,这一年也被称为人工智能元年。


从1956年到1976年,这20年是人工智能发展的第一个阶段,这一时期的人工智能主要是在模拟大脑工作。这种模拟不是信号级的模拟,而是在逻辑推理等更高层面上去模拟大脑。

这一阶段比较珍贵的一个成果是数学定理证明,也就是用计算机自动进行数学定理的证明。包括代数定理证明和几何定理证明,都是由两位华人(王浩、吴文俊)完成的。后来研究人员发现仅仅通过模拟人的大脑来实现人工智能这条路太难走。因为当时只完成了数学定理证明这件事,战胜国际象棋冠军、机器谱曲等其他目标都没完成。人工智能逐渐从高潮跌到低谷,学者们开始反思是不是人工智能走歪路了,是不是要做点实事。


学者们开始尝试研发对社会有影响力的系统,比如医疗诊断专家系统、故障诊断系统,可以代替医生、专家去做一些诊断。另外就是模拟神经系统来做专家系统,这在字符识别、文字识别领域比较有效。后来应用到机器自动识别、自动分拣系统,包括今天的语音识别,基本上都是走的神经网络这条技术路线。


这两条技术路线使第二次人工智能发展专家系统的这30年,开创了百花齐放的局面。不过专家系统的高光时刻并没有持续太久,因为专家系统虽然做了很多,演示时效果也不错,但真正上线去用的时候效果并不理想,于是热度开始下降,直到2006年引发人工智能领域轰动的3篇重量级文章的问世,人工智能才开始了突飞猛进的发展。


这一年,多伦多大学教授辛顿、纽约大学教授杨立昆、蒙特利尔大学教授本杰奥,几乎同时发表了重量级的文章,从不同角度说明深度神经网络是大有可为的,是可以进行大规模学习训练的。

只要输入的数据好,它就可以解决问题。这一系列论文发表后,大家摸索了几年小有收获,但并没有重大成果产出。直到2010年以后,斯坦福大学华裔女教授李飞飞、普林斯顿大学华人教授李凯,开发了一个规模特别大的图像数据库,然后拿去参加比赛。当时比赛标准是谁做的系统错误率更低,谁就胜出。

2010年错误率最低的队是28%,2011年是26%,2012年取得了突破,降至16%。原来是辛顿的学生用辛顿公开发表文章中的技术去参加比赛,打败了所有的对手,这是一个重大进展。到了2013年,深度网络这个技术普及开来,其它路线无非是使用多深的网、多少个节点、参数怎么设定等技巧性改进,而不是方法上的革命了。

到2015年系统的错误率又实现革命性突破,降至3.6%,而人的平均错误率是5%,在图像分类这件事上,神经元网络已经超过人了。这事是谁做的呢?中国学者孙剑做的,当时他和他的团队提出了残差网络。这个残差网络,不仅在图像分类应用上是第一名,围棋里面也是最厉害的。基于此,在深度网络适合的那些弱人工智能是可以进行广泛应用研究和产业化的。

二、人工智能的特点和成长


从感知到认知,人工智能更上一层楼。

在智能水平上,感知智能日益成熟。智能可分为感知智能、认知智能和决策智能。感知智能是和我们眼看、耳听、手摸等感官直接相连的智能,现在的脸部和语音识别、机器翻译,以及诊断病人病例、产品残次识别,都发展得非常好,人工智能正在慢慢从一般的感知智能向认知智能进行升级。

类脑计算和量子计算,两条突破之路。

如果做更大规模或者做和认知有关的人工智能以及强人工智能,靠现有计算机是做不到的,怎么办?就要寻找出路,在技术路线上有两个比较可能的出路。一个是类脑智能,人对信息处理的能效比非常之高,现在的计算机不行,能效比太低了,类脑计算能效比会高一些。另一个是量子计算,其能效比是极高的,把量子计算做成比较稳定的一个系统是有可能的。当然不管是类脑、量子计算,现在还有很大的不确定性,需要继续加以研究和积累。
人与机器,混合智能具备独特优势。

在智能形态方面,人和计算机混合模式越来越多,这个叫人机混合智能。机器擅长做的事交给机器,机器做不好的事,人可以介入一下。这样人机混合的智能,是现阶段发展人工智能一个比较重要的技术途径。
应用先行,有助于技术发展。

在应用驱动方面,以前是先把技术做好,然后转化技术去做应用。现在靠应用去拉动技术发展,这条路是人工智能一个非常重要的发展形态。深度神经网络出现时,在哪儿好用,不知道,需要找一个很好的应用场景把它用起来。如果不是辛顿的学生把它拿去参加图像网络比赛,可能神经网络的热潮还会拖许久才会到来。
未雨绸缪,防止技术失控。

人工智能具有社会属性。人类会不会被人工智能奴役、摆布?这个社会属性,恰恰是我们在做人工智能时要认真对待的一个问题,要摆正人和智能系统之间的关系,对人工智能能干什么、不能干什么进行研究和立法,从法律和道德层面去约束和规范它。否则,将来可能会很被动。

三、中国人工智能发展的优势与差距
从2013年起,世界许多国家政府,尤其是发达国家纷纷调研人工智能对社会、经济可能带来的颠覆性影响,相继发布符合自身国情的人工智能战略。在这场事关未来的技术革命中,我们的机会在哪里?优势和短板分别是什么?

我国已经成为人工智能领域的超级大国之一。

改革开放以来,我们国家在基础研究方面的投入巨大,人工智能的发展有了非常好的沉淀。一些关键核心技术,中国已经走在了世界前列,比如说人脸和语音识别技术。中国人工智能的发展与各行各业的结合和渗透是非常高的,其应用和推广比其他国家做得更好。我国人工智能发展的创新生态环境已经初步形成。百度的无人驾驶、阿里的城市大脑、腾讯的智能医疗、科大讯飞的语音识别、商汤的图像与视频处理等开放平台以及华为、寒武纪、海康威视等实体经济领域平台已经创建。全球AI指数排名,中国属于第一梯队,紧随美国,在人才、教育、专利产出等方面均有所进步。中美两国引领、呈梯次分布的全球人工智能发展总格局保持不变。


四大优势护航中国人工智能发展。

第一个是政策优势,人工智能已被列为国家优先发展事项。第二个是海量数据资源优势,中国人口是美国的四倍多,手机群体和手机消费、支付量也是最大的,拥有庞大的消费、出行、医疗、旅游、物流等数据资源。第三个是应用场景优势,我国是发展中国家,很多基础设施还不够完善,这恰恰给人工智能的应用提供了一些深度场景。比如城乡的基础设施、医疗、教育、民生服务等领域的问题,人工智能系统的介入,问题可以快速得到解决。第四个是青年人才优势,我国高等教育毛入学率已达59.6%,而且学理工科的学生比例很高,这是一个非常大的人才储备库。国家自然科学基金委员会专门设立人工智能一级学科代码,资助相关基础研究、前瞻性探索和应用研究。
当然,我们也存在一些短板,特别是在四个薄弱环节急需加强。

第一,基础理论和原创算法研究比较薄弱。第二,高端器件研发能力弱,比如做深度神经网络训练的GPU(图形处理器),中国在这方面差距比较明显。第三,缺乏有影响的人工智能开源开放平台。第四,缺乏相应的高端人才。据统计,中国最顶级的人工智能高端人才数只有美国的20%,已成为国家关键领域急需的高层次人才。

四、我们该如何布局未来
未来已来,到底是哪一个未来来了?过去三十年是变化非常大、非常快的三十年。第一个是计算机的算力增强了约一百万倍,第二个是存储容量增加了约一百万倍,第三个是通信速度增加了约一百万倍。这三个一百万倍,让我们的社会、工作、生活、学习都发生了天翻地覆的变化。而下一次影响人类社会的工业革命时间可能会发生在2030年到2040年之间,其主题将会是人工智能,人工智能将是未来一个世纪的核心技术。

国家战略、人才高地、基础建设、立法保障,一个都不能少。

要想把人工智能发展好,就需要我们在很多事上起好步、布好局。一是将发展人工智能提升至国家发展战略,国家、地方和企业,要把其作为战略性新兴产业,给予大力支持。二是健全人工智能的国家研发体系。三是加快人才培养,形成一批人工智能的国家人才高地,进而带动整个人工智能理论和算法的发展。四是加强智能化基础设施建设,推动公开数据的开放、共享,同时完善相关法律法规保护数据的安全性。五是加快人工智能法律、伦理问题的研究,引导人工智能安全可控发展。六是深化国际开放合作,主动参与全球人工智能的治理和标准制定。


数据处理、开源平台、应用场景,三个抓手要记牢。

利用人工智能为各行各业赋能,抓手是什么?排在第一位的是数据,没有数据,即便是弱人工智能也没法做,所以要把数据组织起来、清洗出来、利用起来并加以安全防护。第二位是创建好自己的开源平台,与我们作为人工智能大国的地位相匹配。第三位是应用场景的培育和赋能,现在很多场景还只是投资驱动的,政府要清楚哪些是优先发展的领域,市场能做能决定的事,就交给市场去做去决定,需要政府介入、调控才能做好的事,政府就要果断去干预、去培育,扶上马,送一程。这是非常关键的一个步骤。在做大做强自己,补齐自身短板弱项后,我们要和全世界人工智能同步推进,去迎接人工智能第四次工业革命的到来。

2027年人工智能市场规模将达2250亿美元,人工智能四大趋势

1月4日,瑞银集团在一份报告中表示,到2027年,人工智能在各经济体的广泛应用将使其成为一个规模达2250亿美元的市场。与2022年的22亿美元相比,这是一个巨大的飞跃,标志着约152%的复合年增长率。人工智能行业的收入将随之增长15倍,从2022年的180亿美元增至2027年的4200亿美元,较瑞银此前预期的上调了40%。

据消息人士称,OpenAI正在训练下一代的人工智能,暂名“Q*”(读作Q-star)。新的一年,OpenAI下一代产品可能发布;

数据瓶颈指的是可用于训练AI的高质量数据的有限性,合成数据有望打破这一瓶颈。除了对大量高质量数据的需求导致合成数据受到追捧以外,对数据安全的考量也是重要原因;

作为全球性能最强的AI,ChatGPT已遇到算力等方面的瓶颈。在此背景下,讨论量子计算机在人工智能领域的应用就成为一种颇具潜力的未来解决方案。

文 | 谭笑间

2023年,世人见证了ChatGPT在全球范围的大火。以生成式人工智能为代表的新一代人工智能问世,改变了人工智能(AI)技术与应用的发展轨迹,加速了人与AI的互动进程,是人工智能发展史上的新里程碑。2024年,人工智能技术与应用的发展又会呈现出哪些趋势?让我们一同展望这些值得关注的重大趋势。

全模拟光电智能计算芯片效果图。经长期联合攻关,清华大学研究团队突破传统芯片的物理瓶颈,创造性提出光电融合的全新计算框架,并研制出国际首个全模拟光电智能计算芯片(简称ACCEL) 新华社图

趋势一:从AI大模型迈向通用人工智能

2023年,ChatGPT开发者OpenAI被置于前所未有的聚光灯下,也使GPT-4后续版本的开发被推向了风口浪尖。据消息人士称,OpenAI正在训练下一代的人工智能,暂名“Q*”(读作Q-star)。新的一年,OpenAI下一代产品可能发布。

据媒体爆料,“Q*”可能是第一次采用“从零开始”的方式训练的人工智能。其特点是,智能不来自人类活动的数据,且其有能力修改自身代码以适应更复杂的学习任务。前者使得人工智能能力的发展变得愈发不透明,而后者向来被看作是诞生人工智能“奇点”的必要条件。在人工智能发展领域,“奇点”特指机器拥有了自我迭代的能力,进而在短时间内迅猛发展,导致超出人类控制。

虽然一些报道称,“Q*”目前还只能解决小学难度的数学问题,距离“奇点”还远。但鉴于虚拟环境中人工智能迭代速度可能远超想象,其仍然可能在不远的将来自主发展出在各个领域均可超过人类水平的AI。2023年,OpenAI预言,各方面超越人类水平的人工智能在十年内就会出现;英伟达创始人黄仁勋表示,通用人工智能可能在五年内超越人类。

一旦通用人工智能得以实现,就可被用于解决各种复杂的科学难题,譬如寻找外星人与地外宜居星系、人工核聚变控制、纳米或超导材料筛选、抗癌药研发等。这些问题通常需要花费人类研究员数十年的时间来寻找新的解决方案,部分前沿领域的研究量已超出人力极限。而通用人工智能在自己的虚拟世界中拥有几乎无限的时间和精力,这使得其在部分容易虚拟化的任务中,有可能成为人类研究员的替代。但届时,人类如何监督这些从智能水平上超过人类的人工智能,确保其不会危害人类,又是一个值得思考的问题。

当然,我们也不应过分高估硅谷巨头们的部分言论,因为在人工智能发展史上,已经历三次“AI寒冬”,其中不乏宏大的技术愿景因各方面限制化为泡影的例子。但目前可以肯定的是,大模型技术仍然有着不小的上升空间。除GPT-4外,谷歌的“双子座”(Gemini),Anthropic的Claude2,目前都是仅次于GPT-4的大模型,国内的百度“文心一言”与阿里“通义千问”,也是国产大模型中的佼佼者。它们在新的一年中是否会发布更具革命性的产品,同样值得期待。

趋势二:合成数据打破人工智能训练数据瓶颈

数据瓶颈指的是可用于训练AI的高质量数据的有限性,合成数据有望打破这一瓶颈。

合成数据是在模仿真实数据的基础上,由机器学习模型利用数学和统计科学原理合成的数据。关于什么是合成数据,有一个较为浅显易懂的比喻:这就像是在给AI编写专门的教材。例如,尽管英文课本的对话中出现的可能是“小明”“小红”这样的虚构人名,但并不影响学生们由此掌握英语,因此从某种意义上,对于学生而言,教材就可以看作一种经过编纂、筛选和处理的“合成数据”。

有论文表明,模型的规模至少要达到620亿参数量后,才可能训练出“思维链”能力,即进行分步骤的逻辑推理。但现实的尴尬在于,迄今为止人类产生的不重复的、可供训练的优质数据并没有这么多。使用ChatGPT等生成式人工智能以前所未有的数量产生高质量合成数据,未来的AI将由此获得更高的性能。

除了对大量高质量数据的需求导致合成数据受到追捧以外,对数据安全的考量也是重要原因。近年来,各国纷纷出台更严格的数据安全保护法律,使得客观上利用人类产生的数据训练人工智能变得更为繁琐。这些数据中不仅可能隐含个人信息,其中的许多数据还受版权保护。在互联网隐私与版权保护尚未形成统一标准与完善架构的当下,使用互联网数据进行训练,极易导致大量法律纠纷。而若考虑对这些数据进行脱敏,又面临筛查识别准确率方面的挑战。两难之下,合成数据就成为最惠而不费的一种选择。

此外,使用人类数据进行训练,还可能导致人工智能学到有害内容。一些诸如使用日用品制造炸弹、管制化学品的方法,另一些则包括许多人工智能本不应当出现的坏习惯,譬如像人一样在任务执行过程中偷懒、为了取悦用户而说谎、产生偏见和歧视。若改用合成数据,使人工智能在训练中尽可能减少接触有害内容,则有望克服以上使用人类数据训练时附带的缺点。

从以上分析中可以看出,合成数据可以说是颇具开创性的,有望解决此前发展人工智能与数据隐私保护不可得兼的问题。但与此同时,如何确保相关的公司和机构负责任地制作合成数据,如何制作出既符合本国文化与价值观,又在规模和技术水平上足以媲美西方以英文网络资料为中心的合成数据训练集,也将成为中国面临的一个颇具挑战性的课题。

除此之外,合成数据带来的一个重大变化是,来自人类社会的大数据或将不再是AI训练所必需。在今后的数字世界中,人类数据的产生、存储和使用仍将遵循人类社会的法则和秩序,包括维护国家数据安全、保守商业数据秘密和尊重个人数据隐私,而AI训练所需的合成数据则采用另一套标准进行管理。

趋势三:量子计算机可能率先应用于人工智能

作为电子计算机发展到今天的最前沿应用,人工智能始终存在算力不足的隐忧。ChatGPT问世数月后,OpenAI总裁奥尔特曼曾公开表示,其并未鼓励更多用户注册OpenAI。2023年11月,OpenAI甚至宣布暂停ChatGPT Plus付费订阅新用户的注册,以确保现有用户拥有高质量体验。显然,作为全球性能最强的AI,ChatGPT已遇到算力等方面的瓶颈。在此背景下,讨论量子计算机在人工智能领域的应用就成为一种颇具潜力的未来解决方案。

首先,人工智能领域的算法,大部分属于并行计算的范畴。举例而言,AlphaGo在下围棋的过程中,其需要同时考虑对手在不同位置落子后的应对招数,从中找到最有可能赢得棋局的下法。这就需要计算机优化并行计算的效率来实现。而量子计算机擅长进行并行计算,因为它可以同时计算和存储“0”和“1”两种状态,无需像电子计算机那样消耗额外的计算资源,譬如串联多个计算单元,或将计算任务在时间上并列。计算任务越复杂,量子计算就越具备优势。

其次,运行ChatGPT所需的硬件条件,同样也十分适合导入当前体积庞大的量子计算机,二者都需要安装在高度集成的计算中心里,由一支专业化技术团队进行管理支撑。

什么是量子计算机?量子计算机是一类遵循量子力学规律进行高速数学和逻辑运算、存储及处理量子信息的物理装置。其不仅体积庞大,而且作为核心零部件的“量子芯片”,通常需要被置于接近绝对零度(零下273.15摄氏度)的极低温中,利用在这种极低温下部分微观粒子表现出的量子特性进行信息运算和处理,且运行结果只能存在几毫秒的时间。

既然量子计算机“又大又难维护”,为什么还要发展?原因在于,量子计算机蕴含巨大的算力潜能,以至于在一些算法上已经体现出相对于电子计算机在速度上的“绝对碾压”,即“量子优越性”。但实现“量子优越性”只是一个起点。目前的量子计算机只能完成一些专属于量子领域的计算任务,想要真正用好这种“量子优越性”,先要使其量子位足够多,以实现通用计算和可编程。而且,在实现通用计算后,量子计算机依然需要保持相对于电子计算机的优势,这被称作“量子优势”。

2022年,来自谷歌、微软、加州理工学院等机构的研究者从原理上证明了“量子优势”在预测可观测变量、量子主成分分析以及量子机器学习中确实存在。量子机器学习,实际上就是量子计算在人工智能领域的应用,也体现出未来量子计算与人工智能两大前沿技术合流的趋势。

理论上证明了,实践上就需要进一步拓展量子计算的应用前景。在2019年推出商用量子计算机“量子系统一号”后,美量子计算巨头IBM又于2023年12月推出了“量子系统二号”。新系统的最大突破在于可以模块化扩展,是该公司的首台模块化量子计算机。“量子系统二号”拥有超过1000量子位。IBM还宣布计划10年内建成10万量子位的量子计算机。这些不断增加的量子位并非只是为了竞赛,其对于实现通用计算和可编程有着不可或缺的作用。也正因如此,量子计算机的模块化,标志着其更加具备实用性。

有关量子机器学习算法的研究,已成为新的研究热点。不过,未来量子计算机不会完全取代电子计算机,更有可能出现的是量子计算机和电子计算机在不同的应用场景下发挥各自所长,实现协同发展,既极大提升算力,也兼顾成本和可行性。

在上海举行的2023世界人工智能大会上,人形机器人表演“千手观音” 辛梦晨摄/《瞭望》周刊

趋势四:AI代理和无代码软件开发带来“冲击波”

在AI应用方面,2024年值得关注的是AI代理和无代码软件开发带来的“冲击波”。

一是AI代理对劳动力结构的冲击。

截至目前,全球至少已有近两亿人使用人工智能大模型。但人们已不再满足于坐在电脑前跟AI“聊天”,而是开始开发能够自动根据任务需要向人工智能发出提示的工具。当自动提示工具与大模型两相结合,AI代理便由此诞生。

2023年4月,OpenAI联合创始人布罗克曼现场演示了GPT的“自动模式”。在该演示中,AI代理几乎“包办”了一场晚宴:不仅根据要求生成了一份晚宴的推荐菜单、一份图文并茂的邀请函,还自动将该菜单需要购买的食材加入生鲜电商APP的购物车,并自动发布了一条有关该晚宴的社交网站帖子。

AI代理还能根据比较模糊的需求提示自动制作网站,自动完成各种需要使用Office软件完成的文字和表格处理工作,甚至自动根据已有论文数据进行归纳总结生成分析论文等。

比尔·盖茨近日发长文解读AI代理未来,表示AI代理将彻底改变人们使用计算机的方式,带来自键盘、屏幕和鼠标发明以来人类与计算机互动方式上最重大的革新。

AI被看作对人类的信息收集、分析和处理进行增强的扩展性工具,使得人的工作水平更上新台阶。但与此同时,AI代理也给许多现有的工作岗位带来冲击,因为企业可能尝试雇用更少的人来完成相同的任务。这种由创新带来的对现有经济结构的破坏,被美国经济学家熊彼特称为“创造性毁灭”。随着AI代理代替大量只需要较少的计算机技能就可完成的任务,这些被迫再就业的劳动力将不得不适应新的劳动力市场需求,这注定将是一个较长时期的、伴随阵痛的过程。

二是无代码软件开发给数字经济创新带来的影响。

尽管生成式人工智能可能淘汰掉一批传统数字岗位,但在关上一扇门的同时也打开了一扇窗,这就是“无代码软件开发”。目前,以AI大模型为基础的编程辅助工具已经发展到一个新的阶段,能够根据用户十分模糊的指令来生成软件或网页代码。例如,2023年的GPT-4演示中,演示人员仅仅是在A4纸上手写了一个十分潦草的结构示意图,GPT-4就根据其自动生成了能够实际访问的网页。这无疑大大降低了开发IT服务的门槛。只要一个人有足够有创意的、能够满足许多人需求的数字服务“点子”,就可以成为互联网创新的风口,“人人皆可创新”的时代已然到来。

对此,政府需转变观念,兼顾市场监管与促进创新,一方面降低数字创新过程中的注册与融资门槛,打通中小企业发展壮大过程中的痛点,让就业与创新政策适应“人人皆可创新”的新需求;另一方面需要探索更有利于保护创新“点子”的版权与专利保护新政策,从而激励那些能够不断提出创新“点子”的人才。

综上所述,展望2024年,无论是人工智能技术自身的迭代发展,还是其对数据价值的重塑,抑或是向各行业、各领域的应用渗透,人工智能的影响可谓无处不在,既为科研、创新和经济赋能,又带来新的挑战与风险。我们应以开放的心态看待人工智能带来的诸多改变,审慎研究和应对其可能带来的新课题与新风险。

世界最强AI公司,迈出毁灭人类的“一小步”?

据美国调查新闻网站“拦截者”报道,开发了被全世界广泛使用的人工智能产品ChatGPT的美国知名AI公司OpenAI,于近日悄悄干了一件引人关注的事情:他们删除了一项涉及他们AI模型的使用禁令。

“拦截者”网站称,在今年1月10日之前,OpenAI公司在其AI模型的使用条款中曾明确表示,禁止将其模型用于很可能会造成人员伤亡的用途上,比如“研发武器”和“军事与战争”。

然而,在1月10日对其使用条款进行一番大更新后,OpenAI公司虽然在禁止项中仍然提到禁止将其产品、模型和服务用于会导致人员伤亡的用途上,并提到了“武器开发和使用”,但先前同样被禁止的军事用途,如今却在文本中消失了。

对此,OpenAI公司的发言人在一封回复给“拦截者”网站的邮件中表示,1月10日这次对使用条款的大调整,是因为公司的产品和服务已经被全世界广泛使用,所以需要设立一套更加简洁和普适的规则,包括让规则中的文本变得更加清晰,更好被理解、记忆以及应用。

该发言人还强调,新的使用条款中提到的“不要去伤害他人”本身就是一个很宽泛同时也很好理解的概念,可以适用于很多语境之下,而且条款中还列举了武器作为一个明显的例子。

但该发言人并没有正面回应“禁止伤害”这个宽泛的表述,是否包括一切军事用途,仅称条款禁止其技术被包括军方的人用于研发和使用武器,伤害他人或摧毁他人财物,或是在未授权的情况下用于破坏任何服务或系统的安全。

有网络安全专家对“拦截者”网站表示,OpenAI删掉使用条款中禁止军事和战争用途的内容,是一个很大的变化,说明该公司新版使用条款关注的重点,是在确保法律合规之上提供更多的灵活性,但在很多国家,军事和战争都会被披上合法的外衣,所以OpenAI公司的这次调整潜在的影响将是巨大的。

其他专家亦对“拦截者”网站也表示,OpenAI的新使用条款反映出公司正在悄悄弱化其先前反对军事应用的立场。有专家还指出,OpenAI的重要合作伙伴微软公司就是美国军方主要的供应商之一。而且美军对于AI技术的需求也越来越强烈。

“拦截者”网站还特别提到,虽然OpenAI公司的产品、模型和服务如今还没有被用于操控武器去杀人,但实际上其技术已经开始被军方用于编写代码、处理武器采购以及情报分析等方面。换言之,尽管没有被直接用于杀人,该公司的技术都已经在被用于协助这样的工作了。

“在人工智能系统正被用于针对加沙地区的平民时,OpenAI决定将禁止军事和战争用途文字从其使用条款中移除,是值得关注的”,一位专家对“拦截者”网站这样说道。

人工智能对网络安全有哪些影响?

微信公众号:计算机与网络安全一年多以来,人工智能(AI)主导了公共话语,从非正式对话到认真考虑其造福或破坏社会的潜力。在评估如何安全地使用人工智能时,重要的是检查机会和危险,因为它们现在存在或可能在短期内发展。人工智能创建内容和自动化操作的能力代表了人工智能在许多领域(包括网络安全)中使用的新前沿。

软件和数据的技术进步将对数字安全产生巨大影响。基于人工智能的工具,无论是用于自动化、认知还是生成,都可以用于好的方面,也可以用于坏的方面。例如,分析潜在入侵的网络流量的工具也可以用于使入侵更难检测。用于生成类似人类内容的工具可以很容易地用于合法和非法目的。ChatGPT的公开发布是一个罕见的时刻,一项新技术立即主导了公众的心理。在此后的一年里,这种对话并没有消退;事实上,人工智能工具(生成性或其他)的影响,以及它们如何改变社会的好坏,已经成为广泛政策辩论的一部分,从对劳动力的影响到教育,再到国家安全。这包括对网络安全的影响,生成性人工智能是否会加剧新的攻击?防御者是否会使用它来更快地检测恶意活动?人工智能对网络安全并不陌生。防御者和攻击者多年来都在使用机器学习和人工智能工具,但专家一致认为,生成性人工智能的公共可用性将重塑网络安全格局。然而,对于这将如何发生,还没有达成共识。对于这些人工智能工具的最终用户(无论是公司、政府、个人还是其他组织)现在可以做什么,以最大限度地提高人工智能对攻击者的效用,并最大限度地减少对攻击者的好处。场景

好的方面

如果防御者能够提高安全响应时间、增强人类专业知识并提高软件和设备安全性,那么人工智能工具将为他们提供优势。人工智能工具为各种目的对大量数据进行排序:为修复漏洞排定优先级,检测数据渗出,识别异常的用户行为等。有了这些新见解,这些工具被调整为减轻已确认的威胁(例如,通过隔离端点、阻止恶意URL或沙箱恶意操作),并升级需要更多分析的威胁。人工智能还增强了最终用户体验,在用户报告异常或主动提醒他们时准确有效地帮助他们,并帮助解决工具本身识别的问题。这种早期和准确的检测减少了响应时间,最大限度地减少了对误报的浪费,并有助于标记,否则可能无法检测到的真正威胁。因此,防御者能够将其有限的资源集中用于可能需要人类理解的调查。
人工智能也是通过设计原则实现安全的关键。人工智能工具将编写新的安全代码,并通过发现和修复漏洞来帮助更新现有代码。它甚至可以用更安全的语言重写现有的应用程序。随着攻击的发展或研究人员发现新的漏洞,这些工具将不断更新和改进代码。
工智能工具本身将是安全和负责的。它们产生高质量、准确的结果,并在未能做到这一点时负责。这包括区分恶意篡改和工具中所谓的“幻觉”的能力。人类处于中心位置,知道何时与人工智能系统交互,知道输出中的任何潜在限制和风险,并可以在更高风险的场景中干预或覆盖人工智能系统。人工智能驱动的网络安全工具保持了攻击者的优势,因为他们可以访问多个高质量的数据源,而攻击者必须更多地依赖“黑市”数据。

坏的方面如果攻击者能够提高攻击效率,实现犯罪协作,并比防御者适应和响应更快地学习,那么人工智能工具将为攻击者提供优势。人工智能工具减少了参与犯罪的进入障碍,并使开发复杂的社会工程技术、逃避检测、设计定制恶意软件等变得更加容易。有了这些新的效率提升,人工智能使网络攻击变得更便宜、更有效,提高了犯罪的预期回报。使用人工智能工具,犯罪分子可以更快地找到现有系统中要利用的漏洞。此外,他们可以创建个性化的鱼叉钓鱼活动,以增加成功的可能性。一旦罪犯进入系统,他们就可以使用定制的恶意软件,这些恶意软件可以针对特定的目标进行定制。在发起了许多这样的活动后,他们可以使用机器学习来查看什么是有效的,并在未来的活动中修改他们的策略和恶意软件。人工智能还改变了犯罪的市场结构,改善了攻击者的分工,使他们能够更有效地使用资源。全球网络防御的不平等分布导致攻击者在资源较少的国家部署基于人工智能的网络攻击。勒索软件变得更加有利可图,因为犯罪组织现在可以更容易地与流氓国家合作,扰乱目标国家的经济。工智能行业缺乏问责制和质量控制,使得更难追究国家或公司对不当使用复杂工具的责任。恶意人工智能平台在法律限制较少的司法管辖区开发,然后部署在世界各地。因为罪犯可以更自由地创新,他们能够设计攻击,即使是支持人工智能的防御也会因为它们的新颖性而与之抗争。这种社会环境变成了一个恶性循环,进一步侵蚀了对数字经济、社会制度和客观真理的信任。建议一般建议1、避免炒作。抵制AI浪潮的诱惑;在具有操作性或其他意义的方面使用人工智能工具。2、主动管理人工智能将做出的决策。人工智能工具将做出组织无法单独审查的决策,因此部署它们时要预先考虑和仔细规划。对于人工智能工具将做出哪些决策以及在什么级别做出肯定的选择是很重要的。以下因素有助于:1)评估使用考虑中的人工智能工具的潜在好处和危害,2)确定决策循环中必须保留的行动或过程:

  • 需要多少人类认知?这是一个重复的战术讨程,还是一个创造性的战略决策?后者更可能需要人类的持续参与。
  • 行动、过程或最终结果需要多少质量控制或审查?随着质量变得至关重要,倾向于深思熟虑的人类审查。
  • 错误决策的影响或风险是什么?越严重,人类应该控制得越多。
  • 决策的频率如何,快速做出决策的重要性如何?人工智能擅长做出重复的决策,并以人类永远无法实现的速度前进。
  • 人工智能工具是补充人类决策还是取而代之?如果是后者,则权衡人工智能错误与人为错误的成本和收益,并为关键任务选择开发故障保护和审查机制。
  • 决定是否不可逆转?如果是这样,请谨慎行事,并确保组织能够在不可逆转的错误决策中生存下来。

3、了解人工智能正在使用的数据类型。人类永远不可能知道人工智能使用的所有数据,但在可能的范围内,组织应该了解所使用的数据源。优先考虑对内部或专有的 王冠宝石”数据进行更强大的安全控制。

4、说“不”是可以的。在部署、构建或完成人工智能工具之前,评估它的表面好处是否会大大超过潜在危害。如果一个工具的可预见危害明显大于好处,请不要使用或构建它,或者至少确保您的组织可以有效地控制它。

5、认识到旧规则仍然适用。人工智能工具可能看起来是新的、闪亮的和强大的,但不要忽视信息技术安全、网络安全和数据安全的既定基础。几乎所有长期使用的工具和最佳实践都适用于大多数人工智能开发和用例。

6、智能透明。透明度是一件好事,但组织应避免将重要通知变成无意义的点击,通常称为同意疲劳”。通知应披露与用户和工具效用相关的信息,包括隐私问题或人类监督的程度。组织应该避免让消费者过度饱和,以至于他们的信息披露毫无意义或被忽视。

7、想想社交媒体(因为人工智能正在阅读它)。组织应更新社交媒体和通信政策,以认识到大型语言模型(LLM)正在使用帖子和其他通信作为训练数据,并说明对手可能利用的信息。

8、日志、日志和更多日志。良好的日志对网络安全至关重要,人工智能驱动的漏洞利用和攻击的潜力只会加剧这一点。组织应改进日志记录、日志审查和日志维护,以最大限度地提高检测新的、人工智能生成的攻击的能力,并遵守必要时进行合法授权的审查(包括通过使用人工智能工具)。

9、让人类处于代码循环中。人工智能编写的代码应该比人工编写的代码更安全,但维护漏洞管理最佳实践的人工和技术审查仍然很重要。

10、不要将人工智能从其他IT、网络和其他学科中孤立出来。定期召集所有相关团队,如网络安全、法律、数据科学、计划/产品团队和行政领导层,就人工智能网络安全风险进行合作。当人工智能工具对组织的目标或运营产生重大影响时,组织应考虑为首席人工智能官开发新的角色。

11、要有弹性。在人工智能工具中断的情况下,组织将需要一个弹性计划,包括培训其员工执行人工智能自动化任务,以便他们能够维护关键任务操作。

12、在合同需求和义务中反映人工智能。与供应商、合作伙伴和其他人的合同可能需要包括对专有数据的限制,包括:

  • 将提供哪些数据,特别是涉及人工智能供应商的数据。
  • 如何使用数据。
  • 如何保护数据。
  • 数据是否将用于训练其他模型。
  • 如果业务关系结束,该数据将发生什么情况。

13、创造开放的文化。人工智能已经在为钓鱼电子邮件和其他欺诈提供支持,这些欺诈通常以初级员工为目标。如果员工不敢接触高层领导,他们更有可能无法报告风险,或落入冒充高管的骗局。授权员工与高级领导层接触,确保沟通(特别是采取行动或分配资金的指示)合法。

政府特定建议1、识别高风险人工智能工具。政府应确定可能造成极端伤害并监控其使用的人工智能工具。在人工智能工具具有对社会具有高风险的用例的情况下,政府应考虑获取该工具的知识产权,并为低风险用例颁发许可证。

2、促进获得开源网络安全工具。帮助网络贫困线以下的组织访问开源网络安全工具,帮助防止基于人工智能的攻击,审查代码,并提供培训数据。

3、提供教育机会。支持整合人工智能、数据科学和网络安全技能的大学课程和认证。

行业特定建议

1、坚持基本原则。人工智能工具和模型从根本上说是软件,开发人员和部署人员应该利用现有的网络安全性、弹性和设计原则的安全性。这包括:

  • 信任和授权
  • 身份和访问管理
  • 资产管理
  • 网络访问控制/隔离策略
  • 漏洞管理
  • 持续监测

2、使信息共享变得简单而平常。公司应使用现有的标准化安全信息共享结构,如结构化威胁信息表达(STIX);可信的智能信息自动交换(TAXII),以及用于人工智能网络安全目的的国家漏洞数据库。在这些不太适合的方面,公司应该共同努力,并与政府一起开发促进快速轻松共享的协议。

3、默认情况下记录。人工智能模型或工具的开发人员应将登录构建到人工智能工具中,用于网络安全、审计和其他合法授权的目的。

展望

好的方面:AI极大地提高了网络安全性

现代人工智能工具可以帮助组织快速识别和应对威胁,并提高其网络安全工作人员的效率和效力,从而使世界更安全地免受网络安全威胁。公司高管和IT安全领导者可以使用人工智能来优化决策、评估风险,并做出财务上合理的运营决策。安全团队可以使用人工智能工具来分析大量数据,并检测异常活动或恶意用户。这将使防御者能够更多地关注需要人类理解的调查。

如果防御者利用人工智能相对于攻击者的优势,这一未来将是可能的。下面是人工智能工具如何提供这些独特优势的具体描述。

1、提高防守队员的效率

人工智能增强了组织以更高的速度和更少的资源更有效地运行现有网络安全流程的能力。人工智能工具通过处理大量数据和识别异常行为来实现这一点。这些人工智能工具可以更早、更准确地检测威胁,使分析师能够更快地采取行动。虽然攻击者传统上受益由于攻击执行的不对称优势,防御者依赖于不确定的检测信号。人工智能工具改变了这种平衡。具体功能包括:

  • 漏洞优先化-防御者从风险和缓解成本的角度分析漏洞,以优化网络安全支出的投资回报。
  • 网络流数据-Defender分析网络流数据,通过识别与正常网络行为的偏差来发现异常的数据传输和未经授权的远程访问,从而实现对恶意活动的早期检测和响应。
  • 用户行为-Defender分析用户行为,如登录时间、位置和活动,以检测与典型行为的偏差,以检测内部威胁。
  • 潜在恶意软件-Defender分析文件和系统进程,以发现使用传统的基于签名的工具无法检测到的潜在恶意软件。
  • 端点数据-安全团队分析端点数据,以发现未经授权的设备访问和处理或滥用合法工具的迹象(即,生活在陆地上”攻击)。
  • 隔离受感染的端点或流程-安全团队采取主动步骤来隔离端点,并在可疑入侵导致系统之间的重大危害或横向移动之前减轻它们。
  • 网络钓鱼企图-组织分析电子邮件或其他通信中的语言,以检测和阻止网络钓鱼企图。

早期和准确的检测减少了对假阳性的浪费,并有助于标记真阳性,否则可能无法检测到以进行进一步调查。评估团队使用人工智能工具,通过更好的度量、可视化和决策树来进行更有效的决策。一些示例包括:

  • 指标-组织通过自动分析缓解措施、事件和响应来了解其网络安全有效性。
  • 可视化-防御者通过动态可视化相关数据(如网络流量、访问模式和用户行为)来确定网络安全工作的优先级,以实时查看。
  • 决策树-安全领导使用定制的上下文决策树,该决策树基于对特定事件的影响和置信水平的人工智能分析。

如果怀疑有恶意活动,人工智能工具会部署自动安全措施,以缩短检测和缓解之间的时间:

  • 响应时间-人工智能工具对模式中的偏差做出响应,并在最少的人工干预下部署自动响应,从而最大限度地减少不良事件的持续时间和影响。
  • 迭代响应时间-人工智能工具通过事件后报告进行训练,以完善其检测、评估和响应各种场景的标准。每一次入侵都是一次学习机会,并提高了安全工具在未来的响应能力。
  • 检测质量-人工智能工具不断根据事件数据进行训练,以不断完善其决策和检测能力。

这些能力对网络安全工作人员有几个影响:

  • 提高生产力——人工智能工具提高了效率,减少了网络安全任务所需的人数,从而减少了总体网络劳动力缺口。
  • 提高员工满意度-人工智能工具执行平凡、乏味或例行的任务,释放网络安全人员来处理更具挑战性的问题,从而提高工作满意度并减少倦怠。
  • 加速入职——人工智能工具使新员工能够更快地融入网络安全工作队伍。

最后,人工智能可以提高现有和新代码的安全性和质量:

  • 代码评估-人工智能工具可以扫描现有和新代码,以查找传统静态分析可能会遗漏的易受攻击代码模式的变体。
  • 代码建议-人工智能工具用于分析安全编码实践,并建议改进遗留代码,从而减少手动代码分析和重写所花费的时间。
  • 代码监控-AI工具在开发代码时实时检查代码,并主动识别漏洞或与安全编码实践的偏差。
  • 代码预测-人工智能工具用于分析现有代码以及未来可能的修改如何导致漏洞。
  • 重写代码-AI工具可以使用更安全的现代模式、语言和库重写遗留代码。
  • 代码自动化-人工智能工具可以自动生成代码补丁,以减轻其已识别的威胁风险。

2、防御者供应链中的更好关系

人工智能工具也在提高服务质量,以及在网络安全过程中如何对待用户。组织正在使用人工智能工具开发更有效的客户服务聊天机器人,以适应用户的知识和能力。人工智能工具实现这一点的一些方法包括:

  • 改进的响应时间-人工智能工具生成为用户的角色、环境和他们所遇到的问题定制的自动响应。这些响应使用日志和事件数据为问题建议或自动应用最适当的解决方案,从而实现更早和更全面的解决。
  • 高质量的用户参与-人工智能工具分析哪些解决方案和参与模型导致高用户满意度,以告知关于用户参与的最佳实践。
  • 适应用户需求-人工智能服务工具评估用户的知识和技能水平,并提供适合个人需求的指导,包括在最终用户无法补救情况时提升人工干预。
  • 节省劳动力-人工智能工具通过解决不需要人工分析的事项,更好地利用网络安全专家,并为网络安全专家提供定制的背景信息和需要人工分析事项的可能干预。

3、AI责任和质量的改进

人工智能工具正在生成高质量、准确的结果,并在它们未能做到这一点时负责。组织可以区分恶意篡改和大型语言模型(LLM)中所谓的“幻觉”,LLM提供自由文本输出。人类始终处于中心位置,知道何时与人工智能系统交互,输出中的任何潜在限制和风险,以及在更高风险的场景中,可以干预或覆盖人工智能系统。组织理解人工智能输出,并可以区分恶意篡改的实例,可能会将这些实例移交给政府。这通过以下方式实现:

  • 人工智能社会契约——捍卫者与政府合作,制定了一个普遍接受和易于理解的社会契约,列出了围绕网络安全中人工智能模型的创建、使用和治理的关键道德责任。
  • Defender引领创新-Defender围绕人工智能模型采用创新文化,并开发流程以从经验中学习,并鼓励在如何创建和部署模型方面进行受控实验。
  • 更好的控制-Defender可以访问模型、数据和以前的输出,包括发现实际上不正确的输出。这使得他们能够更快地识别输出是篡改与分析错误的结果。攻击者无法访问如此广泛的数据,也无法访问分析他们所拥有的数据所需的工具和基础架构。
  • 模型监控-Defender实时监控系统,并使用其他AI工具检测与其模型的异常接触。这允许及早检测对输入的篡改和检测操纵的输出,这可以被阻止以防止负面结果。
  • 模型透明度-Defender了解模型的功能和限制及其对其场景的影响;他们使用风险框架、系统度量和评估工具来确保其人工智能系统的安全性、安全性和可靠性。
  • 迭代改进-即使发生篡改,Defender也会修复模型,使这种篡改尝试变得毫无用处。这种能力迫使攻击者不断创新他们在未来篡改的方式,增加了攻击者的成本。
  • 生成式人工智能对策-防御者使用内容来源和人工智能内容检测来防止深度伪造的内容污染其平台。

与大多数攻击者相比,防御者在更有效地使用人工智能的能力上具有优势,因为最佳模型需要大量高质量数据,这些数据仅可用于最大的组织或最复杂的民族国家。因此,政府和公司比犯罪企业更有效地使用人工智能工具。防御者在这方面也受益于:

  • 数据宽度-防御者有多个随时可用的高质量数据源用于训练其模型,而攻击者必须更多地依赖黑市”数据。黑市产品一般质量较差,因为它们的规模有限,收购成本高,缺乏质量监控。
  • 数据深度-由于更大的容量、劳动力专业化和购买力,防御组织可以更容易地使用更多的数据。
  • 数据迭代-Defender可以从供应商和客户那里获得关于其数据的质量、限制和使用的建设性反馈。这使得他们能够比攻击者更有效地迭代现有模型和源。

坏的方面:AI严重危害网络安全

如果犯罪分子和流氓国家能够利用现代人工智能工具来提高其攻击、协作和学习速度,使其超过防御者的适应速度,则可以增强攻击者的能力,并使防御者处于不利地位。企业网络罪犯可以使用人工智能工具来编写恶意软件,而不管他们的编码知识如何。他们可以与流氓国家合作,利用该国对高质量数据的访问来训练人工智能模型。然后,犯罪分子和流氓国家都将改进其攻击技术和能力,以避免被发现,将其用于盗窃、间谍活动或破坏性攻击。由于攻击者将使用防御者无法访问或使用的模型和数据集,因此防御者只能对每次入侵做出反应,此时攻击者可以转向新的人工智能生成技术。这些工具的速度和功能将最大限度地减少修改攻击的成本,而防御攻击的成本则以无法控制的速度增加。

如果人工智能使攻击者比防御者具有明显的优势,那么这种未来将是可能的。下面是对人工智能工具在未来如何发挥作用的具体描述。

1、提高罪犯的效率

人工智能使网络攻击变得更简单,成本更低。犯罪动机更高,因为人工智能工具可以提高几种类型攻击的回报和成功率,例如:

  • 将资产集中在目标中-使用生成式人工智能来补充核心业务功能,既可以在专门的人工智能系统中创建和集中更敏感的数据,又可以提高罪犯利用这些数据的回报。
  • 定制恶意软件-人工智能工具生成按需定制的恶意软件,可以根据特定目标定制。
  • 弱威慑——罪犯不太关心违反知识产权法和道德准则等规则,对他们使用人工智能工具的限制较少。
  • 用于加密劫持的AI自动化-帮派使用基于AI的自动化脚本来利用受害者机器的计算能力,并提高加密劫持的效率和回报。
  • 矛式钓鱼中的生成式人工智能-攻击者使用生成式人工智能创建更个性化的钓鱼电子邮件和可信的发件人角色,从而增加成功的可能性。
  • OSINT的机器学习-机器学习工具通过改进对公共可用数据源的分析,帮助攻击者更好地理解其目标。
  • 用于未授权访问的机器学习-机器学习工具帮助攻击者搜索互联网,更容易找到易受攻击的系统,从而增加成功攻击的可能性。
  • 高级恶意软件的机器学习-攻击者将机器学习整合到恶意软件中,使其能够从经验中学习并动态修改其行为以避免检测。
  • 攻击面枚举-机器学习工具帮助恶意软件更有效地找到有价值的资产。
  • 漏洞发现-机器学习工具帮助攻击者找到漏洞,以便访问枚举资产管理系统。
  • 造假活动的生成式人工智能-攻击者使用生成式人工智能创建虚假的音频和视频内容(deepfakes”),提高宏观目标虚假信息活动和微观目标社会工程活动的欺骗可能性。
  • AI腐蚀AI-启用AI的攻击检测和避免,人工智能使防御成为可能,使其变得无用和可利用。

2、刑事供应链中的更好关系

人工智能工具还影响参与网络犯罪的实体类型以及它们之间的互动方式。最初,人工智能模型使用大量高质量的数据集,这些数据集通常仅可用于合法组织和责任国家。随着时间的推移,犯罪集团和较小的流氓国家的反应是联合和整合他们的努力,为恶意使用创造类似的工具。这种融合增强了犯罪行为者的能力:

  • 更好的攻击者分工——罪犯和国家具有不同的优势,他们的伙伴关系不断发展,以创造攻击者的规模经济。国家提供资源和目标清单,而犯罪组织具有特定的专门知识或意愿发动攻击,即使是流氓国家也可能不愿意这样做。对预期目标的人工智能分析用于确定潜在的合作者和最有可能成功的攻击。
  • 防御的全球分布不平等——财政和计算资源较少的国家无法部署有效的防御措施来抵御人工智能攻击。相反,富裕国家防御能力的提高导致攻击者将注意力集中在防御能力较弱的国家。
  • 改进了勒索软件部署-擅长使用勒索软件的犯罪组织与流氓国家合作,破坏目标国家经济。
  • 改进影响行动——更小、更灵活的犯罪集团收集个人信息,以定制民族国家宣传。
  • 恶意人工智能模型开发-流氓国家为犯罪组织提供数据和基础设施,用作恶意人工智能模式开发的训练场。
  • 综合洗钱——犯罪组织通过提供绕过经济壁垒的连接和使用人工智能生成可信的交易轨迹,以洗钱援助国家。
  • 不一致地遵守法律边界——虽然合法组织遵守限制人工智能的国家法律和国际协议,但犯罪组织跨国界使用人工智能没有限制。

此外,人工智能工具的民主化降低了希望参与网络犯罪的潜在行为者的进入壁垒:

  • 级联成本-人工智能既减少了进入壁垒,又增加了规模经济,这两者都扩大了攻击的规模和规模,并能够更有效地改变战术。
  • 简单的黑客工具包-罪犯使用自动化黑客工具,这些工具需要最少的知识,但可以渗透复杂的企业或政府防御。
  • 改进的网络钓鱼提示-罪犯使用现成的生成式人工智能提示来生成个性化的、特定于文化的网络钓鱼内容,并可以大规模分发。
  • 诈骗内容——罪犯可以很容易地为大规模社交媒体活动制造深度伪造品,
  • 基于人工智能的勒索软件-罪犯使用现成的基于人工智能勒索软件,该软件使用来自以前受害者行为的大量数据,以最大限度地提高支付概率。

在目标方面,使用人工智能的组织必须依赖于少数拥有这些大型数据集的供应商。这在供应链中创建了集中的漏洞点,攻击者可以利用这些漏洞向其目标施加大规模成本。攻击者可以通过以下方式利用这些漏洞:

  • 毒害训练数据-罪犯使用基于人工智能的应用程序编程接口(API)来操纵训练数据和模型,以进一步破坏用户或促进漏洞的广泛分布。
  • 屏蔽的网络流量-罪犯可以创建难以从人类流量中分类的合成流量。
  • 后门妥协——罪犯将后门放入客户使用的人工智能模型中;从而也可以访问客户系统。
  • 常见漏洞-罪犯可以利用特定漏洞攻击多个公司,因为所有公司都依赖于相同的底层AI供应商。
  • 勒索软件即服务(RaaS)攻击-以RaaS为中心的犯罪企业可以使用基于人工智能的攻击更轻松地扩展赎金支付。
  • 跨共享资源进行间谍活动-罪犯利用多个公司使用的共享AI基础设施来过滤敏感信息。

3、AI责任和质量方面的困难

人工智能工具经常生成质量差、不准确的结果,很难与非人工智能内容区分开来。此外,模型和开发人员不应对这些错误负责。通过降低发起某些类型的网络攻击的成本,对手现在可以将其攻击外包给更小、更隐蔽的实体,从而更难追究这些国家的责任。防御人工智能攻击的成本远远超过开发它们的成本,能力差距正在扩大:

  • 全球覆盖——尽管一些国家采取了法律保障措施,但人工智能平台的开发和使用在法律允许的管辖区内是恶意的。
  • 与新奇事物斗争——人工智能支持的防御与不属于其训练集的攻击斗争。
  • 罪犯之间的无许可创新——罪犯创造攻击工具没有任何限制,因为他们不遵循约束合法开发人员的相同道德规范和规则。
  • 无注意义务——人工智能公司没有明确的法律义务来保护其数据和模型,因此许多公司没有对国防进行充分投资。
  • 高级证据篡改-罪犯可以使用生成式人工智能廉价地创建虚假内容,使证据收集过程复杂化。
  • 公众信心的丧失和社会机构的侵蚀——由于人工智能工具在促进恶意行为方面变得更加有效,公众对新技术失去了信心,合法创新滞后,而恶意行为者继续蓬勃发展。公众对技术失去信心,就会侵蚀对社会机构、民主制度和客观真理的信心。
  • 污染的公共资源-基于人工智能的攻击,如深度伪造,导致更糟糕的数字公共资源,赶走缺乏过滤此类材料的手段的无辜实体。结果是,较贫穷的实体必须在比有支付能力的实体更差的平台上运营。

应用+AI,是未来吗?

(1)引擎

1970年代,IBM发明了一个中间件叫:规则引擎。

意思就是:你可以灵活设置规则,不用把业务规则逻辑用编程语言写死在软件中。

因为中国程序员都是码农,不懂得设计程序,就是知道业务逻辑多复杂-代码就多复杂,所以各种状态机引擎、规则引擎都不会用。即使平台研发团队搞了个规则引擎,也都在业务功能中不会用或者只用一点点。

现在,人工智能热潮风起,很多IT厂商又开始用规则引擎忽悠智能化-自动化。

(2)数据

对于外行人,认为大模型=会话大模型+生成大模型。

对于内行人,大模型=海量大数据+Transformer深度神经网络。

所以,数据的重要性和稀缺性,对于内行人来说,比模型还重视。所以中国最近两年出台了无数政策在说数据安全和数据资产的事。

Open AI公司因为数据,在2023年也惹上了事。这就是,事情不火不挣钱,大家都不言语,一旦发现事情火了有利可图了,这就得说道说道了。所以2023年,Open AI免费爬取编程问答社区SegmentFault的数据做了大模型,用户一看在ChatGPT中做编程问答效果更好,就不访问SegmentFault网站了,所以SegmentFault的流量快速下滑。这让SegmentFault就怒了:你不仅爬取我的数据不给我钱,你还拉走了我的用户,这不行。

Open AI虽然去年主动去国会申请召开听证会,希望促进国会尽快立法,让大家在规则下发展。但是最终听证会也没有有效运转起来。所以美国对于数据资产的一系列的法律制定,也滞后了。

那大模型怎么持续进化?有人想到了一种方法是:数据增强,通过现有数据进行智能的变形和合成,这样就数据量翻倍了。我对这种方法认为比较狗屎。我经常说:垃圾输入必然是垃圾输出。数据增强在我眼里,和内容洗稿没啥本质差异。你把十篇内容稿件通过各种切分排列组合弄出来1000篇内容稿件,也是垃圾,而不是创造和知识。所以这种垃圾输入垃圾输出的数据增强方法,只能让大模型更傻。

那大模型怎么持续进化?我能想到的最好方法就是现在大模型的应用商店。传闻GPT应用商店里已经有300万个应用了。大家不用搞Lora微调和预训练,也不用搞指令调优,也不需要搞人工反馈的强化学习,也不用搞复杂编程开发,只需要提示模板调优+SaaS API调用就可以很方便做出一个应用。这个应用无法脱离大模型。只要人们使用应用,本质上就是源源不断地把数据输送给大模型。大模型把数据日常沉淀汇集起来,然后在大版本预训练时利用起来。每个应用产生的数据都很小,但是这么多应用产生的数据就如同无数条小河,汇聚起来就是大江大海。你如果因为安全考虑不想把你的数据沉淀给大数据,那对不起,那你用开源私有部署去玩吧。

所以,这种方法避免了数据资产的法律问题,也避免了数据增强愚蠢问题,还有了源源不断的新鲜数据血液。这个机制才是永恒永动的。

(3)技术

刚才提到了提示调优模板+公有云SaaS Open API调用。这里就再衍生一个技术:AI Agent

Agent这个词大多在强化学习场景中使用。2023年Q4,一个新技术热词被Open AI公司内斗引爆了出来,那就是:Q* Learning。其实A*是强化学习的前置技术-动态规划中的一种算法,Q-Learning也是强化学习-时序差分中的一种算法。Q* Learning就是这么组合来的。

但是AI Agent这个热词在2023年引爆是在上半年,是在下半年Q* Learning引爆之前流行起来的。所以外行人眼里的AI Agent,其实和强化学习没半毛钱关系。

外行人眼里的AI Agent,其实是在上半年流行的提示调优模板相关。

大家都知道,现有人工智能还不能回答复杂逻辑的问题,所以大家想了一个办法,叫做:思维树CoT,意思就是把一个复杂逻辑问题,人为分解为12345步,这样就可以一点点引导大模型得到你想要的答案了。

所以,AI Agent其实是一系列2023年上半年技术的杂合,所以才有了现在AI Agent框架的说法,杂合了:

CoT模板-代码生成大模型、公有云SaaS-Open API甚至API工具(如Postman、Zapier)

RPA-UI层集成自动化、流程挖掘

SAP就想走这条路。但这条路和人工智能其实没有半毛钱关系,只是挪用了人工智能的思维树的思路而已。

(4)模型

2023年,中国发布了上百款套壳大模型以及所谓的垂直行业大模型。

依我对中国人工智能产业的了解,其实能做大模型的中国团队寥寥无几,一双手都能数过来。

其实,绝大多数所谓的大模型团队,连Lora微调都不会也不敢。虽然Lora微调也只是改动最后一层,但是即使改动最后一层也不会啊,况且改动完了还要做预训练,虽然预训练的代价已经很小,但很小也是需要不少算力的。所以,在中国,其实连Lora微调都不会做。

大多数团队只会使用提示模板调优。连RHLF(基于人工反馈的强化学习)都不会。毕竟强化学习比深度学习还难。

有些深度的团队会搞指令模板调优。

但大多数团队连所有的调优都不会也不敢,因为太消耗工程人力了。能做的,就是把自己的数据通过大模型API输入给大模型,然后让大模型自动输出结果。这就是真实的现状。

李鬼太多了。

即使是真李逵,敢于做Lora微调,敢于做提示调优和指令调优甚至RHLF,我个人认为垂直大模型也最终必然会被通用大模型吞没。

为啥我会这个观点?我类比个例子。经常有朋友问我:为啥你会这么独特地思考?我说:因为我的知识体系中有:历史、地理、政治、军事、金融、经济、哲学、人性、计算机、组织、管理,所以我的思考是多维的、非线性的、动态的。而大多数人知识不成体系,所以是单维的、线性的、静态的。

我之所以这么类比,就是因为垂直大模型就和大多数人一样是单维的、线性的,不会聪明的。真正的聪明一定是多维交汇的。就如同很多知名的数学家,在音乐造诣方面也不错,他们其实就是融会贯通。不融会贯通是走不远的。

(5)应用

2023年特别流行一个人工智能技术名词叫:RAG,意思就是检索增强生成。

这个热词来源于:微软Bing搜索,整合了GPT文本生成大模型,通过实时搜索避免了大模型因为预训练机制导致的信息陈旧问题,也通过文本摘要生成大模型弥补了传统搜索列出无数条链接内容让用户一一点开看的缺陷。

所以业界也想模仿New bing这么搞垂直搜索增强改进,所以产生了RAG技术的探索。

在说2023年流行的RAG这个热词之前,我再说说另一个技术事:向量搜索引擎、向量数据库

我早先用的是ElasticSearch,在2020年我用了向量搜索引擎和向量数据库Milvus。

2023年,RAG火了,于是向量搜索引擎和向量数据库不知道怎么也突然火出圈了。

然后有一帮人不知是不知道呢,还是别有用心呢,就把向量搜索引擎和向量数据库,偷梁换柱李代桃僵,就等同于RAG了。

不过,热潮很快就过去了,2023年,向量数据库被证伪,又快速回到了自己过去擅长的领域。随之,RAG这股风也不如过去热了。

AI硬核思辨:AI原生应用,在中国为什么卷不动?

对话主题:“AI落地进行时,让创新真正触手可及”

参与嘉宾:兔展智能董应赛、网易伏羲游戏李乐、WPS AI汪大炜、WeShop吴海波。

主持人:硅星人/品玩CEO骆轶航以下是对话内容实录:中国的AI原生应用发展这么慢的原因是什么?

骆轶航:感谢大家,刚才听了行远和博杰两位老师讲得非常好玩,行远其实每个东西做得看上去都跟大语言模型没有关系,其实这几年脉络是下来的,你无聊问答的那个东西做早了,你晚四年到五年做那可能就是完全不同的一个场景,其实我觉得特别有意思,他坚持一个路径能做一些非常有意思的事。博杰老师特别有意思,昨天我们几个朋友在一起讨论过这个问题,博杰老师把AI分成了有用和有趣两类,我们问你为什么不把智能、可感知、可推理甚至做一些最重要的生成当作一个划分呢?他说这是一个基础、一个标准没有这个我们谈什么?我们是在这个基础之上才去谈有趣和有用这两类。我还是做一个简单的调研,现在在场的同学们有多少人以为自己用过AI Agents?有多少人用过有用的Agent?说白了帮你法律顾问、财务顾问、文档顾问?有多少人用过有趣的Agent,陪聊之类的,我特别担心大家不用有趣的Agent。我进门的时候做那个测试,你向左还是向右,向左是愿意接受AI的陪伴,向右是不愿意,我义无反顾地选择了向左,作为一个i人,我觉得不是一个E人,我觉得如果可以不跟人沟通,用AI陪伴我觉得也还蛮好的。其实我觉得AI陪伴有用的维度我可能有一个观点跟博杰老师不太一样,跟这个阶段不太一样。但是博杰老师是在做事,我是在扯淡,这是差别。如果我们真的相信成本未来能够降下来的话,有趣一端能够创造更大的价值,因为这个世界大部分是有用的,他们也不会做很多的事情,这是一个很有意思的事,我们今天就落地去聊一聊AI的应用、AI的应用能够产生,我们怎么能够尽快地去落地,我们先上来给每个人拍一个砖,问每个人一个问题。过去也一年一些大佬拼命地去跟大家去讲,我们不要再去开发那么多模型了,“百模大战”东西太多了,赶紧开发应用吧。但过去的一年事实上至少在国内并没有出现真正的所谓的native AI APP的大繁荣,一部分人还在卷模型,普通人对AI应用很多时候可能无感,可能少部分的AI应用,最近这一两个月可能会有爬坡。我相信现在有的人可能注意到豆包现在投放量蛮大,有人人还用到了豆包、还用到了星野,海外用户可能大家都用Character AI、包括用派、用AI等等,但是其实整个应用在国内没有得到一个大的繁荣,很多平台也都推出了自己的工具包,希望开发者去开发应用,好像也没有那么多,原因是什么?是模型不行?还是什么原因?大家的观察,我相信各位都在做,有基于国内的基础模型去做的,也有基于海外的模型去做的,大家能不能直言不讳地讲讲这个原因。

“底层模型做开发还是有差距,是需要承认的”

董应赛:原来经过这几轮技术的更迭,大家可能会通常有一个认识,觉得可能在中国移动互联网,可能会更繁荣一点,就是做应用这个事在中国更有热情,大家更愿意去做,而且用户基础也在这里,觉得中国通常都会对做这件事情,或者说回到这个问题上开发AI APP的热情以为会比美国更多一点,我觉得这一次通用人工智能最重要的还是基础的技术是不是做得很扎实,这个应用的效果才能做得好。我自己的体会是因为我原来在Mate、在Facebook工作过几年,我一直跟我美国的朋友有交流,其实是会发现国外它有一个跟中国最大的一个不同就是大家的人才密度其实还是更高、更集中一点。比如说真的是OpenAI、Google等三家人才密度是非常高的,在资源、资金、算力,人才投入在相对集中的公司里面,做出来的模型确实是很好的。比如说大家都在说是不是做了接近于GPT4的能力了,刚才前一场沙龙的交流过程中听到几位专家的说法其实也比较有自信会觉得可能差距没有那么大,但是我们自己的体验在应用端,要基于这些底层的模型来做一些开发的时候,还是会觉得是有差距,是要去承认的。而且在国内事实的情况是比较分散。

骆轶航:模型太多了是吧?

董应赛:模型太多的,人才不够集中,僧多粥少,哪怕在国外、在美国做这些AI研究的公司中华人占比不低,国内大家如果更集中一点这个事情是能做得比现在更好的,大厂也想做,也涌现了很多创业公司,资金也会比较分散,可能后面我们再聊一些投资都有问题。回到根本的问题上,可能还是底层的模型,至少我们现在感觉还是有一些差距的。所以在这次AI这个浪潮里面跟之前的不同,比如说移动互联网里面,无论是抖音还是做社交平台,更依赖于底层的技术是不是成熟才能把一个应用给做好,我觉得这个是我想来分享的。

“技术永远没有做到最好的时候,但是我们却可以在目前的技术条件下做出很好的产品”

李乐:我的想法可能会相反。我举个例子,当然这个是游戏里面的例子,我昨晚也说过,2018年的时候,我就把一个SQL TO SQL的模型放到游戏里面去,那个能力大家能感知到的,可能连个小学生的作文都写不清楚,我们就很好地选择了一个游戏里面的养育系统这样一个场景,就是现在游戏里面玩家生出来的那个小孩,把对话AI加到小孩上面去,小孩的父母亲就是那些玩家可以跟小孩进行聊天。即使在这样的2018年年底那样一个技术水平下都有非常多的玩家跟他去进行聊天,所以从我的角度来说,我觉得对做产品的人来说,我觉得有更高的一个挑战,就是我们要在现有的基础情况下根据我们业务的场景去想我们应该去做什么样的一个应用,所以我觉得我们做产品的人应该要有更多的思考和主观能动性在里面,所以这个应用的市场才能做得更好一点,所以这是我的一个看法。另外一个,当然我觉得不要把它变成一个吐槽性质的东西,我们国内的模型跟海外有多大的一个差距,我们看到从现在这个时间点来看,大家已经比去年上半年的时候信心足了很多了,而且还在快速地研发的过程之中,各种性能也在不停地提升。但这里面会涉及到很多的问题,我觉得因为国内还是会做得慢一些,特别是很多高质量的开源的模型拿出来给市场的也慢一些。从我的角度来说,我了解到很多的公司也看到了市场上面一些好的例子以后,他们也有所触动,也在做相关的一个东西,我觉得站在游戏行业这个角度来说,可能在今年年中左右会有更多更好的应用出来,它可能是一个时间窗口的问题。当然,我觉得还有一个问题就是目前来看AI还是很贵的,就是你的研发很贵,你的线上推理很贵,特别是在我们游戏的场景。我们的QPS是非常大的,游戏方承受的压力也很大,大家游戏要做差异化,他们真的就是咬着牙跟我们一起做创新,我们也希望这一块算力的成本,不论是我们训练的成本还是我们在线推理的成本,都能够尽快去降低。骆轶航:我特希望我们的嘉宾在台上这么能够打起来,提供截然不同的看法,模型确实还是有问题,人才我承认,如果全球有一百人能做的,人家三家加起来占80个你确实很难受,即便这样的情况下模型还是有进步的空间,做产品的人怎么能够更快地具备AI的思维,我们那会儿老提互联网思维、移动互联网,但是做产品要有AI的思维,用好自然语言,打开他的想象力去做一些事,昨天李乐老师秀了一个demo我就非常开心。接下来让汪大炜聊一聊,你们可以不讲你们怎么进入的,你们可以讲一点感受。

“需要更多的工作来让模型与用户需求匹配起来,用户也在不断学习如何更好地使用AI应用”

汪大炜:我讲一下从去年到今年一共发生了什么事情,这个可以去解答为什么,某一部分可以解答中国为什么做应用的人比较少,我们很早就做AI了,我们2017年就开始做AI相关的事情,但那时候CV、语音这种场景的,还有翻译校对,去年12月我们就关注到GPT的事情,关注到这个事情到底能不能做?真正启动大概是2023年2月份,当时整个公司开了一个会,核心的骨干都在一起说这个事情,我们判断这个事情可能会颠覆未来办公的方式,大家一定要投入到这个里面,当时我们内部两千多号研发,所有人如果你今天不去聊天AI的事情,可能你就会逐步逐步被淘汰那种感觉就会很明显。在那个时候我们就开始找包括国内的、海外的模型的服务商,因为其实我们其实本质上不太做大模型,我们更多的还是用户场景里面找到用户的场景,去给用户提供这样的服务,所以我们找这样的合作方说哪些服务是合作方可以给我们一起共创、一起支持。海外的包括谷歌的、OpenAI我们也找了,国内的大家也看过包括 Mini Max这些、百度我们都有相关的一些合作,然后我们就开始做两件事情,第一件事情是看用户的场景里面有哪些是可以AI化去改造的,因为我们觉得AI化改造之后是能给用户带来很强的或者很大的效率上的提升,那我就去找一些事情,包括当时我们还去找了一些翻译的专门做出版社的翻译的老师,包括去做一些用语言的事情,找哪些产品可以做到。然后我们就发现了6月份发布会我们说了几个方向,比如说AIGC的方向、Copilot的方向和那个 inside方向,我们在做这件事情的时候,跟这些模型就开始说我们接进来,接进来我们调,看怎么样可以接到这个场景里去,那个时候整个行业里面的应用都是像对话式的交互方式的,我右侧一个对话面板跟它说一个我的需求,它帮我做完,基本上是这样子,我们朝着这个方向去努力,模型方我的需求是这样的,办公场景你给我做一些什么样的适配,生成的大纲你给我做格式的标签,大模型里面没有语料和训练,要把这些训练项目加进去一起去训练,让它带格式的属性标签出来,方便我后面做数据的操作,那个过程中6月份我们开了一个发布会告诉大家有这个事情可以做内测的时候,当时我们的感觉是模型叫勉勉强强可以用,可以放进来,这个完整的链路看上去可以完完整整地去使用,大概是这种感受。我们去内测过程中就发现了一些问题,用户在真正的办公使用场景里面它的任务是一个复杂的任务,不是一个简单的单一任务,当我以一个指令的方式,以一两句话,或者几句话去让他做这件事情的时候,他没有办法把这件事情一步一步猜出来,而且这个上面每一个人的想法、每个人需要改的地方都不一样,我们上了一个月的内测,我们今天的产品在今天的WPS里面是有问题的,我们后续不断地去做修改。大家可以看到最早一些用户右侧浏览这种方式很舒服,实际使用过程中我生成一个PPT难道里面的大纲内容不改呢?肯定要改,AI生成的内容跟你想要的内容是不是符合的,没有办法一步到位,你一定会去改这个东西、一定会去调整,一定会去加进自己的东西,一定会往后走,我们把AI整体的能力打散,放到用户功能流程里面每一个部分加持它,这样的情况下你会感觉变得聪明,整个过程中模型也会不断地迭代,真正到年底我们真正发公测的时候,这个模型是超过我们想象中的进步的。虽然跟OpenAI还是有一定的差距,跟3.5还是有一定的差距,但是你觉得我可以用这个,我们用户用他使用的数据告诉我,他已经真正地在用这件事情,有一部分已经用到了他的整个生产环节里面去,或者工作环节里面去,这个是我们看到觉得未来一个比较好的方向,在未来可能1年多的时间里面我们认为还是这样的方向在整个产品或应用层面的一个表现。回到这个话题里面来说,我觉得今天的国内的基础模型不是不能用,也不是说很烂、很糟糕,其实他们已经在有些场景下、有些应用的方向上有个很好的基础在上面,只是我们真正地到了用户的使用过程当中,我们真的需要做很多的事情,让用户的需求跟我模型的匹配能做起来。同时我们也看到用户也在学习,这是一个很关键的因素,我们6月份之前,我们看到用户其实在整个使用过程当中问问题,跟现在问问题的质量真的会有差别。所以我觉得这两个因素会慢慢逐步逐步地去改变大家去做AI的应用的部分的能力。

骆轶航:大炜你刚才讲这些东西都可以写个文章了,上半场我们聊TPF,TPF怎么去实现,俊旸讲的吧,铁震和俊旸两个人讲的,TPF这个事是试错试出来的,这个就是典型的TPF的过程,没有人告诉你答案,这个就是典型的TPF的过程,这个TPF的过程不仅是产品团队自己的P怎么去适应这个不可知的T,其实用户也参与进来了,我觉得这个过程实际上是一个特别特别有意思的过程,尽管这个东西跟一开始你们想的不一样,这个探索还是有价值的,我也知道你们4月份的时候,我就跟庆元总去聊过,当时的想法很美妙、很乐观,一年扑腾下来很多东西什么是能实现的,什么是不能实现的,大家有更清晰的认知,他这个特别好,但是肯定要花时间。

“现在的应用更容易被吃掉 动手才知道基础模型的边界在哪里”

吴海波:我们是最近一年AI应用中商业化走得比较顺的。我觉得这个问题可以拆成两个问题相对讨论。第一个问题是native的AI APP是什么东西?

骆轶航:有这个东西吗?这个事存在吗?现在每年没有共识的概念。

吴海波:刚才这个问题的讨论是说这个APP的生态没有起来,这一拨跟上一拨有个巨大的区别,比如说以WeShop举例,我做一个电商行业的商拍,就是把商家都是要上架到线上,需要一个商品,让AI可以做一个更有效率的事情,所有人都会问一个问题,淘宝做了怎么办?抖音做了怎么办?拼多多做了怎么办?那么你在中国这个环境下避免不了地要去讨论这个问题,你做native AI APP的生态的繁荣是不可能几个大厂在那里搞几个APP出来,一定是靠千千万万的开发者冲进来,这个问题不只是有中国出来,我记得11月份的OpenAI开发布会,Twitter上有一个大V发了一篇推,OpenAI给我发了500美金的优惠券拿走了我500万美金是指的公司,大概是这个意思。我觉得中国我们以前的环境中大厂对我们的拷贝是另一个维度的东西,今天有一个维度的东西,我特别喜欢我们刚才讨论的是基础模型,公司用得比较多的是SD,SD不算大模型,单机就可以跑起来,它确实是foundation model,这个东西它在不停地吃掉一些应用层面的东西,它天然就能做应用,所以这个时候native APP没有火起来我觉得有很多很多开发者他是有顾虑的,他觉得自己一轮下来一个创新的点子有可能再过半年、一年东西没有了,场景不存在了,给另一个公司直接就吃掉了,所以这个问题不止国内,全球都有这个问题。

骆轶航:叫This model is eating native APP。

吴海波:今天如果要做应用,绕不开什么是native APP,这个东西我肯定是没有共识答案给你,但我脑子里可能有一些什么不是,大概是这个意思。关于中国的基础模型,我觉得现在是非常make sense可以理解,整个基础模型是要去争一些东西,这么多大厂他们有资源,相关有资源的人肯定要投入到这个事情上拿到一个票,现在我们国家,至少国内最好的技术、最好的资源都在做这件事情,make sense,从年初到现在看到他们的测试,我们按我们自己的场景去测,它持续进步是很快的,只是对应用的来讲,这个东西一定会成为应用行业的β,整个行业的β就像移动互联网,整个移动互联网的β不停变好的时候所有人受益,我做应用的要思考的点是我是不是α,如果我不是α,我做的事情是给β那我就完蛋了,所以我们核心是想什么是α、什么是β?但是讲了这么多好像没有什么结论,我想说的点跟前面两位嘉宾是类似的,你要动手,你动了手你才知道foundation model的边界在哪里,你才知道你的客户是怎么给你反馈的,你坐在这里思考非常哲学的问题,因为这些东西我们做应用很多做产品经理出身的人非常喜欢在哲学层面上去做很多这样的探讨、逻辑对应,可以讨论得非常形而上,但是落不了地的时候你没有感觉,一定要把自己的手弄脏才会有感觉、才会进来,我觉得这是一个非常关键的点。所以我是比较认同我们是一定要实践出真知的。

骆轶航:总结一下四位,应赛和海波客观地强调了现实、现状其实对应用造成的一些挑战,我觉得两位讲的第一个观点某种程度上我也是同意的,基础模型,基础模型的话,比如说它是GPT4,你是另外一个类似的东西,你是另外一套基础模型,其实如果你们之间有差异是会影响,这个东西其实某种意义上延缓或者阻遏了我们中国的这些产品经理的产品感和产品能力,某种程度上被这个东西所影响,其实现在应用更容易被吃掉,更容易被base model的某一部分能力吃掉,当然移动互联网早期也有这样的事情,但是我们发现这个东西更容易被吃掉,这是一个现实。但是各位谈到另外一个话题也很重要,就是动手,第一个就是基础模型有差距,但它其实赶的速度蛮快,这个我不得不承认,过去一年,我们就不说小的开源模型了,大的模型我们说陪伴模型,我天天玩陪伴,它的进步我还是非常有感知的,文心一言的进步你是肉眼可见几个月一次进步的,智普跟百川同一个道理。另外一个product market这个东西是靠动手试出来的,它不是靠大家想出来的,不动手就能有这个东西的,我觉得不是。

深度观察:智能戒指、脑电波传感、生成式AI的新时代?

一年一度的科技界的“奥斯卡”CES已经落幕,但留给大家的震撼还未消散。作为科技界的重点保留节目,CES汇集了全球各地的新产品和黑科技,吸引了包括英伟达、英特尔、AMD等4000多家企业参加,来自中国的企业超1000家。

这是疫情后最热闹且具有看点的一届。空间计划的传说、智能家居的新玩法、芯片大厂的全新阵容、科技巨头们都拿出了看家本领争夺场馆“C”位。

与其说,这是一场消费电子展览,不如说,这是一场大型技术见面会。各个品牌产品百花齐放,实际上更多了一层暗自较劲的意味。来自东方的力量也不甘示弱,漂洋过海的黑科技引来不少现场观众驻足关注。

那么,全球消费的电子风向标将指向哪里?此次含金量满满的“科技届春晚”,谁能成为“主角”?以下,Enjoy:

智能枕头、同声传译耳机?

这届智能家居、智能穿戴有点卷

CES 2024上,智能家居和智能穿戴的发展态势超乎意料地多元蓬勃。小到耳机、手表,大到智能门锁、同声传译,将日常生活的大多需求无孔不入地考量在内。无论是亚马逊、三星的头部玩家,还是各家后起之秀,都展示了一波实力。

1.智能穿戴:

CES 2024上,诸如智能锁、智能戒指等智能穿戴的多种打开方式,正如电影科技照进现实。

Lockly智能锁团队的最新产品能够支持面部识别,还可以与NFC配合使用,通过两个2MP分辨率的红外传感器进行双目面部识别,2.6英寸内,智能锁得以在1.5秒内解锁。同时,飞利浦则针对用户手掌进行设计,推出手掌识别智能锁Deadbolt,可以记录不同年龄段的人高达50多种掌纹。

NeurGear团队推出的ZenBud耳机则通过超声波技术,利用刺激迷走神经来放松身体。迷走神经在人体中发挥着多项重要生理功能,如消化、呼吸、心率等。

中国厂商带来的Helio Ring智能戒指,采用了钛合金的材质,通体不到4克重,具备心率、睡眠、压力、血氧饱和度等健康监测功能,同时,还可以基于检测数据,给予健康指导。也有网友激情发言:智能手表尚不舒服,智能戒指能否保证不是睡眠紧箍咒?

对戒指做文章的还不止一家,VTouch另辟蹊径,将戒指化身为了一款移动麦克风,内置麦克风和距离传感器,当戒指靠近嘴巴时,麦克风就会被激活。并且,出于安全考虑,单击5次戒指就会自动触发报警,并记录当时的环境声音。

很多网友曾开玩笑:近视眼的眼镜一摘,听力也直线下降。EssilorLuxottica带来的助听眼镜则正是针对听力损坏的问题出发。Nuance Audio 眼镜,主要适用于轻度至中度听力损伤的群体,在镜框设有波束形成麦克风,头部轮廓用以校准算法,可以定向增强说话声。

2.智能家居:

宠物追踪、读取脑电波、缓解打鼾……CES 2024上,智能生态不是梦。

Motion Pillow研发的智能枕头让爱打鼾人看到希望,它可以通过AI识别调节枕头高度,以使用户头部呈现对应角度,以解决打鼾问题。

2.智能家居:

宠物追踪、读取脑电波、缓解打鼾……CES 2024上,智能生态不是梦。

Motion Pillow研发的智能枕头让爱打鼾人看到希望,它可以通过AI识别调节枕头高度,以使用户头部呈现对应角度,以解决打鼾问题。

Withings研发的Beam O,是一款多功能合一的家庭类健康监测设备,能够实时测量体温、读取血氧水平、甚至充当听诊器检测用户身体状态,以及配合做心电图。产品小小一个却高科技含量满满。

Mywave研发的Pebble,作为一款脑电波传感器,需要被贴在额头上。在用户睡眠过程中,Pebble可以追踪眼动期到深睡期,根据脑电波生成自定义的睡眠轨迹。并且,数据上传后,还会生成对应的助眠曲。

2

巨头的技术“撞衫”

芯片领域,英伟达、英特尔、AMD等巨头相继亮相;屏幕领域,三星、LG、TCL也不甘示弱。

1.游戏体验拉满的英伟达

英伟达在展会中展示了游戏、创造、生成式AI和机器人创新相关产品,还进行了一场特别演讲。英伟达再次为游戏党带来福音,发布了GeForce RTX™ 40 SUPER 系列 GPU,作为AI PC的核心硬件,如Matt Wuebbling所说:“GeForce RTX SUPER GPU 现已支持超过 500 款 RTX 游戏和应用”,性能再翻。

与此同时,英伟达推出了NVIDIA Avatar Cloud Engine(ACE)Production Microservices,开发者可以通过 ACE 微服务,利用 NVIDIA Audio2Face™(A2F)等 AI 模型,以及 NVIDIA Riva 自动语音识别(ASR)构建游戏和应用的虚拟角色。

全球视觉内容缔造者 Getty Images 在 CES 发布 的iStock 生成式 AI 工具,则也是基于英伟达定制的AI模型生成服务,以为设计师和企业提供从文本到图像的生成工具,创建可授权的视觉效果,包括对生成图像的法律保护和使用权。

英伟达的技术还蔓延到电动汽车领域。众多 NVIDIA 汽车行业合作伙伴在拉斯维加斯举办的 CES 上展示了先进的技术,包括梅赛德斯-奔驰、Luminar、Ansys、Cerence等。

2.野心勃勃的英特尔

CES 2024中,英特尔同样推进“AI无处不在”战略,正式宣布进军汽车市场,主攻智能座舱芯片、电车能源AI管理、开放式汽车芯片定制平台三大方向,并将首款上车的芯片命名为“SDV”(Software Defined-Vehicle),主打软件定义汽车的理念。

同时,英特尔执行副总裁、客户端计算集团总经理 Michelle Johnston Holthaus还透露:核心Chiplet技术产品Arrow Lake处理器和Lunar Lake处理器将于2024年下半年上市。

3.潜入汽车的AMD

AMD在CES上宣布了口号与野心:Advancing AI PCs。此次,AMD着重升级了桌面APU产品线。推出了四款全新APU,统称为 Ryzen 8000G 系列。

它不仅展示了8000G系列APU和Radeon RX 7600 XT 16GB显卡,也在汽车领域有所作为。

AMD首款通过汽车认证的7nm器件,Versal AI Edge SoC引入了先进的AI引擎,能够优化包括前视摄像头、车舱内监控、激光雷达、4D雷达、环绕视图、自动泊车等在内的多种性能。

4.三星:世界首款!

三星和LG两家不约而同在CES 2024上推出透明屏幕,摸索着技术领域的潜力。

三星在CES2024上推出了世界上首款透明Micro led显示屏,两款彩色玻璃面板和一款完全透明的面板,能够提供高像素密度的清晰锐利的图像。

三星的透明屏主要利用了Micro LED技术,突破了传统OLED屏幕的能力,可以精确控制单个像素,并且受光的影响较小。 

虽然只是原型机的概念展示,但也给了现场亿点点震撼。

5.LG:透明大杀器来袭

同样是在CES2024上,LG亮相的大杀器则是无线透明OLED电视,不仅拥有4K画质、77英寸大屏,还具有无线特性。毫不夸张地说,购买者可以将这块屏幕放在家中任意位置,例如客厅原本放置屏风的地方,作为装饰品。

当进入AOD模式时,设备就可以作为一个动态艺术品融入家庭环境中,例如山水画、艺术品,乃至鱼缸……

此外,LG还将屏幕“平移”应用到汽车上,P2P P-OLED,可以将仪表盘使用的12.3英寸P-OLED和中央屏幕使用的34英寸P-OLED连接在一起,完全代替传统仪表盘。

6.TCL:屏幕又双叒叕变大

TCL作为本届CES中展区最大的中国企业,也展示了在屏幕方面的技术扩展。虽然没有类似的透明屏幕技术,却在原有的98英寸QD Mini LED电视的基础上,继续拓宽电视的边界,推出了全新的115英寸QD Mini LED产品QM891G。

全新产品QM891G也成为了当前尺寸最大的QD Mini LED电视。

如果只将其运用于家居或者商用,那就限制住了该项技术。TCL实验性地推出了42.7寸“超大异形车载一体式显示屏”,不但可以实现8k分辨率,还能实时捕捉驾驶员状态,以减少分心和事故。


3

生成式AI的科技与狠活

生成式AI成为了CES 2024的一大看点。生成式AI+万物=无处不在。

WeHead的另类显示器则将生成式AI拟人化,能够提供类似真人的“面对面”服务,以实现和用户的自发对话。该设备主要通过AI Agent控制3D设备、转动机器人头部、模仿人类交流以增强交互体验。

一直备受瞩目的VR、AR、XR,仍然是CES的重头戏,开始在更多新型场景尝试落地。

索尼推出了一款搭载智能控制环的“空间”VR耳机,包含新的XR头显和手柄设备,专为“空间内容创作”设计,用户可以在虚拟与现实之间自由切换。设备采用 Snapdragon XR2+ Gen 2 平台,搭载4K OLED 微显示器和视频透视功能的XR头戴式显示器。
索尼的首席执行官表示,这款产品专为从事 3D 工作的专业人士打造,可以通过将虚拟对象叠加到物理空间,以扩展创作思维。

TCL实业旗下雷鸟创新推出了第二代双目全彩MicroLED+衍射光波导 AR眼镜雷鸟X2 Lite,作为全球首款搭载第一代骁龙AR1平台的双目全彩AR眼镜,整机仅重约60g。

Solos推出了一款搭载ChatGPT的智能眼镜Solos AirGo3,以实现实时翻译的功能,得以实现跨国界无障碍交流。

Baracoda基于生成式AI,研发了全球首款智能镜子BMind,根据用户的精神面貌提供个性化的修养建议,例如光疗、冥想、自我肯定等,以实现情绪改善,精神感知。

生成式AI的“助手化”趋势也日益增强。如:梅赛德斯-奔驰推出了对话AI虚拟助手;大众汽车紧随其后宣布所有车型搭载ChatGPT;华硕手机加持生成式AI能力以提示语音搜索、壁纸更换;联想新品电脑支持智能助手配文、问答、交互等。

4

汽车与机器人的多种形态

机器人和汽车一直是技术应用的行业前沿领域。此次展览,许多意想不到的公司为汽车领域注入了新的活力。

CES 2024中,小鹏汇天此次参展的陆空一体式飞行汽车,面向未来立体交通而设计。在陆行模式下,机臂、旋翼等飞行系统可完全折叠收纳进车体内;通过折叠变形系统,可以打开机臂切换到飞行模式,在条件允许的环境下实现垂直起降,飞越拥堵、障碍、河流等,满足人们短距离低空出行的需求。此外,陆空一体式飞行汽车还采用了可折叠方向盘、透明仪表盘、驾驶舱透明底盘等前瞻“黑科技”,智能座舱可以在陆行模式与飞行模式之间自由切换。

一直为影音设备出名的索尼,此次在CES 2024中“毫不客气”地展示了智驾实力。

Afeela是索尼注入游戏思维的造车尝试。PS5手柄作方向盘、Epic Games的虚拟引擎5.3支撑超宽仪表显示屏、加入3D地图与本地影音游戏、摄像头。用户既是驾驶者,也是玩家,能够用操作手柄的方式开车,趣味性十足。

宇树科技作为国内的机器人领袖,展示了三款已经备受好评的机器人:消费级机器狗Go2,行业级机器狗B2,以及通用人形机器人H1。

消费级机器狗Go2,再次秀了一把中国实力,其价格设定也更偏向于消费级。现场带的原本仅用于展示的7套Go2,就被观众一天内直接买走了4件。并且,这类机器人可以用于电力巡检、环境探测、抢险救灾等场景。

现场体验过程中,机器狗和机器人的表现也格外引人注目。

RichTech Robots带来了会聊天的机器人咖啡师。接入ChatGPT以后,AI咖啡师不仅能现场制作咖啡,还可以根据识别到的人物身份进行沟通聊天。在和情侣面对面时,它还主动念了情诗。

法国机器人创企Enchanted推出的两款机器人Miroka和Miroki可用于医院和酒店配送、物流任务。

韩国机器人创企WiRobotics推出了一款内置个性化AI教练的超轻量步行辅助可穿戴机器人WIM,称这一设备能减少用户20%的步行能量,帮行动不便的人获得更好的锻炼体验。

CES(国际消费电子展)自1967年6月在纽约首次亮相,至今已57年。作为科技行业含金量满满的风向标,CES 既是一场技术盛会,也是一场研发者与消费者互动的平台。


无论是智能家居还是电子芯片,科技发展已然驶入快车道。占据主流的产品设计,将始终服务于人、思考于人、应用于人。科技无孔不入地为每个家庭提供便利。IPC首席经济学家Shawn DuBravac曾表示:“拥有改变生活想法的人,肯定会找到实现这些想法的方法。

创业者总能找到创新的地方。
路虽远,走在科技前沿、愉快地拥抱未来,一切都值得期待。

谷歌千人被裁引硅谷裁员潮!27家公司宣布裁员,90%大厂码农工作遭AI冲击

过去一年,AI大模型如火如荼的发展,让所有人憧憬着美好未来。

没想到2024年的开启,却是硅谷大裁员!

大厂谷歌却是首当其冲,裁员1000多人,涉及了核心工程、谷歌助理、Pixel手机等硬件团队的人员。

截至2023年9月30日,谷歌拥有18.2万名员工。此次裁员是继2023年开年裁掉12000人之后,最大规模的一次裁员。

同在今天,Meta的Ins团队裁掉60个技术项目经理,Discord裁员17%共170人,皮克斯传言将裁员20%约300人。就连刚刚成立的初创公司Humane都裁掉了10人。

据统计裁员数据网站Layoffs.fyi统计,目前已有27家公司在今年宣布了裁员,总人数达4500+人。

就近2年的情况来看,开年大裁员几乎快发展成了硅谷的惯例了。

去年新年刚过,也是各个大厂领头,大批硅谷程序员喜提「毕业」。

去年谷歌开年直接裁员12000人,今年的数字和去年相比,其实说明行情已经好转很多了。

相比谷歌针对常年做不出成绩部门的人员缩减,反而是像皮克斯,Discord这样的中小企业,因为行业发展收到新技术的冲击,或者整体上进行的控制成本式的裁员,更能说明整个科技行业依然走在下行过程中。

千人「毕业」,谷歌高管也在其中

ChatGPT诞生以来,谷歌便一直以追赶的脚步前进。

Bard、PaLM2、Gemini多模态模型等一系列发布,都在为了弥补与微软OpenAI的差距,这是注定是一场持久战。

在专注AI研发的同时降低支出,科技巨头谷歌也在周三加入了2024年的裁员潮。

三名知情人士表示,谷歌解雇了核心工程部门、谷歌助理——语音操作虚拟助手,以及制造Pixel手机、Fitbit手表和Nest恒温器的硬件部门的员工。

大多数硬件部门裁员,影响到了一个致力于研究增强现实(AR)技术的团队。

具体来说,这次裁员不仅包括普通员工,高管也在其中。

在谷歌向加利福尼亚州提交的文件显示,「本周该州有630名员工被解雇,其中包括4名副总裁和25名董事。据称,这些级别的员工通常年薪数百万美元」。

Fitbit的发言人证实,作为重组的一部分,Fitbit的联合创始人James Park和Eric Friedman也将离开谷歌。

谷歌曾在2019年,以21亿美元向这家智能手表公司提出收购要约。

2021年1月谷歌完成对Fitbit最终收购后,James Park继续担任Fitbit的副总裁兼总经理。随后,他为谷歌发布了Pixel Watch和Pixel Watch 2,最后一次亮相是在去年10月份。

据一名现任员工和一名前员工透露,今年的裁员是由副总裁和人力资源等较低级别的领导人传达的。

谷歌发言人在一份声明中表示:

我们正负责任地投资公司最大的优先事项和未来的重大机遇。在2023年下半年的裁员之后,一些团队正在继续进行这种组织变革,其中包括全球范围部分职位的裁减。

具体裁员人数曝出

谷歌在不同地区裁员人数具体是多少人?

外媒一篇报道,直接挖出了谷歌内部裁员的员工名单,细致到岗位、部门等等。

MountainView、旧金山和Sunnyvale共有702名员工受到影响,其中包括UI设计部的许多员工。

以下是根据提交给州政府的文件,按地点列出的旧金山湾区员工裁员名单:

查尔斯顿路1900、1945、1950、1965和2000:56名员工受到影响,其中包括一名主要产品运营人员、用户体验经理和设计师、产品经理和软件工程师。

1600 Amphitheatre Parkway:177名员工受到影响,包括软件工程总监和产品经理,以及数十名软件工程师和产品经理。

1200、1300、1400和1500 Crittenden Lane:63名员工受到影响,包括软件工程师、用户体验研究员和经理。

2019、2027、2029、2051、2061 Stierlin Court:68名员工受到影响,包括技术项目管理总监、硬件工程经理、电气工程师、机械工程师和技术项目经理。

325 Gladys Ave.:随着公司「停止运营」儿童中心,72名员工将从8月9日起被解雇。所有员工均为儿童保育员或中心教师。

旧金山(裁员时间为3月10日至5月26日)

55 Spear St.:42名员工受到影响,包括用户体验经理、设计师和工程师。

345 Spear St.:26名员工受到影响,其中包括2名产品管理总监、1名软件工程总监和1名软件专业化总监,外加1名销售副总裁。

215 Fremont St.:23名员工受到影响,其中包括1名硬件总监和用户体验总监,以及1名工程副总裁。

One Market St.:14名员工受到影响,其中包括1名产品分析总监和技术撰稿人。

Sunnyvale(裁员从3月10日开始)

1225, 1260 and 154 Crossman Ave.:102名员工受到影响,包括基础设施和数据中心运营总监,以及产品管理和软件工程。

225, 227, and 242 Humboldt Court:69名员工受到影响,其中大部分是软件工程师。

看得出,目前这些裁员名单还只是在加州的员工。

在「一亩三分地」论坛上,有网友表示自己作为谷歌助理团队一员被踩了。

对于裁员的补偿,一名匿名用户解释道:

准确说,不叫裁员,而是「取消岗位」,60天让每个人转组。实际上就等于裁员。

谷歌以「取消岗位」标准裁员,能够减少补偿支出。而这一标准包也比裁员的要差,先给2个月的工资,如果没有找到组的话给14+n weeks,也没有加速vest。

关闭幼儿园,缩减员工福利

这次裁员,还使得谷歌关闭了一个有300个学位,专门为员工提供服务的幼儿园,并解雇73名员工,砍掉了一个对于很多员工来说非常重要的福利。

幼儿园预计于今年8月关闭。失去日托服务可能对公司的在职父母及其招聘工作来说造成不小的影响,加上谷歌去年还削减了一些办公室的其他福利——免费更换硬件产品和办公室免费的零食供应。

在谷歌,CEO劈柴自2022年7月以来一直在推动公司,在全球经济状况恶化的情况下,突出重点减少开支。

2023年1月,谷歌曾裁减了6%的员工,即1.2万人,这是该公司进行的最大规模的裁员。在裁员之前,谷歌共雇用了19.07万名员工,还在全球还有数万名承包商。

自那以来,该公司的高管一直表示,他们将努力大幅降低成本,以专注于生成式人工智能领域。

截至9月30日,谷歌共有18.2万名员工。谷歌称,周三的裁员是正常业务过程中进行的一系列重组的一部分。

然而,代表谷歌母公司Alphabet 1400多名员工的Alphabet工人工会称,此次裁员是「不必要的」。

我们的团队成员每天都在努力工作,为我们的用户打造优秀的产品,公司不能在每个季度赚取数十亿美元的同时继续解雇我们的同事。

一些谷歌员工已经将1月,看作每年一次大规模裁员的「新传统」。

据谷歌透露,随着部门层面做出决定,预计整个1月还会有更多裁员。

Meta裁掉60名Ins技术项目经理

根据美国职场匿名曝料网站Blind曝料,Meta将Instagram的所有技术项目经理(technical program managers)都裁撤了,不过普通的产品经理没有受到影响,裁员人数大约在60人左右。

和谷歌一样,这个裁员的数量相比于去年,几乎可以忽略不计。

Meta在前年底和去年初经历2波史诗级裁员,裁掉了差不多21000名员工,小扎也不得不亲自发视频对裁掉的员工道歉。

而这次的裁员,根据曝料网站的成员来看,更像是因为技术的影响使得团队中的有些角色失去了存在的意义,从而被裁。

不过网友也认为,职场上每个人能否发挥作用和岗位有关,但是人的因素也很重要。

皮克斯裁员:传言整体裁撤20%

根据公司的消息人士表示,皮克斯裁员规模将高达20%,使得1300人的团队在未来几个月内减少到不到1000人。

而根据内部人士的曝料,作为迪士尼的子公司,被裁的很多皮克斯员工其实是属于迪士尼的流媒体部门,属于迪士尼的流媒体控制成本转向盈利计划的一部分。

而同时,因为皮克斯今年会缩减产出作品的数量,也导致了劳动力需求的降低。

值得注意的是,去年底,另一家动画公司梦工厂的联合创始人Jeffrey Katezenberg曾在公开场合表示,因为AI技术的发展,未来3年内动画行业的成本将会降低90%。

预言一出,这翻过年来皮克斯就来了一波20%的裁员,看来在不久的将来,动画制作行业的裁员依然还会继续。

其他公司加入裁员潮

除了以上的硅谷公司,还有一大批公司将在2024年初加入这波裁员潮。

3个月前,发布首款AI硬件AI Pin侧初创公司Humane,从硅谷获得2亿美金的融资,其中还包括Sam Altman

如今,AI Pin还未正式发货,这家由苹果前高管成立的公司宣布裁员4%,共有10人。

其中一位知情人士说,领导层最近告诉员工,今年的预算将会降低。

虽然该公司表示,这是更广泛重组的一部分,但这样的裁员并不能完全给予员工信心,尤其是考虑到公司的主要产品在去年推出后受到的困惑和质疑。

昨天,亚马逊正在裁员旗下Prime Video和亚马逊米高梅工作室(Amazon MGM Studios)的数百名员工。这是亚马逊自2022年11月开始大规模裁员以来,新一轮针对性裁员。

此外,社交软件Discord也宣布裁员17%,将影响到不同部门的170人。

据首席执行官Jason Citron向员工传达的信息,Discord并没有陷入严重的财务困境,尽管它尚未实现盈利。

Discord总共筹集了约10亿美元的资金。自从2021年拒绝了微软120亿美元的收购要约后,该公司就一直在考虑上市。

据一位熟悉内情的人士透露,该公司的资产负债表上有超过7亿美元的现金,目标是在今年实现盈利。

科技行业劳动力需求缩减,和AI有多大关系?

我们曾经报道过,在Blind和Motherboard最近组织的一项针对程序员的调查显示,90%的程序员认为现在找工作变得更难了。

而其中最主要的因素是由于,AI在代码能力上的突飞猛进,让科技公司对于初级程序员的需求有了明显的下降。

再叠加经济周期下行的因素,使得一直以来供不应求的程序员都出现了饱和。

曾任哈佛大学计算机科学教授、现为企业家的Matt Welsh向该杂志透露,由于AI能够很大程度上执行软件工程的工作,这可能导致软件行业除了最优秀的人才之外,大多数人的工作保障和薪资水平都会下降。

但是,人工智能编码平台Replit的CEO表示,这AI带来的变化对于程序员来说不一定是坏事,可能只是改变了程序员具体的工作内容,但是世界依然需要程序员。

可能不是在不久的将来——「编码」这个词将从词典中消失,因为编程将不再需要代码,而是使用计算机解决问题的纯粹行为,使越来越多的人能够使用计算机。

Replit只是触及了这项新技术的冰山一角。我认为ChatGPT将其提升到了另一个水平。我们现在正处于开发人员生产力另一次大幅跃升的开端。我认为生产力将会提高 10 倍到 100 倍。

世界上的程序员确实依然不够,他们非常昂贵。我们的编程效率越高,我们能够创建的软件就越多。人工智能助手可以帮助您调试代码,可以帮助您改进代码并重构代码,这将使软件开发生命周期的各个方面变得更好。在可访问性方面,我认为这将使人们更容易使用软件。

你会看到产品和前端工程师能够完成后端或全栈工程师过去可能做的很多工作。我认为这会给双方带来压力,这可能会影响软件工程师的就业,他们必须专业化。否则他们将不得不要么去构建产品,要么成为低级平台工程师。

他表示,拥有编码知识仍然是一项很好的技能,因为人工智能将有助于加快编程过程并打破进入计算机科学和行业的一些障碍。
随着人工智能融入编码,软件工程师的价值将更多地体现在构建新事物以及监督和管理代码的能力,而不仅仅是编写代码。
尽管进行了裁员等各种举措,当今世界仍然有很多软件职位空缺。硅谷一直在「囤积」有才华的员工。
但是不管怎样,编码工作可能很快会发生翻天覆地的变化,就像C++编码与汇编语言编码完全不同一样。
当计算机开始反过来和人交流时,这将对那些以编码为生的人产生巨大的影响。

大模型的商业价值来自AI原生应用体验的质变

当下要想让大模型性能继续提升,关键要素是什么?

在MEET2024智能未来大会现场,百度AI技术生态总经理马艳军以文心一言为例,全面介绍了知识增强大语言模型,还介绍了围绕大模型建设的生态以及未来发展趋势。

在他看来,大模型给应用体验带来了质的飞跃,应用体验只要提升了,未来肯定会有更大的商业价值。

据了解,百度还围绕着文心一言的基础模型文心大模型以及飞桨深度学习平台做出了一系列技术创新与产业实践。

在技术的不断变迁中,马艳军总结了大模型与此前AI技术的三大不同点:

一是颠覆了交互方式;二是大幅降低了AI开发门槛;三是大模型会催生AI原生应用

量子位在不改变原意的基础上,对演讲内容进行了编辑整理。

关于MEET智能未来大会:MEET大会是由量子位主办的智能科技领域顶级商业峰会,致力于探讨前沿科技技术的落地与行业应用。今年共有数十家主流媒体及直播平台报道直播了MEET2024大会,吸引了超过300万行业用户线上参会,全网总曝光量累积超过2000万。

演讲要点

  • 人工智能的关键基础能力是理解、生成、逻辑和记忆。大模型恰恰因为这几种能力强,所以人们对其关注度才如此之高,并认为是通向通用人工智能的曙光。
  • 大模型发展,如何使用数据,如何挖掘、分析、合成、标注、评估数据,整个闭环非常关键。
  • 大模型给应用体验带来了质的飞跃,应用体验只要提升了,未来肯定会有更大的商业价值。
  • 要想大模型效果更快提升,训练效率特别关键,软硬件协同优化非常重要。

(以下为演讲分享全文)

大模型技术越发标准化

今天跟大家的分享,将以文心一言为例,探讨知识增强大语言模型的技术创新与产业实践。

我先对文心一言做一个比较全面的介绍,然后介绍围绕着文心一言建设的整个大模型生态,以及未来会有什么样的发展趋势。

现在我们提到人工智能的应用,大家可能会想到很多词。有几个比较关键的基础能力:

理解、生成、逻辑和记忆。

一般来讲一个人工智能应用一般是这四个能力中一个或者几个的组合运用,最终形成好的人工智能应用。

大语言模型也恰恰是因为这几个方面的能力比较强,所以现在大家对它的关注度非常高,并且认为是有可能通向人工智能的曙光。

文心一言的建设,大家的关注度也非常高,首先是在底层有一个大的预训练模型,这块也是一个非常大的技术挑战。

现在随着大语言模型技术发展,实现方式也越来越标准化了,有监督的精调技术、基于人类反馈的强化学习、提示等等,这些是大家认为相对标准的一套技术。

在此基础之上,文心一言为了更好地提升回复的客观性以及时效性等一系列能力,百度专门在知识图谱注入、检索能力的引入、对话的连贯性等方面做了非常多的工作,让大家在使用的时候得到更好的体验。

文心大模型是文心一言背后的基础模型。我们2019年3月份发布了1.0版本,到今年10月份已经发展到4.0版本了。

大家如果有在使用文心一言,其中专业版背后的模型就是文心4.0。大家可能会感知到,随着4.0的上线,整个使用体验有了非常大幅的提升。它的理解能力、生成能力、逻辑能力、记忆能力,方方面面都有非常大的变化。

数据和对齐,前所未有的关键

研发期间,我们背后付出的努力还是非常大的。

首先依赖在底层资源上的巨大投入,需要在非常大的计算集群上做预训练模型的训练,基于大量的数据做训练学习。

另外,在算力之上,大家或许也都了解到,现在大模型的技术还是深度学习技术进一步发展的结果,其底层依然依赖深度学习框架和平台。

百度飞桨为大模型的训练提供了基础支撑,并且跟大规模计算集群进行联合优化、有机整合,把整个训练效率提了上来。

训练大模型,一方面是效果。要想得到好的效果,要想快点学好,训练效率特别关键,所以软硬件协同优化就显得非常重要

不可回避的,数据是大模型训练过程中必不可缺的一环。随着大模型的发展,数据本身的质量重要度越来越高,如何使用数据,如何挖掘分析、合成、标注、评估数据,整个闭环其实非常关键。

应该说人工智能发展这么多年,以前我们也说数据重要,尤其随着深度学习的发展,大家都会说数据特别重要,需要数据、算法、算力三驾马车。

但是前所未有的,数据从未像在大模型时间点上显得如此重要,不管是质量还是整个加工闭环,都成了整个大模型训练学习当中非常关键的一环。

还有对齐,大模型技术发展对对齐技术要求非常高,为什么这么讲?

“对齐”这个术语也是因为大模型的发展被广泛知晓。背后核心还是要让大模型学会按照人类希望的内容和方式进行回复。

如何让大模型有效地跟人的要求做好对齐?这背后其实有非常多的技术需要建设。

再有,针对这么大的模型,如何在训练过程中训到一定阶段之后,完成增量式的参数调优,节省训练资源和时间,加快模型迭代速度?

所有这些技术都是在大模型研发过程中我们需要突破的。

当然文心一言面向社会开放以来,得到了非常广泛的关注,现在的用户规模已经不止七千万(截至2023年底,文心一言用户规模已破亿)。大家如果是自己使用过文心一言,相信也一定能感受到这一年当中的快速进步。

应该说大模型发展,尤其是大语言模型的发展给我们创造了一些新的机会。

大模型带来的变化

那大模型跟以前一波一波的技术变化有什么区别呢?我觉得有这几个方面:

第一个是交互方式,这次真正有了一个颠覆式的变化。

以前我们也有对话系统也可以做人机对话,对话效果往往差强人意。你说它能不能回复呢?它也能回复得还可以,但总是距离我们的预期有差距。一旦达不到临界点,其实非常影响技术的普及。大模型技术的发展,尤其是大语言模型让普及加速。

另外降低了开发门槛

以前我们开发AI程序需要写非常多代码,写一个AI应用也需要非常多的代码,成本也非常高,大语言模型大幅降低了开发门槛。

三是大模型会催生AI原生应用。不仅是对产业应用有影响,其实对于科研,现在出现的AI for Science的趋势,也产生了非常大的影响。

所以在此驱使下,AI原生应用发展正迎来最好的时代,以大模型插件接入为基础,在此基础上进一步衍生出更强大的工具,基于这些能力必然会催生大量的AI原生应用。数字技术和实体世界加速连接与融合。

在百度大量产品当中,已经快速地在使用大语言模型来重构产品,整个产品使用体验也在快速地提升。

大家可以看一下,在办公场景、在程序员写代码的场景,大量的人工智能技术都可以使用起来。

比如说,一项最新的数据是,百度20%的代码都是由大模型,我们对应的工具叫Comate来实现的。

我们相信在未来的软件开发中,比较大比例的代码是由大模型帮我们实现的。

除了代码,像文档的分析等都能非常自然完成,大家可以感受到用了大模型之后,写作、做材料、做PPT效率会有非常大的提升,这是跟以前的技术很不一样的。

当然在商业分析决策等方面,借助大模型的交互能力也一样可以处理更加复杂的数据分析和任务处理。还有在百度网盘里面,可以用大模型唤醒历史上沉睡的大量的积累的图片、文档、各种各样的信息。

出行场景可以用智能助手能力更快帮我们实现交互,这些其实都是大模型所带来的产品体验方面质的飞跃。

应用体验只要提升了,未来肯定会带来更大的商业价值。

大模型对基础软硬件要求「极致」

大模型本身研发我前面也介绍了不少,确实是研发门槛比较高。

过去几年,一个企业研发的参数规模上亿的模型已经非常大了,成本很高。现在这几年发展不可同日而语,百亿参数规模大家都有点开始倾向于叫小模型了

整体来讲,它的研发成本依然是比较高的。模型体积、算力要求、数据要求都非常大,对基础软硬件的考验也非常大。必须得在基础软硬件这一层有非常强的支撑,才能真正把一个优秀的、效果好的大模型高效地训练出来。

对于基础软硬件的要求也是前所未有的高。

应该说,以前很多人工智能应用开发非常依赖基础软件,但是对它的要求没有那么极致,相对来讲算力规模没有那么大,整体数据量没那么大。

现在大模型很不一样,我们建设百度飞桨深度学习平台,是开源开放的平台,有非常多开发者都在使用,用基础软件来支撑现在大模型的整个开发训练,以及未来在大量应用当中的部署。

飞桨和文心通过联合优化,平台有效的训练时间做到98%,这是非常高的。

对于了解大模型训练特点的人而言,这么大的集群规模,98%的训练时间都是有效的,这是非常难的。另外整个推理性能也有非常大的提升。

当然了,我们在建设过程当中也非常期待跟生态伙伴一起推进,所以我们建设了星河社区,提供异构算力,提供一系列的包括飞桨和文心的基础能力,形成一站式综合服务的平台,让开发者能够在这个平台上进行交流、互相促进。

从整个生态来讲,飞桨和文心平台有1070万开发者(截至2023年底),整体来说和各类生态伙伴都有全面合作,包括芯片的合作伙伴、数据和技术的合作伙伴等等。

百度希望携手生态伙伴通力合作共创共赢,能够把大模型的技术能力更好地赋能千行百业的技术应用。

在12月28日举办的第十届WAVE SUMMIT深度学习开发者大会上,百度最新发布飞桨开源框架2.6版本和大模型重构的开发工具链,包括全新发布Comate AutoWork,飞桨低代码开发工具PaddleX v2.2,升级面向生态的文心一言开发机制,打造更智能、高效、低门槛的AI原生应用开发新范式,助力开发者把握大模型时代红利。