重新构想室内设计,探寻Wayfair 生成式人工智能解决方案

在线家具零售商Wayfair最近宣布推出Decorify,这是一种新颖的生成式人工智能解决方案,可以重新构想整个室内设计流程。这是一个典型的用生成式人工智能来提供居家装修方案的典型案例,由此我们也把这篇内容归类到#万有AI 系列之中。

从推出开始,该产品将在试点计划中推出,用户只需上传自己空间的图片即可想象自己不同风格的家。使用上传的图像作为启动提示,Decorify 会生成多个室内设计选项,同时提供进行相关购买的直接链接。他们也起了一个口号,叫Meet Decorify™, your shoppable AI interior designer.翻译一下,就是“遇见 Decorify™,你买得起的AI室内设计师。”具体是怎样一种表现呢,也正如下方gif图片所示。

Wayfair 首席技术官 Fiona Tan 表示:“我们为客户开发或部署的任何东西……都必须支持我们的使命,即帮助任何地方的每个人营造家的感觉。” 
通过这种务实的视角来看待生成式人工智能,能够确定部署开发资源的地点和时间的优先顺序,并确保像 Decorify 这样的应用程序让客户满意。Wayfair 已经在客户服务和营销等关键业务领域使用生成式人工智能。

Decorify 的设计之旅是如何进行的?

通过可通过移动设备和桌面设备使用的 Decorify,Wayfair 为用户提供了开源扩散模型的访问权限,购物者只需上传其空间图片并选择他们想要的家居风格语言即可开始他们的设计之旅(例如中世纪现代风格或波西米亚风格)。使用输入,该模型可以在几秒钟内为该空间生成多个设计选项,使用户能够探索并关注与他们的风格相匹配的外观和感觉。

一旦用户选择了一种风格,他们就可以点击该设计中的各个元素,并获得直接从 Wayfair 购买类似商品的链接。这些产品建议是由根据公司产品目录训练的计算机视觉模型生成的。Wayfair 的研发总监 Shrenik Sadalgi 表示,Wayfair 使用建筑限制,因此设计输出看起来像购物者的空间,以提供一种熟悉感,但同时风格完全不同。Sadalgi 指出,整个生成过程是迭代的,公司会随着时间的推移不断微调提示和模型。它在输入和输出上放置了 NSFW(“工作不安全”)过滤器,以防止模型产生幻觉并生成不适当的内容。然而,它们似乎仍然可能包含一些小的幻觉,这些幻觉可能是整体设计的一部分。通过 Decorify(和图像生成),我们意识到图像和设计可以是完美的,也可以是不真实的或无意的,但它们的目的是激发灵感。Sadalgi 强调,“我们对 Decorify 的思考方式是,如果您尝试使用 Wayfair 目录中的数百万种产品创建一个潜在空间,您可能会得到与开源扩散模型的潜在空间大小相似的东西。该理论认为,生成的输出与我们目录中的一组产品之间始终存在一些相似性映射,即使设计输出并不完美,尝试映射它也可以为客户提供价值。”

也就是说,这只是 Wayfair 实施面向客户的人工智能的第一个版本。当客户使用 Decorify 发现新设计(甚至是带有小幻觉的设计)时,该公司将继续利用其专有的品牌数据改进扩散模型。 这将使该公司能够生产出更接近客户在 Wayfair 及其独家品牌上体验的鼓舞人心的图像的设计。“你可以想象设计如何包含更多一对一匹配的 Wayfair 产品,甚至让客户首先从产品列表开始,然后用他们空间中的产品进行设计,”他补充道。

生成式人工智能并非首次实施

虽然 Decorify 目前可供美国所有购物者使用,但这并不是家具零售商首次实施生成式人工智能。 在Transform 2023上,Wayfair 定价和营销科学主管 Wilko Schulz-Mahlendorf 表示,该公司正在为其销售和服务团队使用 gen AI,但在循环中进行人工监督。他强调的常见用例是内容生成、文本摘要、产品推荐以及向代理提供最佳操作建议。“我们拥抱新技术,就像之前的人工智能浪潮和其他新兴技术(计算机视觉、3D、AR/VR 和空间计算等方面的进步)一样,我们正在积极尝试并采用生成式人工智能组织相关部分的能力,例如为营销团队和客户服务代理创建工具,”萨达尔吉说。 他指出,他们成立了一个工作组,帮助实现技术及其工具、技术和学习的民主化,以便每个团队都有权采用技术能力来推动他们的路线图。”

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

我国超六成游戏企业应用AI AIGC决定下一个超级入口

作者/  IT时报记者   林斐

编辑/  孙妍

AIGC(生成式人工智能)正深刻地影响着游戏产业未来发展格局。AI会替代人类设计游戏吗?AIGC新浪潮为游戏行业提速了吗?

我国超60%游戏企业应用了游戏AI技术,游戏是受技术创新驱动的产业。”在第二十届中国国际数字娱乐产业大会(CDEC)高峰论坛上,十三届全国政协委员、中国音像与数字出版协会理事长孙寿山透露。 

AIGC为游戏生产提速90%

AIGC已经在游戏行业中得以广泛应用。从内容创作、生产方式到体验场景等都在不断在AIGC的推动下优化升级,AIGC正在驱动游戏产业变革。

“目前在网易,语音生成、原画生成、视频动捕、模型生成等多个关键生产环节,人工智能带来的工作效率提升,可以达到90%。”据网易公司高级副总裁王怡透露,在2017年,网易游戏已经完成了对AI的早期布局,建立起网易伏羲、网易互娱AI Lab等多个研究院、实验室,致力于研发多项人工智能技术,并在游戏工业化全流程中跑通。

不只是网易一家感受到效率的大幅提升。

完美世界联席CEO兼总裁、完美世界游戏CEO鲁晓寅说:“两三年前完美世界就已经开始把游戏开发管线推向智能化。在使用AIGC之前,我们某个项目的进度是一年时间不到10%,但在用了这套AI技术工具之后,两个月超50%的进度已经做完。

在鲁晓寅看来,AIGC极大地提升了游戏的策划、音频、美术、程序等环节的生产力,压缩了游戏整体项目的研发周期,也大幅降低游戏制作成本,对游戏行业是个颠覆性的变革。一方面AI可以应用于游戏内容中,用AI让NPC“活”起来,通过对NPC表情、声音、对话等的训练,可以让玩家自定义声音、背景音乐等,在不同情绪、不同环境等状态下跟玩家进行对话。另一方面可以优化生产环节,比如策划文案和程序基本脚本,都可以使用AIGC工具大大加速工作效率。

目前完美世界已将AI技术应用于研发管线的多个环节中,如智能NPC、场景建模、AI绘画、AI剧情、AI配音等,也正在尝试AI融合驱动的完整形态案例——复合应用AI in Game Play,包括场景信息、角色信息、情节发展、玩家行为、对话等均由AI演算。将AI融入游戏玩法中,为不同玩家提供不同的感官及游戏体验。

AI替代潮冲击游戏业

AIGC在游戏领域的应用,是否会取代人类员工,是否会造成产品同质化问题?业内人士和行业专家表达了担忧,北京酷斯塔夫文化发展有限公司董事长宋柯表示,AIGC对于音乐产业发展的冲击比MP3时代更大,它对整个音乐生产制作都产生了深刻的影响,应当投入更多资源保护有才之士。

但Unity中国总裁张俊波的态度较为乐观,他认为创新是游戏的核心竞争力,运用AI生成制作,虽然能够降低美术原画成本,但也有可能造成游戏策划的相似性和资产的同质化,因而游戏开发者需要在玩法上投入更多资源和注意力,做更多游戏玩法方面的创新。

ChatGPT无疑是全球AIGC领域最亮眼的明星,微软慧眼识珠率先与OpenAI这一明星公司合作,抢得先发优势。微软大中华区Azure事业部总经理陶然表示,游戏开发创作是人类主导的创意行为。AI、AIGC、大语言模型以AI“创作副驾”的角色辅助人类,帮助人类加速游戏开发、游戏创作、游戏运营,甚至新玩家的获取。但是AI永远不会替代游戏创作者和开发者进行游戏开发和创作,人类一直是主导,而且永远是主导。

“这也就是为什么过去半年之内微软发布了很多CoPilot智能副驾产品,帮助所有业界同行一起用AI加速创作,而非被AI替代创作,这是基本原则。”陶然说道,“在AIGC、大语言模型出来之前,大部分时候游戏开发者、发行、工作室都得在成本、质量、速度中选两个进行侧重,很难全部兼顾,因为技术所限、成本所限、资源所限。但AIGC出来后,尤其是OpenAI的GPT3.5、GPT4.0出来以后,这件事情变成现实,真的可以帮助所有工作室、开发者、发行商高效、低成本、快速地进行新游戏的迭代、研发、运维。”

游戏+AIGC的化学反应已外溢

从AlphaGo打败围棋神话,到OpenAI用《我的世界》等游戏训练,推出ChatGPT,游戏一直是AI的最佳“陪练”。到今天,这种“单向赋能”,已经走向了“双向奔赴”,人工智能开始越来越多地深入游戏产业的全环节。

其实游戏行业引入AIGC后,起到的化学反应不再仅仅局限于游戏行业。腾讯互动娱乐副总裁张巍也表示,经过复杂游戏训练后的人工智能,将有望掌握更广泛的技巧和知识,帮助人们解决医疗、交通、工业等现实生活中的问题。随着外溢效应的释放和积累,游戏技术正在成为数实融合的重要工具箱和推进器。

AIGC将决定下一代超级入口。

“属于下一代开发者的时代即将到来,大模型将成为AI新时代的基础架构,插件(Plugins)则会构成AI时代的API接口层。AI时代的数字原生也将涉及文本生成、图像生成、代码生成、语义检索与总结、普惠定制化服务以及提供情绪价值等诸多场景。”微软大中华区副总裁、微软大中华区数字原生事业部总经理田灼描绘了AIGC的应用前景。

今年7月,网易伏羲推出了国内首台无人装载机,通过数字挛生、大数据等技术能力,实现了识别环境、制定动线、作业监控等生产全流程的无人作业。现在,这台无人装载机已经开进了沪通铁路上的智能混凝土搅拌站,正在24小时不间断作业。到今年年底,随着无人装载机的批量交付,建筑师傅们将告别这一危险作业环境。

在河南,网易的沉浸式活动平台“瑶台”,协助当地文旅打造了包括大宋东京城、黄帝故里、老君山在内的19个文旅元宇宙场景,这一项目即将上线。

在我国,每位飞行员的职业生涯内,都需要在模拟机上完成超过1000个小时的飞行训练。腾讯与南航在今年6月推出了我国首个完全自研的全动飞行模拟机视景系统。该系统是基于腾讯自研游戏引擎,以及南航虚像显示技术等共同打造,首次实现全局动态光照,为飞行员重建一个和物理世界几乎相同的拟真世界,能为超过8万的民航飞行员提供更高效、更安全的飞行训练。

“不仅如此,通过游戏PCG与AIGC技术,半天可以完成一座大型城市的全景建模,三天即可高精度复原一座机场,使数字资产制作效率提升10倍以上。在尖端装备领域的突破中,我们看到了游戏科技作为数字生产力的巨大价值和可能性。”张巍说道。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

AI会比人类更懂宇宙吗

凭借快速准确处理、分析和模拟大量数据的能力,AI可以帮助科学家识别并检测出人类可能无法立即理解的数据,进而做出预测,有望彻底改变我们对宇宙的理解。

吴家骥

西安电子科技大学电子工程学院教授

近日,埃隆·马斯克官宣成立人工智能(AI)公司xAI,其首要目的是试图理解宇宙,专注于回答深层次的科学问题。

茫茫宇宙,未知似乎永远大于已知。那么,AI能够帮人类理解宇宙吗?让AI帮助人类理解宇宙,有哪些技术路线?未来,AI和人类又将如何发挥各自优势,让人类的科学探索之路更加顺畅?

可像生物一样自我学习自我“进化”

“从原子核到宇宙诞生,这些都属于宇宙本质的范畴。马斯克宣布成立xAI的目标是要理解宇宙本质,因此他所期望做出的AI一定要比所有其他AI竞品具有更深刻、更底层的智慧境界。”近日,西安电子科技大学电子工程学院教授吴家骥接受科技日报记者采访时说。

在马斯克看来,这个竞品很大程度上就是ChatGPT等生成式AI。很多生成式AI都能够回答人类提出的问题,那么它们与马斯克所设想的能理解宇宙的AI在技术原理上有何不同?

吴家骥解释道,生成式AI主要通过学习和提取样本中的规律进而生成新的数据,它更侧重于预测和生成自然语言,在文本或图像等领域的应用较为广泛,但深度和广度相对有限。而能够理解宇宙的AI不仅要能生成新的数据,更要关注如何深入理解和解析宇宙中的各种信息、事物的发展规律以及事物的完整结构,其深度和广度相对来说也更深更大。这就需要AI具备更强的智能水平和泛化能力,以及更高的认知和“想象力”水平。

但是AI并不具备思维能力,不具备思维能力的AI又怎么能深入理解各种问题并帮助人类探寻事物发展规律呢?

“人们之所以认为AI不具备思维能力,是因为以往的AI都是依赖大量已有数据训练出来的,无法突破在训练数据基础上构建的知识边界。但马斯克设想的AI可能将使用组合式递归神经网络(RCNN),它能让AI做到像生物一样自我学习、不断‘进化’,进而涌现出不可预知的自我启发能力,甚至是解决未知问题的能力。”吴家骥说。

那么,让AI拥有这些能力需满足什么条件?吴家骥认为,这需要有大量的数据、完善的算法和强大的算力及存储能力的支持。数据是AI的“饲料”,AI需要数据才能进行深度学习;具备自主性和适应性的算法是AI深度理解和解析宇宙中各种复杂信息和规律的关键;强大的计算和存储能力则是AI的“后勤保障”,是AI发挥其应有能力的底座。有了这些条件,才能初步构建出能够理解宇宙的AI。
训练能理解宇宙的AI有两条技术路线

宇宙浩瀚而复杂。为了理解宇宙的本质,科学家需要分析来自望远镜、卫星和其他观测仪器的大规模数据,而分析处理数据正是AI的强项。

“凭借快速准确处理、分析和模拟大量数据的能力,AI可以帮助科学家识别并检测出人类可能无法立即理解的数据,进而做出预测,有望彻底改变我们对宇宙的理解。同时,考虑到宇宙中存在大量不可观测的暗物质,因此科学家可能需要利用具备一定启发学习和创造能力的AI开展假设性思想实验。”吴家骥表示。

比如,天文学家们试图构建宇宙模型来解释宇宙的起源、演化和结构,然而目前囿于算力,各类宇宙模型都只能用有限的特征来描述它,这对于庞大的宇宙来说并不准确。吴家骥指出,如果利用AI for Science(即人工智能驱动的科学研究)的思路,通过结合已有的天文观测数据和人工智能技术,就有可能探索出新的宇宙模型。这种模型具有非常好的表征能力和泛化能力,可以在没有大量数据标记的情况下进行自我学习和进化。

那么,训练出能理解宇宙的AI有哪些技术路线呢?

吴家骥表示,具身智能和脑智能是两种较有潜力的技术路线。具身智能是一种综合的智能体,它能够像人类一样主动与现实或虚拟环境交互并从中学习,而非仅在预先准备好的数据中学习。具身智能将会具备更强的逻辑推理能力,降低AI不受控制地输出人类不想要的内容的可能,更加精确地解释和模拟现实世界。但是这种技术路线的实现需要大量的虚实数据和计算资源,并且模型的训练和测试速度较慢。

脑智能是通过模拟人脑的神经网络结构和功能,构建出来的数字版“人脑”。它可以让大模型具备类似于人类的感知、认知和决策能力,但是这种技术路线需要解决很多复杂的生物学和神经科学问题,并且模型的构建和训练也需要大量的计算资源,目前还在探索之中。
实现“AI理解宇宙”的目标尚面临诸多困难

“目前,计算机模拟技术是天文学家理解宇宙的重要途径。然而,仅通过使用计算机模拟一个演变了130多亿年的宇宙是非常困难的,因为有无数的变量需要考虑。同理,若想实现‘AI理解宇宙’这个目标,所需要的算力可能也会大到不可想象。”远望智库人工智能事业部部长、图灵机器人首席战略官谭茗洲指出。

谭茗洲说,除了算力的困难外,如果过度依靠观测数据或仿真数据训练AI,也有可能会导致我们对宇宙的理解出现偏差。与任何科学工具一样,将AI与其他方法结合使用以确保结果的准确性非常重要。

在AI理解宇宙的过程中,必定离不开人类的参与。而在有人的地方,就必须确保AI的行为符合人类社会的道德、伦理和法律要求,以保障人类的基本权利和尊严。

谭茗洲强调,我们有必要基于人类社会为AI理解宇宙制订一套道德伦理准则和相应的法律、监管措施,确保AI的行为符合人类的价值观和道德原则。同时,也要研究面向新社会形态的隐私和数据保护技术,以及用于提高模型算法透明度和可解释性的技术。

若AI能理解宇宙,又是否意味着它超越了人类?谭茗洲指出,如果AI能够真正地理解宇宙,它可能确实会在诸如数据存储、数据挖掘等方面超越人类,但也仅仅是这些方面。这是因为AI具备处理和分析大量数据的天然优势,而在创造力、情感体验、感知决策等方面,其与人类还存在较大差距。人类和AI可以相互取长补短,共同发挥各自的优势,最终实现人类社会的可持续发展。

来源:科技日报

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

AI模特“试衣”走红倒逼监管升级

来源:光明网

据报道,当前不少电商采用AI代真人模特,试穿服装展示商品,还有一些店铺开始提供AI模特图制作服务,如“AI绘图模特生成”“假人换真人模特”等,引发关注和热议。


五官精致、身材完美、四肢纤细,模特着装效果堪称完美,但下单到货后明显货不对版,买家秀与卖家秀,一个天上一个地下。这种尴尬,可能不是买家身材惹的祸。这些商家采用AI模特试穿服装展示商品,试穿服装的模特不是真人,而是人工智能生成的,效果图也是技术反复优化的产物,不具备真实参考性。


毫无疑问,这种“科技狠活”缔造的效果图,再精美也只能欣赏欣赏,不能构成下单与否的参考。可是,消费者通过电商渠道购物,不是来看美图的,而是要通过模特试衣的效果图,评估商品的颜色、款式、尺寸、搭配等,是否符合本人的需要。AI模特试衣的效果图,把真实细节遮蔽了,看似完美,实则是诱导消费者消费,往严重了说,还涉嫌虚假宣传,应当引起足够的重视。


近几年,人工智能等新一代信息技术飞速发展,新技术与传统行业也在不断融合,形成不少新兴的创新业态和应用场景。应当看到,技术的发展是大势所趋,关键是要引导新技术新业态规范发展,形成有助于行业良性发展的健康生态,降低行业成本,提高社会公共福祉。


AI模特试衣的走红,反映了人工智能技术在这一场景中有市场需求。模特试衣是电商商家的刚需,但也成为电商商家的成本。资料显示,有商家采用AI模特取代真人模特后,当月就节约了模特、摄影师等工作人员费用及场地租用费用共4万余元。对于一些小微电商来说,AI模特提供了一种成本低廉的替代方案。


不过,AI模特试衣带来的问题更不容忽视。首先,最直接的,就是现阶段AI模特试衣效果图的真实性、准确性无法保证,不能起到为消费者提供参考的作用。这反映出现阶段技术和算法还存在不小差距,难以达到与真人模特试衣相同或相近的效果。如果后续随着技术的进展,AI模特能够通过算法构建与真人模特试衣近似的效果,那这一模式才能开辟向前发展的进路。


其次,AI模特试衣必须在互联网法治的轨道上运行。从本质上来说,AI模特试衣是一种互联网信息的深度合成,应当遵循现有的《互联网信息服务深度合成管理规定》。例如,该规定明确,“深度合成服务提供者提供人脸生成、人脸替换、人脸操控、姿态操控等人物图像、视频生成或者显著改变个人身份特征的编辑服务,可能导致公众混淆或者误认的,应当在生成或者编辑的信息内容的合理位置、区域进行显著标识,向公众提示深度合成情况。”但据调查显示,当前AI模特试衣普遍没有按规定进行标识,这也导致不少消费者受到误导。


此外,AI模特试衣还应规避侵犯他人肖像权的法律风险。一些AI数据库中包含着海量人脸数据,有些数据甚至本身就是通过非法途径搜集,在AI模特图生成中要防止侵犯他人肖像权。长远来看,AI模特试衣服务提供者或可走与真人模特合作的路径,在获得真人模特授权的基础上,利用真人模特的个人生物信息进行图像编辑和创作。
新技术在与传统业态的融合过程中,往往会触及传统监管方式的边界,在这里老办法不管用,而新办法还没有成型,迫切需要监管方式的与时俱进与优化创新。AI模特试衣引发的争论,正是这一时代背景下的新课题。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

福布斯:垂直 AI 是生成式 AI 领域的下一轮革命

图片来源:由无界 AI工具生成

生成式人工智能(AI)的出现引发了各行各业极大兴趣。这项强大的技术有可能彻底改变我们的工作方式,创造新的可能性,并改变各个领域。

本文将探讨什么是生成式人工智能、如何运作、日益增长的势头以及特定行业人工智能(也称为垂直人工智能——Vertical AI)的预期影响。此外,本文还将讨论在现代商业环境中不采用生成式人工智能的后果。

01 什么是生成式人工智能及其工作原理?

生成式人工智能是指人工智能技术的应用,它允许机器自主创造、生成和生产新内容。与依赖现有数据进行分析和决策的传统人工智能系统不同,生成式人工智能利用先进的深度学习模型从现有数据中学习,并以可理解的格式生成原始、现实的输出。

该技术技术通过在大量数据上训练一个模型来捕捉模式、风格和相关性。经过训练后,生成式人工智能模型可以通过从学到的知识中推断生成新的内容,从而使其能够创建原始且通常高度真实的输出。

生成式人工智能因其在简化工作流程、自动化创意流程和释放新机遇方面的潜力而在各个领域获得发展势头。从艺术和娱乐到医疗保健和制造业,各行各业正在认识到其变革能力。

很明显,生成式人工智能正在成为一种商品。然而,并非所有生成式人工智能都是相同的,它预计会分为两个不同的类别:通用和垂直。

ChatGPT 和 Google Bard 等通用人工智能模型正变得越来越普遍——由于其通用功能而在各个行业中找到应用。另一方面,垂直人工智能模型的设计更加专业化,将为特定行业量身定制,并提供显著和更直接的投资回报。

02 对垂直人工智能模型的需求日益增长

通用和垂直人工智能模型之间的区别凸显了对特定行业解决方案日益增长的需求,因为企业寻求利用人工智能的力量来优化其运营并释放新的增长机会。

大多数公司需要一个模型,将其大量的行业数据和专业知识整合并转换为有意义的输出,从而提供有针对性的解决方案,以满足特定行业的需求。这些模型需要专门针对其服务的特定行业或用例而设计的专用算法。

例如,在现场服务中,垂直解决方案正在通过解决客户期望上升、劳动力短缺和设备复杂性等行业挑战,改变服务运营。通过利用旨在解决特定服务用例的人工智能,这些解决方案可以帮助组织比以往更快的速度去诊断和解决问题,提供更多自助服务选项,优化资源分配以克服劳动力短缺问题,并实现主动维护以最大限度地减少停机时间。这可以提高运营效率并提高客户满意度,从而为组织提供可持续增长和竞争优势。

麦肯锡的一项研究指出,“在一家拥有 5000 名客户服务代理的公司中,生成式人工智能的应用使每小时的问题解决率提高了 14%,并将处理问题所花费的时间减少了 9%。它还减少了代理人的流失,并将与经理通话的请求减少了25%。” 最终,该报告证实,这些好处很大程度上是由于“人工智能帮助经验不足的代理人使用与技能较高的同行类似的技术进行沟通”。

垂直人工智能的另一个重要区别在于能够将主题专业知识纳入模型中。我们的内部数据显示,在领先的服务组织中,有三分之一的服务解决方案在历史服务数据中无法找到。相反,任何问题的最佳答案都可以在主题专家提供的数据中找到,这强调了将人类专业知识纳入数据集的重要性。

一些垂直人工智能解决方案具有将专家知识数据化的能力,这意味着它们可以将公司专家头脑中存储的知识转换为合成数据。通过利用主题专家的知识,人工智能模型可以实现更加个性化和可靠的结果。

03 企业如何整合垂直人工智能战略

对企业来说,纳入垂直人工智能战略可能是一次变革之旅。以下是开始这一旅程的三个步骤:

1. 确定相关垂直领域和用例。对业务流程、客户需求和市场趋势进行全面分析,以确定人工智能可以带来价值的领域。在这些垂直领域中寻找人工智能技术可以提高效率、加强决策或创造新机遇的具体用例。例如,如果你在服务行业,你可以考虑将人工智能应用于设备诊断和故障排除、知识管理或劳动力管理。

2. 培养内部专业知识。制定垂直人工智能战略,需要在人工智能技术及其在所选垂直领域的应用方面建立内部专业知识。这可以通过聘请人工智能专家、提高现有员工的技能或与外部专家或顾问合作来实现。

3. 从试点项目开始。通过在已确定的垂直领域启动小规模试点项目来开始你的旅程。这些项目将允许你测试与在现实场景中实施人工智能解决方案相关的可行性、潜在影响和相关挑战。

04 忽视生成人工智能的后果

生成式人工智能代表了人工智能的重大突破,正如前面提到的,这项技术有望成为一种商品。企业是否利用通用人工智能或垂直人工智能将取决于他们,但那些忽视这项技术的人可能会面临重大挑战。如果不利用生成式人工智能的力量,公司就有可能落后于竞争对手。他们可能面临运营成本增加、决策过程变慢以及错失自动化和优化的机会。

随着生成式人工智能的不断发展,企业探索其可能性、将其集成到工作流程中,并利用其功能来取得新的成功至关重要。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

AI彻底火了!地下850米最新实探

中国基金报记者 冯尧         

提及煤矿,很容易令人联想到矿工的满面乌黑、“闷热”“潮湿”的工作环境、甚至时而发生的矿难……在过去,这是众多煤矿的真实现照。然而如今,一切正在变化,变量则来自于“AI大模型”。         

自ChatGPT带火整个AI赛道后,国内大模型如雨后春笋般出现。据不完全统计,目前国内已有93个大模型公开发布,逐渐形成“百模大战”之势。         

以ChatGPT为代表的通用多模态大模型在问答、写作、作诗方面展现了“惊艳”的一面,但随着市场回归理性,人们不禁要问:大模型除了聊天、创作外,还能干些什么?         

截至目前,已经有不少科技巨头将目光投向B端。华为近期发布了“不作诗,只做事”的盘古大模型3.0,聚焦行业场景、垂直领域;曾经试图对标ChatGPT的百度文心一言也将视线转移至能源、汽车制造等领域;腾讯云也试图做行业大模型解决方案。       

 近日,中国基金报记者实探了位于山东西南部的多处煤矿。其中最深的矿井位于菏泽市巨野县的新巨龙煤矿,其开采深度达到810米至950米,这有如将全球最高楼迪拜哈利法塔向下倒砌。         

而记者在实探的掘进工作面位于地下约850米处,乘坐罐笼(矿井中的升降电梯)下到矿底,足足需要三分钟时间。而在暗无天日的矿下驻足数小时,时间仿佛都在加速。         

值得注意的是,先于记者下矿井的,还有AI大模型。那么,AI大模型如何在地下超800米之初,改变煤矿人的作业方式?如何与矿山开采发生“化学反应”?         

大模型如何在矿井下运行?         

“在我刚毕业的时候,煤矿每年的事故率在5%左右,矿工一直是高风险工种,”山东能源党委常委、副总经理刘健对记者坦言。在他看来,“如何留住人”一直是煤矿企业需要解决的棘手问题,如何让更少的矿工面临高风险,是行业内部重点研究探讨的问题。         

通过何种方式可以让更少的矿工下到矿井中?如何让井下工作时间缩短?         

记者日前实地走进了新巨龙煤矿,该矿是山东能源鲁西矿业旗下主要煤矿之一。新巨龙煤矿于2004年6月份开工建设,2009年底投产运营,矿井核定生产能力600万吨/年,保有资源储量10.8亿吨。据工作人员透露,该矿至少还可开采47年之久。         

记者换上矿工的装备后,乘坐罐笼经过近3分钟下到地下约850米的矿井内。随后,记者又换乘通勤车在如地下迷宫般的隧道内穿梭。         

从出罐笼到抵达掘进工作面,通勤车足足开了约半小时。据新巨龙工作人员介绍,这段车程行驶距离超过10公里。很难想象,在超800深地下,还盘踞着如此庞大的地下网络。而下车后,仍需要步行数百米,才能真正达到掘进工作面(如图),整个过程犹如“地心历险记”。

不过,与想象中不同的是,矿井中并没有出现粉末飞扬的场景,相反是一系列设备井然摆放。整个路程中,仅看到为数不多的几位工作人员作业。同时,每隔一段距离就能看到摄像设备、无线基站等设备。

据新巨龙煤矿副总经理牛永明告诉记者,国内煤矿的煤层普遍较深,开采难度相较于国外难太多,“比如在澳大利亚,多数煤矿是露天矿,完全不需要下地采掘。”         

据他介绍,在深入地下的煤炭采掘过程中,冲击地压是造成煤矿塌陷最主要因素,是需要防范的最大风险。而中国是世界煤炭行业受冲击地压影响最深的国家之一。         

如何化解这一风险?钻孔卸压工程成为冲击地压防治的主要手段。记者在现场也观察到,钻孔机器是掘进工作面所必备的设备。

上述人士介绍,在采煤过程中,岩体应力猛烈释放会导致事故,通过对岩壁打孔产生一定空间,可以令岩壁压力向孔内释放,从而避免向采煤隧道内挤压。因此,在卸压钻孔施工时,人员操作不当,比如深度不够、角度错了等,会影响卸压效果,继而导致安全隐患甚至事故。         

其中,钻孔深度是防冲卸压工程最关键的参数之一。记者在钻孔卸压工作面观察到,钻孔机器上安装着高清摄像设备以及其他相关传感器设备。据牛永明介绍,AI大模型可对钻孔施工情况进行实时监测,可实现钻孔深度自动核验、孔深不足及时提醒,避免漏检、迟检,减少人工核验工作量。

         “过去,我们在检查矿工作业的规范性方面,通过执法记录仪对打钻的全过程录像,录像完成后再带出矿井,再由专人对视频进行核查,也就是说视频现场如果拍了一个半小时,那地面上的人就要看一个半小时,非常耗时耗力,”新巨龙煤矿防冲中心主任贾海滨直言。       

 而大模型下地之后,地上工作人员通过AI大模型视觉识别能力来识别矿工是否打钻达标。据记者随后在地上指挥中心观察,盘古大模型通过前期学习,可以准确识别包括矿工、设备在内的各种井下物件。当矿工操作不规范时,可第一时间作出提醒,极大降低了沟通的时间成本,同时降低了防冲工作风险。

据贾海滨透露,“过去一个钻孔卸压小组需要14-16人左右,而现在仅需要4-5人即可。而在地面,1位地上人员可以监测5、6个工作面场景。”         

他介绍,用了AI识别后,一是增强了实时性,从之前隔天核验到现在现场完成核验,卸压孔深度不足时系统及时提醒,冲击地压监控中心可实时查看井下工程施工情况,发现问题及时整改。二是减少了人工核验工作量,从之前人工审核一个卸压钻孔耗时15分钟到使用AI后人工审核时间降低到3分钟,降低人工核验工作量80%。

大模型赋能产业的缩影         

记者在新巨龙煤矿矿井中所见的景象,也仅仅是大模型运用于采矿工作场景之一。大模型另一个场景是选煤环节,选煤过程中避免粗颗粒物进入介质回收环节,是保证选煤效果的关键因素。       

 记者李楼煤矿看到,为解决“跑粗”发现不及时难题,该矿通过在稀介桶内加装截粗装置和摄像仪,在边缘推理设备上部署AI模型,实时分析截粗装置上的粗颗粒物堆积情况,及时告警提醒,同时推送证据图片,以帮助巡检人员处置,降低工人劳动强度,从而提升选煤效果。

地面监控中心(冯尧摄)         

李楼煤矿同样是山东能源鲁西矿业公司权属矿井之一,这里优质稀缺炼焦煤地质储量达10.8亿吨,可采储量1.78亿吨,年核定生产190万吨。         

另外在鲍店煤矿,该矿也全工艺段采煤机记忆截割、液压支架自动跟机、自动找直、时序自动放煤、煤流智能调速、运输机自动张紧和断链保护等功能保持常态化运行,极大改善了职工作业环境,提高了矿井安全保障水平。         

而上述AI大模型之所以能够“下矿”,要得益于山东能源、云鼎科技依托华为盘古矿山大模型的开发。据华为煤炭军团CEO蒋旺成透露,盘古矿山大模型主要涵盖采煤、掘进、主运、辅运、提升、安监、防冲、洗选、焦化9个专业21个场景应用。         

在细分领域,包括劳动保护用品穿戴规范性监测、人员乘坐架空乘人装置规范性监控、人员误入危险区域及关键岗位行为状态监护、煤矿限员AI监管分析等也均是大模型“发热”的场景。         

那么,大模型何以能在煤炭行业落地?用蒋旺成的话说就是,“智能化程度越低、人员需求越大的行业,往往是AI大模型赋能空间最大的行业。”       

 在煤炭行业中,不少煤矿早期采用传统的人工巡检方式,作业现场多是高温、高危、粉尘、潮湿等恶劣环境,初期采用摄像头远程监控系统,但是需要大量的人力来观看视频发现异常点,且无法完成海量视频异常标注和识别。         在山东能源党委常委、副总经理刘健看来,煤炭行业最应该实现智能化,让机器设备代替人工。他认为,作为企业而言,希望借助大模型视觉能力实现皮带运输、防冲泄压、人员安全、流程合规检查等场景的智能化监测和识别,以大幅降低人力监测工作强度。         

早在2020年2月,国务院八部委联合下发了《关于加快煤矿智能化发展的指导意见》,明确要 求将人工智能、工业互联网、云计算、大数据等新技术与现代煤炭开发利用深度融合。          

而在2022年8月,科技部发布《关于支持建设新一代人工智能示范应用场景的通知》,明确提出促进人工智能与实体经济深度融合和支持以智能矿山等为代表的新一代人工智能示范应用场景工作。         

实际上,政策接连出台也为大模型“下矿”提供支撑。据了解,山东能源在国内外共有85处煤矿。自2021年以来,该公司已投入100多亿元进行矿井智能化建设,建成了133个智能化采掘工作面、24个5G+智能矿山应用场景,9处国家级智能化示范矿井全部通过验收。         

根据规划,“十四五”期间,山东能源还计划投入资金300亿元,建成一批多种类型、不同模式的智能化矿井。“目前集团已建成300多个智能化采煤工作面,智能开采产量占比超过80%。煤矿智能化工作开展以来,累计减少井下作业人员1.2万人,”刘健表示。         

值得一提的是,大模型能够实现“下矿”,合作模式也是不容忽视的环节。早在2022年1月,山东能源、云鼎科技、华为三方联合成立了联合创新中心,三方依托盘古大模型建设了人工智能训练中心,实现了中心训练、边缘推理、云边协同、边用边学。         

换言之,山东能源提供商用场景、华为提供盘古大模型的底座,而云鼎科技基于盘古大模型底座,承接人工智能训练中心场景落地任务。实际上,该模式也给市场提供了一个大模型商用路径的模板。         

在华为方面看来,能够拥有落地场景作为试点平台,对于大模型产业落地至关重要。蒋旺成对记者直言,过去阻碍大模型商用的最大阻力其实是两端存在难以突破的隔膜,即“打造大模型的科技类公司了解大模型,但却对商用行业不甚了解;而商用的行业人士对所处的行业了解,却不懂大模型”。         

头部玩家才能享用大模型?       

随着市场对于大模型的态度日益理性,能否应用落地并且具备商业化能力,逐渐成为检验大模型成功与否的标准。业内普遍认为,不同于传统C端消费互联网,B端产业才是大模型的主战场。         

此前,华为盘古大模型已经明确表示“不作诗、只做事”,而曾经试图对标ChatGPT的百度文心一言也将视线转移至能源、汽车制造等领域;腾讯云宣布做行业大模型解决方案;科大讯飞的星火认知大模型也将包括汽车、教育作为“降落点”。         

浦银国际一份研报认为,行业大模型或成为衍变趋势。该机构认为,未来大模型会进一步分化为通用、专用和特定场景,通用大模型并不能解决很多企业的具体问题,而模型的大小,主要还是取决于企业用户的自身需求,企业的大模型应用需要综合考虑行业专业性、数据安全、持续迭代和综合成本等因素。         

不过,从目前来看,AI大模型在B端商用仍处于在探索阶段的初期,仍面临许多亟待解决的问题。以煤炭为例,当前能够为AI大模型提供商用试验场所的,局限于行业的大型头部企业。         

首先,盘古大模型之所以能够“下矿”,一个不容忽视的前提是山东能源前期投入大量财力物力,已经初步完成其煤矿的“数字化改造”,并能实现数据互通。简而言之,便是数字化改造“第一步”,大模型上路“第二步”。       

 “我们曾经遇到一处煤矿,井下就有超过20种系统,操作起来非常复杂,”华为矿山军团一位相关负责人对记者直言。该人士所提及的矿井中,设备所使用的基本国外厂商系统,均处于封闭状态,互不通信。而且外方供应商非常强势,并不开放数据接口。在这种状况下,AI大模型稳定运行几乎是“不可能完成的任务”。         

在记者采访过程中,新巨龙煤矿方面也侧面印证了上述说法。据新巨龙煤矿相关负责人透露,在数字化转型过程中,曾面临矿山、装备和通信数据编码不统一、通讯接口不兼容、传输协议不开放、系统集成难度大等突出问题。“光打通数据接口,实现数据共享就花了两个月时间,”该人士称。         

而且,据其透露,要实现大模型运行,底层生产系统的基础条件要具备。比如,需要的传感器要齐全,要使用高可靠性的装备;在架构上,按照工业互联网架构来设计信息化系统。         

事实上,仅仅是完成数字化改造,便需要耗费大量财力物力。从国内企业已推进数字化转型所处的阶段来看,大多数企业还处于转型初级阶段,已完成数字化转型的企业为数不多。         

也就是说,目前来看,将大模型实际运用于商业场景,更像是头部玩家的“游戏”。         

在业内看来,煤矿智能化建设本身是一个极为复杂的系统工程,面对复杂的自然环境,想要真正实现智能化非常困难。在记者采访的多位人士看来,要真正全面、系统实现智能化升级,还需从网络、平台、标准、人才培养等多个领域统筹兼顾、协同推进。       

 华为方面也提及,目前AI大模型在行业中落地过程中,各项参数目前缺乏明确统一标准,“比如大模型的判断,精确到什么程度,目前是根据各个试点企业实际需求出发。”该人士也提及,未来需要更多企业加入进来,便会逐渐形成生态,行业标准设定才会进一步规范。不难看出,AI大模型的行业落地长坡厚雪。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

全球首款!澳洲推出AI创造的啤酒!配方设计全AI完成,酿酒师原地失业!这些人未来也要糟

现如今的人工智能越来越先进,特别是ChatGPT出现后,不少人都感到了前所未有的职业危机,

我们的工作岗位要被AI取代,

可能不久之后就会成为现实!

本来还有不少人表示,虽然AI很先进,但是一些需要更多经验或者味觉的工作,冰冷的机器是无法替代的。

只是,

这些人现在已经被打脸了!

澳洲酒厂推出

全球首个AI研发啤酒

新州的酿酒厂Modus Brewing全澳闻名,旗下多款啤酒深受喜爱。

就在最近,Modus Brewing搞了一手花活,它们与Absolutely A.i.来了一次跨界合作,

就想看看AI系统能不能代替酿酒师,

创造出酿酒配方表!

本来酒厂内的酿酒师对这个所谓合作嗤之以鼻,酿酒依靠的是经验和技艺,还有对酒类味道的熟悉度。

AI系统根本没有人类的味觉,怎么可能创造出口味独特的啤酒?

可是,打脸来得太快!

Absolutely A.i.的系统根据Modus Brewing酒厂提供的资料和之前的酿酒习惯,很快就计算出了一个全新的酿酒配方。

Modus Brewing的几名资深酿酒师只是看了看配比,就预测这个口味很不错,甚至可能会引发不少人的追捧。

Modus Brewing也是直接按照这个配方推出了新款啤酒,

啤酒的包装上直接采用了机器人的元素!

对了,这也是AI自动生成的…

这也是全世界范围内首款由人工智能分析配方酿制的啤酒!

最夸张的是,人工智能生成的这个啤酒配方不仅符合Modus Brewing的酿造习惯,而且还整合了澳洲东海岸居民对啤酒的评论和喜欢的啤酒风格。

也就是说,这个配方是根据澳洲东海岸啤酒爱好者的建议全身升级出来的,怪不得专业酿酒师都对这个配方无比佩服。

Modus Brewing的创始人Grant Wearin表示,这款AI创造的啤酒苦味低,芳香浓郁且口感丰富,具有甜美的麦芽味,可以平衡包含葡萄柚、橙子和百香果的浓郁啤酒花香气。

目前这个被命名为Neural Network从配方到包装设计全部由AI包办的啤酒已经推出,全澳洲各个地方都能购买,

而且销量非常惊人!

这说明了什么?我们的口味都被人工智能轻松拿捏了…

这么来看,靠着经验和味觉的酿酒师,也可能被智能系统取代…

人工智能之下

多少人的工作将会不保

啤酒配方,包装设计AI可以一手搞定,而且啤酒反响良好,这导致的后果是,酿酒师可能很快就要原地失业了,因为一切流程都可以由AI进行操控实现智能化。

不仅更新换代更快,而且产量更高,成本也会大大降低…

这也再次引发了人们对AI的恐惧,是不是随着AI的不断发展,很多工作都可以由AI直接取代呢?

这个担忧随着ChatGPT的火爆,也升到了最高点。

工作大量被人工智能替代究竟是好是坏,现在还无法断言,但如果未来很多职业真的被人工智能取代,可能又将是一个新时代的到来。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

80%代码秒生成!AI神器Copilot大升级,百万开发者动嘴编码5年内成真

码农AI神器又升级了!

就在刚刚,Github官宣,Copilot模型升级,5年内80%的代码将自动生成。

GitHub Copilot发布还不到两年, 就已经为100多万的开发者,编写了46%的代码,并提高了55%的编码速度。

这次升级究竟改进了什么呢?

5年,80%代码自动生成

通过模型的改进,以及上下文过滤功能的增强,现在开发人员在写代码的时候可以获得更多量身定做的建议,满足需求。

而且,划重点!个人版和企业版都可以无压力使用。

据官博介绍,改进后的AI模型超越了之前的Codex模型,可以更迅速地为开发人员提供代码上的建议。

新模型由OpenAI、Azure AI和GitHub合作开发,与之前的模型相比,延迟时间缩短了13%。

这意味着,GitHub Copilot为开发人员生成代码建议的速度比以往任何时候都要快,有望大幅提高整体工作效率。

同时,新模型还有更为复杂的上下文过滤功能,能更广泛地考虑开发人员的上下文和使用模式。

这样,它就能更智能地过滤提示和代码建议,从而让开发人员获得针对其需求的建议。

数据显示,代码接受率相对提高了6%,让开发人员能够专注于工作的创造性方面,而不是被乏味的编码任务所困扰。

GitHub Copilot正在升级,改进了人工智能模型并增强了上下文过滤功能,从而为开发人员提供更快、更量身定制的代码建议。

Github就像是第二大脑,能够帮你省去记忆的麻烦。

Github的CEO Thomas Dohmke还曾表示,80%的代码将在短短五年内生成。

他还表示,Copilot 测试版中 40% 的代码都是生成的,这让开发者的速度提升了55%。

新一代生成代码Copilot X

在微软将GPT-4能力集成到Office 365后,GitHub曾官宣发布了,基于GPT-4的新一代代码生成工具Copilot X。

具体来说,Copilot X提供支持的体验有:Copilot Chat;Copilot for Pull Request;Copilot for Docs;Copilot for CLI。

这些新功能都是由OpenAI的GPT-4驱动的。

值得注意的是,由于速度延迟的原因,代码自动补全工具仍基于GitHub的Codex模型上,该模型是在GPT-3上训练的。

此前,微软已经将GPT-4集成到搜索、办公、写代码等各种真正意义上的生产力工具上,属实是拥有了开启第四次科技革命的力量。

资深大数据架构师祝威廉称,Everything powered by AI已经不再遥远:

如果说,OpenAI GPT-4只是个模型完成了从0到1,微软则推动了其商业化直接前进一大步。

这次,Copilot X的发布,直接降维打击上一代Copilot。

就比如,GitHub在Copilot中内嵌一个基于GPT-4的聊天窗口,专注于开发者场景,并集成在VS Code和Visual Studio上。

Copilot不仅可以识别开发者输入的代码内容,报错信息显示,还可以对代码块的用途进行深入分析和解释,生成单元测试。

甚至还可以给出debug的建议。

此外,在Copilot中,你甚至不再需要键盘来编写代码。

只需坐在电脑前,说一句「嘿,GitHub!」,动动嘴皮子编代码就能实现了。

目前,GitHub正在试验GitHub Copilot Voice新功能,一个基于语音的交互系统。

除了编写代码,通过Copilot Voice,你甚至可以完成:代码跳转、控制IDE、代码总结。

GitHub首席执行官Thomas Dohmke曾表示,虽然自动补全代码已经大大提升开发人员的生产力,而全新的Copilot X能将开发人员的生产力提升10倍。

「软件开发的黄金时代已经来到聊天界面。」

工作效率提升55%

早在2月份,GitHub曾发布了个人版和企业版Copilot的重大更新。

简单来说就是,升级之后的GitHub Copilot将会具有更高的代码质量,以及更快的响应速度。

自发布以来,GitHub Copilot已经为超过一百万人开发者提供了更强生产力,帮助他们提高了55%的编码速度。

但早在2022年6月首次推出时,只有27%的开发者会选择使用GitHub Copilot生成的代码。

如今,这一数字已经上升到了46%。甚至在Java中,达到了61%。

研究显示,在使用GitHub Copilot的开发者中,有90%表示可以更快地完成任务,其中73%的人能够更好地保持顺畅并节省精力。

与此同时,高达75%的开发者在使用Copilot时感到更有成就感,并且能够专注于工作。

为了实现这一目标,GitHub做了如下关键技术改进:

– 升级后的AI Codex模型

将Copilot升级为新的OpenAI Codex模型,为代码合成提供了更好的结果。

– 更好的上下文理解

通过一种称为Fill-In-the-Middle(FIM)的新范式,改进了GitHub Copilot给出的代码建议。

这种方法不仅会考虑代码的前缀,还会利用已知的代码后缀,并在中间留出空白让GitHub Copilot来填补。

如此一来,Copilot就有了更多关于预期代码的上下文信息,以及自己应该如何去和程序的其他部分保持一致。

– 轻量级的客户端模型

使用轻量级客户端模型更新了VS Code的GitHub Copilot扩展,从而提高了建议代码的整体接受率。

现在,GitHub Copilot通过使用关于用户上下文的基本信息(例如,上一个建议是否被接受),将不必要的建议减少了4.5%

对标Copilot,谷歌Colab放大招

微软Copilot练练升级后,谷歌也不甘示弱。

5月,谷歌曾宣布,Google Colaboratory(Colab)即将加入全新的AI编码功能。

在PaLM 2的基础上,利用大量高质量代码数据进行微调之后,全新的「文生代码」模型Codey就诞生了。

而Colab的这些新功能,就是由Codey加持的。

Codey代码生成模型支持20多种编码语言,包括Go、谷歌标准SQL、Java、Javascript、Python和Typescript等。

通过实时的代码补全和生成,Codey可以帮助用户更快地完成开发工作,同时提升代码的质量。

最重要的是,这个模型还专门针对Python和Colab的各种功能进行了专门优化。

看得出来谷歌为了各位深度学习应用和Python的开发者的使用体验,真的是很用心了。

微软和谷歌的编码神器,你更钟意哪个?

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

台积电「打脸」英伟达:AI撑不起芯片大盘

进入 2023 年,消费电子产业并没有扭转下行的趋势,所谓「寒冬」还顺势弥漫到了半导体上游,今年第二季度三星电子的营业利润大跌 95.74%,仅为 6000 亿韩元(约为 33.5 亿人民币),其他半导体上游厂商也都不太好过。

而从去年末大火至今的生成式 AI,一举推动了 AI 芯片的需求爆发,价格一路走高,雪花般的订单也从互联网公司飞到芯片设计厂商,再飞到芯片制造厂商,一度被视为扭转本轮半导体下行周期的关键。

然而台积电还是对 AI 推动芯片需求激增的说法泼了一盆冷水。

7 月 20 日,半导体代工龙头台积电发布了截至 6 月 30 日的第二季度财报,尽管业绩表现超出了分析师预期,但营业收入还是同比下滑 10%至 4808.4 亿新台币(约合 1115.55 亿元人民币)净利润则下滑了 23%,降至 1818 亿新台币(约合 421.78 亿元人民币)。

四年来,台积电净利润遭遇了首次下滑。

更重要的是,即便作为站在英伟达和 AMD 背后的最大赢家,台积电也不看好 AI 在短期内带来的芯片需求变化,与英伟达描绘的前景截然相反,台积电不认为在 AI 能在今年下半年驱动半导体需求恢复增长,甚至是在几年内都不会。

消费电子继续跌

AI 不过初长成

就在前段时间,各家市场研究公司陆续都发布了第二季度全球智能手机和 PC 市场的报告。其中 Calalys 的报告显示,全球智能手机出货量同比下滑 11%,按此计算总出货量应该在 2.55 亿台左右;IDC 的报告则显示,全球个人电脑出货量同比下滑 13.4%,掉到了 6160 万台。

好消息是,两大消费电子市场的跌幅没有进一步扩大。不过出货量的下降规模依然相当可观,单单上季度就又少出货了 3157 万台智能手机和 280 万台 PC,可想而知对上游供应链的冲击。

核心的问题也没有得到解决,一是渠道和组件的高库存,二是需求的持续疲软。业绩说明会上,台积电首席财务官黄仁昭指出,下游库存的消化速度比预想中慢,虽然看到了部分客户的生意已经复苏,但在高通胀、高利率的市场背景下,客户的拉货趋于保守,下半年的需求增长会比以往都要低。

最有力的证明是,针对下半年的风险,台积电将全年营收预期从 1%-6%的下滑调整为了 10%。台积电总裁魏哲家明确表示,AI 拉动的需求不足以弥补库存调整与经济前景不佳的干扰,产值与 IC 设计客戶产值都比先前进一步下调。

要知道,不管是 AMD 最近发布的 MI300X 与 MI300A,还是所有人都在抢购的英伟达 A100/H10、A800/H800(国内特供),都严重依赖于台积电的 CoWoS 先进封装产能。

AMD CEO 苏姿丰近期甚至在媒体采访中表示,MI300 系列芯片「没有台积电是做不到的」。而前不久,英伟达 CEO 黄仁勋也拜访了台积电,核心同样是确保足够的 CoWoS 产能。

但就算 Meta、字节跳动等互联网巨头,过去半年至少投入了上百亿美元购买英伟达 GPU 用于大模型的训练和推理,英伟达也在不断向台积电追加订单,面向 AI 训练和推理的 AI 芯片目前仍然仅占台积电总营收的 6%。

且台积电认为,未来五年 AI 芯片的营收占比预计将增加到 10%。背后的潜台词是,台积电也不太看好未来数年 AI 的爆发式增长。

AI 改变世界

可能还要再等等

今年年初,ChatGPT 席卷全球,随后更是不断发酵,各种大模型、失业、应用……各种消息的充斥,多少砸得人有些头晕眼涨,难免让人误以为:AI 改变世界,只在一夜之间。

等到网络分析公司 Similarweb 指出,ChatGPT 的全球访问量再 6 月出现了首次环比下滑,降幅更是达到 9.7%,很多人才稍微冷静下来,重新审视 AI 改变世界的进程。

这一轮生成式 AI 的进展确实相当快速,从 ChatGPT 的横空出世,到各家大模型的酝酿与发布,再到 OpenAI 和微软率先主导的商业化。

上周,微软正式公布了 Microsoft 365 Copilot 的定价—— 30 美元/月。Microsoft 365 Copilot 是微软与 OpenAI 合作开发的可与 Office 软件配合使用的 AI 工具。微软曾表示,Microsoft 365 Copilot 是其对未来工作的愿景,通过集成 GPT-4 支持,可使用让用户自然语言文本提示自动生成 Office 内容。

但即使是最被看好的 ChatGPT 和 Microsoft 365 Copilot,也尚未成熟。一方面是由于 AI 生成内容的不可靠性,包括了语料追溯和「幻觉」等底层问题。

另一方面则是在使用交互上。虽然自然语言的输入方式让交互方式变得前所未有地自然,但提示词(Prompt)的门槛至少在眼下还很高,绝大部分人难以掌握甚至理解。不仅是用户使用频率不高,涌现出的各种 AI 应用于普通用户而言,使用场景也不明确。客观上,这些都造成了生成式 AI 的实际使用率不高。

当然,AI 在可见的未来,仍然会是计算世界最大的机会。微软创始人比尔·盖茨曾言:「我们总是高估未来两年的变化,低估未来十年的变革。」

生成式 AI

也绕不过新技术的规律

新技术的扩散很少是匀速进行的。市场研究机构 Gartner 早在上世纪 90 年代就提出了技术成熟度曲线,指出大多数技术都会不可避免地经历萌芽期、过热期、低谷期、复苏期以及成熟期。

起初,媒体的炒作总是让人对实际取得的进步产生了过高的预期,技术开发者和企业必须有一点耐心和毅力,并保持清醒的头脑和健康的心态。然后,等技术达到一个转折点,通常需要汇集几项不同的开发成果,并将把它们整合在一起,使得产品体验实现质的变化。

以智能手机为例,初代 iPhone 面世之时,移动电话和手持个人数字助理,也就是 PDA (又称掌上电脑)已经发展了十年。直到 iPhone 在触摸屏上取得的技术进步,以及简约的工业和人机交互设计,最终才带来了一个智能手机的时代。

黄仁勋将 ChatGPT 比作 AI 的 iPhone 时刻,然而他没有说出的是,智能手机要引发真正的狂潮,还要等到 App Store 面世两年后的 iPhone 4,彼时苹果 CEO 乔布斯喊出的口号是:This changes everything.Again.(再一次,改变一切。)

AI 既有相似之处,又有不同之处。ChatGPT 之后,所有人看见 AI 到达了一个关键的节点——机器已经能以自然语言与人类进行顺畅的交流。但显然还不够,先抛开人工智能对人类智能的替代问题不谈,至少一个满嘴「胡话」的 AI 很难获得信任,最终的应用场景也很难扩展、落地。

但所有技术都不是一蹴而成的,生成式 AI 也逃不开这条规律。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

MOBA发布全新AI无接触视觉称重系统

MOBA

我们深耕蛋品行业长达75年,对客户面临的挑战有着深刻的了解。我们拥有多项突破性的创新技术,它们能够提高 A 级禽蛋的比例和禽蛋的盈利能力,同时简化清洗程序,降低禽蛋分级站的劳动力需求。这些特点都可以通过 Omnia PX系列分级机 + 人工智能裂纹和脏破蛋检测系统和人工视觉称重系统来实现!这些创新技术无需直接接触鸡蛋,它将尽可能降低交叉污染的几率,并且简化了清洗程序,因此提高了食品安全性。人工视觉称重系统专为水洗蛋市场而设计,将率先在北美市场隆重亮相。

AI全面赋能蛋品分级

禽蛋生产商的工作重点是向不断增长的人口供应健康美味的禽蛋。然而越来越多的禽蛋需要进行分级,而寻找具备适当技能的合适员工对于禽蛋生产商而言变得越来越困难。我们了解客户面临的公司内部困难:期望优化业务,同时优先考虑食品安全,并聘用能够尽可能提高设备性能的合格员工。通过采取必要的措施来优化您的禽蛋分级设备并提高效率、产品质量和安全性,帮助您提高禽蛋的价值。


我们通过探索新的视觉系统与人工智能(也称为“AI”)相结合的潜力,实现了这些功能。我们全球客户超过 5,000个,我们的系统处理了惊人的 10 亿枚禽蛋,因此我们有独特的视角来充分利用 AI 赋能的全部学习能力。

AI视觉称重系统

通过大量研究和开发,我们成功地开发了一种使用 AI 技术给禽蛋称重的创新方法。通过使用包含数千张禽蛋图像及其相应重量信息的庞大数据库,对我们的 AI 系统进行训练,该模型现已能够识别每枚禽蛋特有的视觉特征,并将之与其特定重量相关联。一旦 AI 模型经过训练,它就可以通过分析其图像,无缝地预测新蛋的重量。通过物理接触进行禽蛋检测的时代已一去不复返 — 禽蛋分级机只需捕获每枚禽蛋的多张图像,借助我们先进的技术,即可提供准确的重量估计值。

现在,MOBA可以为 Omnia PX530型 和 PX700型禽蛋分级机配置AI 称重系统、AI禽蛋裂纹检测系统和AI脏破蛋检测系统。此 PX+ 提供了综合解决方案,无需直接接触鸡蛋,操作简单,简化了清洗程序,并尽量减少了维护工作量。PX+ 凭借其可靠的性能,使我们的客户能够集中精力提高其业务成果。

 图01   AI 禽蛋裂纹检测系统

 图02    AI 禽蛋脏破蛋检测系统

水洗蛋市场

对于是否需要清洗禽蛋,各地区的要求不尽相同:有些地区例如美国禽蛋必须清洗,而另一些地区例如欧盟则制定了相关法规,明令禁止这种做法。考虑到满足卫生要求和遵守各种清洗程序的重要性,我们战略性地选择北美市场作为 PX+ 的首发目的地,因为这是一个水洗蛋市场。继在北美市场成功推出该系统之后,我们计划将我们的业务范围扩大到其他水洗蛋市场地区。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

全球人工智能AI的格局

来源:沪城金服

引言:今年年初,ChatGPT成为人们热议的话题,人工智能AI行业也进入了全新领域。

2015年以前,人工智能行业以小模型为主,只能完成垂直领域的分析任务,无法完成生成类任务。发展至今,人工智能行业出现了大模型,能够处理复杂多样的语言问题,在文本理解、生成、翻译、摘要、问答等方面实现了突破。

这极大地推动了人工智能AI行业的发展,并打破了该行业对未来的想象空间。人工智能AI对企业、对国家而言,已经属于一种战略部署。  

全球AI环境

目前,全球已有多个国家在人工智能AI领域展开竞争。

7月7日,中国科学技术信息研究所研制的《2022全球人工智能创新指数报告》显示:当前全球人工智能发展总格局是由中美两国引领、多国呈梯次分布的格局。

按照2022年人工智能创新指数得分排名,可将46个参评国家分为四大梯队。

第一梯队:国家评分在50分以上,只有美国和中国。美国作为科技大国,拥有众多领先技术以及顶尖的研究机构,是人工智能AI的重要发源地,同时也保持着领先水平。中国在国家战略和大力投资的背景下,成为人工智能AI行业的重要力量。

第二梯队:国家评分在35—50分之间,包含英国、德国、新加坡等11个国家。

第三梯队:国家评分在20—35分之间,包含丹麦、芬兰等12个国家。

第四梯队:国家评分在20分以下,包含马耳他、捷克等21个国家。

实际上,只依靠评分来判断某个国家的创新能力是较为片面的,因为不同国家在人工智能AI行业中有不同的优劣势。例如:美国在基础研究、创新能力、人才培养等方面更为突出;中国在用场景、数据规模、市场潜力等方面较为领先;欧盟在伦理、法律、标准等方面较为专业;其他国家在人工智能AI行业的细分领域中有着突出表现。

在ChatGPT爆火之前,各个国家就已经在人工智能AI行业中不断积累和发展,努力形成完整的AI产业链,在全球AI浪潮中拥有更强的竞争实力。

从参与数量来看,2022年参评国家的人工智能企业总数同比增长25%,人工智能从业人口总数同比增长了53%,两者的同比增幅得到大幅扩大。

从基础建设数据中心的数量来看,近三年参评国家托管型数据中心总量持续增长,有三分之一国家比2020年增长了超过10%。

从政策规划和治理指标来看,2022年几乎所有参评国家的完善程度都得到了提升。

从人工智能相关论文来看,论文总数已经实现翻倍增长,从2010年的20万篇增长至2021年的将近50万篇。以上数据都体现出,全球各国对人工智能AI行业已经十分重视。

算力以芯片市场

在人工智能AI成为大家关注的行业后,算力也得到了快速发展,成为涨得最好的板块之一。

算力是人工智能AI环境的基础建设,对算力的需求远大于AI产业链中的其他板块,所以发展算力已经成为人工智能AI行业的重要基石。据OpenAI统计显示:AI训练任务中的算力增长——每3.5个月翻一倍,已经超越了摩尔定律——每18个月翻一倍。

中国信通院《中国算力发展指数白皮书》测算:2021 年全球算力规模超过615EFLOPS,同比增速为44%左右,后续几年则会迎来算力引爆时代。预测2030年全球算力规模有望达56ZFLOPS,2022—2030年复合增长率达65%。

更值得一提的是,各国的算力布局和GDP呈正相关关系。据IDC报告显示:计算力指数平均每提高1个点,数字经济和GDP将分别增长3.3‰和1.8‰。2021年,全球算力规模前20的国家中有17个国家是全球排名前20的经济体。其中,美国、中国、欧洲、日本在全球算力规模中的份额分别为34%、33%、14%和5%。

算力的最关键的竞争点在于芯片。

传统的CPU计算难以满足愈发庞大的数据处理,辅助CPU也就应运而生。辅助CPU能够能够提供数据的协助处理,当下主流的类型包括通用GPU(GPGPU)、FPGA、ASIC 等。

GPU是图形处理器,具有大量的并行计算能力,能够快速处理大量数据;FPGA是现场可编程门阵列,具有灵活性和可编程性,非常适合开发新的AI算法;ASIC是专用集成电路,具有高性能和低功耗的特点,非常适合部署在边缘设备上的AI应用。

2022年,全球CPU市场总规模约为249亿美元,Intel和AMD占据市场的主要份额。其中,Intel占领市场60%以上的份额,AMD的市场份额在不断提升。2022年,全球GPU市场总规模约为450 亿美元(含GPGPU),英伟达和AMD几乎占据市场中全部份额,Intel的占比极小。

大模型时代近段时间,人工智能AI行业新推出了不少模型。2022年11月,OpenAI发布了聊天机器人ChatGPT,成为人工智能AI行业的首个大模型。2023年2月,Meta AI在其官网公开发布了LLaMA大型语言模型。2023年3月,百度发布了文心大模型。

2023年5月,Google发布新一代大语言模型PaLM2。随后,商汤、阿里云、科大讯飞、华为等陆续发布了各自的大模型,几乎所有的科技平台都参与其中,人工智能AI行业瞬间百花齐放。人工智能AI大模型是集资本密集、人才密集、数据密集的产业,千亿级的参数模型训练一次就要花费超1200万美元的成本。这不仅是技术之战,同样也是平台之战。

在科技不断发展下,是否拥有人工智能AI大模型或将成为衡量企业甚至是国家综合实力的重要条件之一。人工智能AI大模型逐渐成熟后,相关的下游产业都将会得到快速发展,终端应用的研发将会成为人工智能AI时代的下一个阶段。人工智能AI已经经历了产业孵化、算力基础建设、底层大模型研发等多个过程,未来不论如何发展、不论以何种方式存在,只要掌握了最底层的东西,就能掌握核心。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

制造业人工智能8大应用场景

来源:中国工业报

人工智能技术和产品经过过去几年的实践检验,目前应用较为普遍,推动着人工智能与各行各业加速融合。从技术层面来看,业界广泛认为,人工智能的核心能力可以分为三个层面,分别是计算智能、感知智能、认知智能。

1、计算智能

计算智能,是指机器具备超强的存储能力和超快的计算能力,可以基于海量数据进行深度学习,利用历史经验指导当前环境。随着计算力的不断发展,储存手段的不断升级,计算智能可以说已经实现。例如,AlphaGo利用增强学习技术完胜世界围棋冠军;电商平台基于对用户购买习惯的深度学习,进行个性化商品推荐等。

2、感知智能

感知智能,是指使机器具备视觉、听觉、触觉等感知能力,可以将非结构化的数据结构化,并用人类的沟通方式与用户互动。随着各类技术发展,更多非结构化数据的价值被重视和挖掘,语音、图像、视频、触点等感知智能快速发展。无人驾驶汽车、波士顿动力机器人等就运用了感知智能,通过各种传感器,感知周围环境并进行处理,从而有效指导其运行。

3、认知智能

认知智能,是指机器像人一样,有理解能力、归纳能力、推理能力,有运用知识的能力,相较于计算智能和感知智能更为复杂。目前,认知智能技术还在研究探索阶段,如在公共安全领域,对犯罪者的微观行为和宏观行为的特征提取和模式分析,开发犯罪预测、资金穿透、城市犯罪演化模拟等人工智能模型和系统;在金融行业,用于识别可疑交易、预测宏观经济波动等。要将认知智能推入发展的快车道,还有很长一段路要走。

目前,制造企业中应用的人工智能技术,主要围绕在智能语音交互产品、人脸识别、图像识别、图像搜索、声纹识别、文字识别、机器翻译、机器学习、大数据计算、数据可视化等方面。下文总结了制造业中常用的八大人工智能应用场景。

场景一:智能分拣

制造业上有许多需要分拣的作业,如果采用人工作业,速度缓慢且成本高,而且还需要提供适宜的工作温度环境。如果采用工业机器人进行智能分拣,可以大幅降低成本,提高速度。

以分拣零件为例。需要分拣的零件通常并没有被整齐摆放,机器人虽然有摄像头可以看到零件,但却不知道如何把零件成功地拣起来。在这种情况下,利用机器学习技术,先让机器人随机进行一次分拣动作,然后告诉它这次动作是成功分拣到零件还是抓空了,经过多次训练之后,机器人就会知道按照怎样的顺序来分拣才有更高的成功率;分拣时夹哪个位置会有更高的捡起成功率;知道按照怎样的顺序分拣,成功率会更高。经过几个小时的学习,机器人的分拣成功率可以达到90%,和熟练工人的水平相当。

场景二:设备健康管理

基于对设备运行数据的实时监测,利用特征分析和机器学习技术,一方面可以在事故发生前进行设备的故障预测,减少非计划性停机。另一方面,面对设备的突发故障,能够迅速进行故障诊断,定位故障原因并提供相应的解决方案。
以数控机床为例,用机器学习算法模型和智能传感器等技术手段监测加工过程中的切削刀、主轴和进给电机的功率、电流、电压等信息,辩识出刀具的受力、磨损、破损状态及机床加工的稳定性状态,并根据这些状态实时调整加工参数(主轴转速、进给速度)和加工指令,预判何时需要换刀,以提高加工精度、缩短产线停工时间并提高设备运行的安全性。

基于机器视觉的表面缺陷检测应用在制造业已经较为常见。利用机器视觉可以在环境频繁变化的条件下,以毫秒为单位快速识别出产品表面更微小、更复杂的产品缺陷,并进行分类,如检测产品表面是否有污染物、表面损伤、裂缝等。目前已有工业智能企业将深度学习与3D显微镜结合,将缺陷检测精度提高到纳米级。对于检测出的有缺陷的产品,系统可以自动做可修复判定,并规划修复路径及方法,再由设备执行修复动作。

例如,PVC管材是最常用的建筑材料之一,消耗量巨大,在生产包装过程中容易存在表面划伤、凹坑、水纹、麻面等诸多类型的缺陷,消耗大量的人力进行检测。采用表面缺陷视觉自动检测后,通过面积、尺寸最小值、最大值设定,自动进行管材表面杂质检测,最小检测精度为0.15mm²,检出率大于99%;通过划伤长度、宽度的最小值、最大值设定,自动进行管材表面划伤检测,最小检测精度为0.06mm,检出率大于99%;通过褶皱长度、宽度的最小值、最大值、片段长度、色差阈值设定,自动进行管材表面褶皱检测,最小检测精度为10mm,检出率大于95%。

场景四:基于声纹的产品质量检测与故障判断

利用声纹识别技术实现异音的自动检测,发现不良品,并比对声纹数据库进行故障判断。例如,从2018年年末开始,佛吉亚(无锡)工厂与集团大数据科学家团队展开全面合作,致力于将AI技术应用于座椅调角器的NVH性能评判(震动噪声测试)。2019年,佛吉亚(无锡)工厂将AI技术应用到调角器异音检测中,实现从信号采集、数据存储、数据分析到自我学习全过程的自动化,检测效率及准确性远超传统人工检测。随着基于AI(人工智能)技术的噪声检测系统在无锡工厂投入应用,人员数量已经从38人下降至3人,同时,质量控制能力显著提高,年经济效益高达450万元。

场景五:智能决策

制造企业在产品质量、运营管理、能耗管理和刀具管理等方面,可以应用机器学习等人工智能技术,结合大数据分析,优化调度方式,提升企业决策能力。
例如,一汽解放无锡柴油机厂的智能生产管理系统,具有异常和生产调度数据采集、基于决策树的异常原因诊断、基于回归分析的设备停机时间预测、基于机器学习的调度决策优化等功能,通过将历史调度决策过程数据和调度执行后的实际生产性能指标作为训练数据集,采用神经网络算法,对调度决策评价算法的参数进行调优,保证调度决策符合生产实际需求。

场景六:数字孪生

数字孪生是客观事物在虚拟世界的镜像。创建数字孪生的过程,集成了人工智能、机器学习和传感器数据,以建立一个可以实时更新、现场感极强的“真实”模型,用来支撑物理产品生命周期各项活动的决策。在完成对数字孪生对象的降阶建模方面,可以把复杂性和非线性模型放到神经网络中,借助深度学习建立一个有限的目标,基于这个有限目标,进行降阶建模。
例如,在传统模式下,一个冷热水管的出水口流体及热仿真,用16核的服务器每次运算需要57个小时,进行降阶建模之后,每次运算只需要几分钟。

场景七:创成式设计

创成式设计(Generative Design)是一个人机交互、自我创新的过程。工程师在进行产品设计时,只需要在系统指引下,设置期望的参数及性能等约束条件,如材料、重量、体积等,结合人工智能算法,就能根据设计者的意图自动生成成百上千种可行性方案,然后自行进行综合对比,筛选出最优的设计方案推送给设计者进行最后的决策。
创成式设计已经成为一个新的交叉学科,与计算机和人工智能技术进行深度结合,将先进的算法和技术应用到设计中来。得到广泛应用的创成式算法包括:参数化系统、形状语法、L-系统、元胞自动机、拓扑优化算法、进化系统和遗传算法等。

场景八:需求预测,供应链优化

以人工智能技术为基础,建立精准的需求预测模型,实现企业的销量预测、维修备料预测,作出以需求导向的决策。同时,通过对外部数据的分析,基于需求预测,制定库存补货策略,以及供应商评估、零部件选型等。

例如,为了务实控制生产管理成本,美国本田公司希望能够掌握客户未来的需求会在何时发生,因此将1200个经销商的客户销售与维修资料建立预测模型,推算未来几年内车辆回到经销商维修的数量,这些资讯进一步转为各项零件预先准备的指标。该转变让美国本田已做到预测准确度高达99%,并大大降低客诉时间。

结语目前,随着越来越多的企业、高校、开源组织进入人工智能领域,大批成功的人工智能开源软件和平台不断涌入,人工智能迎来前所未有的爆发期。但与金融等行业相比,虽然人工智能在制造业的应用场景不少,却并不突出,甚至可以说发展较慢。

究其原因,主要包括以下三大方面:

◉ 一是由于制造环节数据的采集、利用、开发都有较大难度,加之企业的数据库也以私有为主、数据规模有限,缺乏优质的机器学习样本,制约了机器的自主学习过程。

◉ 二是不同的制造行业之间存在差异,对于人工智能解决方案的复杂性和定制化要求高。

◉ 三是不同的行业内缺乏能够引领人工智能与制造业深度融合发展趋势的龙头企业。
解决以上三大问题,人工智能技术才能更好地应用于制造业。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

AI大模型会如何颠覆手机?

来源:阿尔法工场研究院

将大模型变小,再塞进手机,会给人们的生活带来怎样的影响?

最近,荣耀成为了国内率先的破局者。

7月12日,荣耀了发布一款“革命性”的大模型手机Magic V2。成为全球首个实现大模型与手机系统融合的厂商。

在荣耀的宣传中,更加个性化、更注重隐私,并且具备多模态功能的大模型,将会给用户带来全新的体验。

实际上,不只是荣耀,身为手机芯片龙头企业的高通,也在近期发布了自身的大模型。

在7月初召开的上海WAIC上,人们看到搭载高通第二代骁龙8芯片的安卓手机直接运行参数规模超过10亿的Stable Diffusion,且只需要15秒左右就可以出图。

更重要的是,这样的运行,是完全本地化的,只依赖手机本身的算力。

从GPT-3.5到GPT-4.0,曾经需要高昂算力,或者只能跑在云端的AI大模型,也开始在智能终端设备中落地。

不过,在兴奋之余,冷静的人总不免会问:我真的需要一个在部署在手机大模型么?还是说这只是手机厂商为挽救疲软的市场而制造的噱头?

01 打破APP的壁垒

在人们讨论“大模型手机”之前,一个不可忽略的事实是:当今的各类大模型AI,如chatGPT、新必应等,实际上早已推出了各自的手机版APP。

通过这一个个APP,在手机上运行大模型,早已不是什么难事,且与本地部署的方式相比,这些调用云端算力的APP,并不会对手机配置造成额外负担。

那既然如此,那人们为什么还要费尽心机地开发一个专用的“手机版”大模型呢?

对于这个问题,谷歌之前的做法似乎给出了一个可能的答案。

今年5月,在ChatGPT 3.5发布半年后,Google终于公布了全新一代大语言模型PaLM2,用以对抗ChatGPT。作为一种差异化竞争,PaLM2可以被部署在智能手机上。

当时,PaLM2包含四个大模型,按照参数规模从大到小,分别命名为:独角兽(Unicorn)、野牛(Bison)、水獭(Otter)和壁虎(Gecko)。

只有参数最小的“壁虎”可以在手机上运行,Google称,它的运行速度足够快,不联网也能正常工作。

但问题是:人们为什么要以牺牲参数、性能为代价,在手机上使用这样一个“缩水版”的小模型呢?

一个最重要的原因是:与那些以APP形态出现在手机上的大模型相比,一个融入手机系统中的大模型,可以打破各应用之间的壁垒,让其他App也自带大模型特性。

例如,融入手机中壁虎(Gecko),可以通过Gmail,实现自动写邮件的功能。

用户只需在Gmail的“Help me write”(帮我写)中输入需求,它就会结合此前邮件中的信息,写出完整的邮件。

通过这样与手机系统深入融合的大模型,人们不仅可以实现AI对各类APP的赋能,甚至还能将大模型作为通用接口,像“胶水”一样,将各类APP的能力实现组合,实现更多具有想象力的扩展。

例如,倘若人们在一个陌生的地点出行,想寻找某个罕见、偏僻,在地图上并不显眼的位置,这时,手机上的大模型,就可以调用语音+识图+导航的多模态功能,十分接地气地告诉你:“在前面的兰州拉面往左拐,看到城市便捷酒店后再右拐300米”,而不是简单地说出“直行”、“右拐”等机械的回答。

然而,要实现这样的组合,一个难以绕开的问题,就是算力。

同样的,开始在手机上部署大模型的高通,也意识到了这个问题。在高通日前发布的《混合AI是AI的未来》技术白皮书中,首次提出了混合AI架构的概念。

而这一概念,简而言之,就是让AI能够在云端和终端侧进行分布式处理,并根据不同的模型和需求灵活分配负载。

02 改造现实的肢体

也许有人认为,与在手机上部署大模型的做法相比,在云端进行计算的方法,才是既省力又划算的。

然而,实际上随着日活用户数量及其使用频率的增长,云端推理的成本会显著增加,而这样的高成本,也会让生成式AI的规模化扩展陷入瓶颈。

毕竟,单个AI超算的服务器带宽,以及消耗的电力,终归是有上限的,而用户的增长却并没有一个固定的上限。

这就是为什么混合AI架构,即在云端和终端侧进行分布式处理的AI,会成为AI的未来趋势,因为它能够利用终端侧的计算能力,降低云端推理的依赖和成本。

而在混合A架构的基础上,高通还提到,为实现生成式AI的规模化扩展,AI处理的重心正在向边缘转移。

也就是说,将来会有越来越多的AI数据,会在手机、摄像头、传感器等终端侧进行处理。

那这对大模型的发展来说意味着什么?

截至目前为止,大部分大模型所能处理的任务,仍旧停留在文字生成、绘制图片、编写代码这些工作上。

这样的任务,本质上都是属于出不了办公室的“案头工作”。

而AI如果要真正地走进社会,为更多的行业、群体带来改变,而不仅仅是一个存在于网页中的“秘书”,那它就必须具有改造现实世界的“肢体”。

而这样的“肢体”,正是一个个嵌入各个行业的边缘端设备。

举例来说,在医疗领域,AI可以通过智能摄像头,评估帕金森患者的状态;

在工业行业,边缘化的AI可以提高生产过程的智能化和自动化,高效地完成零部件瑕疵检测等任务。

在农业领域,边缘化的AI可以通过智能传感器或无人机,实现对农作物的精准种植和管理,如实现农业病虫害识别、农作物品质评估等任务。

所有这一切,都是仅存在于网页中的大模型所无法完成的。

也正因如此,大模型“边缘化”所带来的显著后果,就是AI横向应用范围的极大扩展。

而随着边缘化的到来,联邦计算等与之匹配的模型训练方式,也将打破原本数据中心化的格局。

因为到了那时,数据并不总是在某一个云端服务器完成计算,而是由多个参与方在本地训练机器学习模型,之后再将模型参数或梯度上传到中心服务器进行聚合。

但诡异的是,依据科技行业发展的逻辑,这样一种去中心化的、可以实现跨行业或跨领域数据共享的技术,非但不会弱化原有的垄断行为,甚至还会进一步将其强化。

03 新巨头的崛起

在前网络时代,人们认为个人网站可以消解大传统媒体的信息垄断,但后来互联网霸主的规模,早已传统媒体的市值的天花板。

如果将这些科技巨头的市值,换算成国家的GDP,那么在2022年,微软的市值就超过了五常之一的俄罗斯(1.7万亿),全球能与之匹敌的经济体屈指可数。

究其原因,是因为任何“技术平权”的进行,在让科技变得更加低廉化、平民化的同时,都会反向地催生出一批技术壁垒更高,集中性更强的超级巨头。

因为正是有了这些“高壁垒”的技术进行支撑,巨头们的规模扩张才成为可能。

例如Meta正是通过一系列数据、算法的优势,才能对众多用户投其所好,并构筑了Facebook和Twitter等庞大的社交帝国。

而英伟达也正是通过自身核心的GPU技术,和壁垒颇高的CUDA生态,才让今天的大模型得以完成海量的计算,才得以让AI成为人人触手可及的技术。

而同样的,当混合计算的AI,通过云端与终端侧相结合的方式,降低了大模型的推理的成本后,其造成的“技术平权”,至少会造就两个方向上的巨头。

其一,就是边缘化芯片的提供者。

因为芯片层的AI运算处理能力,是AI落地终端的必要条件。

虽然在边缘化时代,AI的算力场景是多样化的,例如工业、医疗、娱乐等,但其中最重要的“七寸”,仍然是在用户量最多的手机端。

谁若是能围绕手机端的大模型,形成一套从设计、生产、到软件生态一体化的完整体系,谁就将成为新一代的巨头。

在这方面,身为行业龙头的高通,早已开始了提前布局。

目前,搭载骁龙平台的已发布XR终端已经超过65款,其中Meta、PICO等头部厂商的旗舰产品均采用的是高通芯片。

第二个方向的巨头,就是能为行业提供全套解决方案的玩家。

毕竟AI在终端侧的落地,需要的不仅是硬件,还有软件端的优化。

在同样的硬件基础上,谁的AI引擎能比其他竞品具有更高的效能,能更快地完成计算,谁就将在软件栈方面更具优势。

而要想实现这点,就必须在大模型的量化、压缩、条件计算、神经网络架构搜索和编译方面进行突破,在不牺牲太多精度的前提下对AI模型进行缩减。

因此,谁能在大模型的压缩、小型化技术上取得突破,谁就能率先构建起自身基于终端的软件生态。

综上所述,大模型在手机端的落地,不仅仅是AI真正具备“肢体”,进入人类生活的开始,也是行业发生颠覆,新老巨头进行更替的时刻。

在这样的时代,变革的风暴远比我们想象的要猛烈。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

亚马逊吸引了数千人尝试其人工智能服务,与微软、谷歌竞争

近日,亚马逊的一名高管表示,该公司的云部门吸引了数千名客户试用其人工智能服务,在人工智能的一个关键领域与微软和谷歌展开竞争。

亚马逊还在周三(7月26日)宣布了新的人工智能工具,包括一个建立更多对话式客户服务代理的项目、从初创公司Cohere获得技术的途径,以及一个医疗保健系统,用于在患者就诊后生成临床笔记。

索尼公司副总裁斯瓦米·西瓦苏布拉马尼安说,包括索尼、瑞安航空和太阳人寿在内的多家公司已经试用了亚马逊人工智能服务,该公司今年4月宣布推出这项服务,让企业可以用一系列人工智能模型创建应用程序。这种生成技术可以根据需要生成新的文本、图像和其他内容。

“我们的使命是让每一家公司都成为人工智能公司,”西瓦苏布拉马尼安在一次采访中说。

亚马逊人工智能领域的踏足,与谷歌和微软并驾齐驱,且都是云计算的竞争对手。它们开发或销售人工智能,引起了公众的极大关注。微软已经投资了OpenAI,这家初创公司创建了ChatGPT和人工智能模型GPT-4。

亚马逊披露了数千名用户的信息,激发更多的用户可以试用。这些用户此前未被报道。

亚马逊希望提供比同行更广泛的人工智能模型来赢得业务,包括从初创公司Anthropic和Stability AI获得更新的技术。亚马逊表示,亚马逊作为营收最大的云服务提供商,是具有优势的,亚马逊已经托管了无数客户的数据。

亚马逊人工智能预计将很快向所有客户开放。

工业界一直在更广泛地应对人工智能的成本问题。微软周二公布了至少自2016财年以来的最高季度资本支出,该公司正在建设数据中心来支持人工智能,并与其它云公司争夺英伟达的关键芯片。

当被问及亚马逊是否给了那些有着巨大人工智能雄心的企业一个获取芯片的最后期限时,西瓦苏布拉马尼安说,“我们正在与他们合作,以确保我们了解他们的升级计划”。与此同时,亚马逊还扩大了对基于Nvidia芯片的人工智能培训技术的使用范围,该公司宣称这种技术更有效。

这家云服务提供商还为亚马逊Basketime提供了代理预览服务。亚马逊Basketime让企业可以创建聊天机器人来执行任务,并根据自己的专有数据提供更个性化的答案。

航空公司可以建立一个虚拟代理,根据客户的价格、目的地和座位要求,为旅行者预订航班。这类代理的商业潜力在硅谷引起了不小的反响。

作为人工智能推广的一部分,该公司专门向医疗保健行业发出了呼吁。它宣布推出一项名为AWS HealthScribe的服务,让软件供应商开发应用程序来转录和分析医生和患者之间的对话。

两家公司表示,3M旗下的一个部门计划利用这一点加快临床记录的速度。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

讯飞“AI+智能家居”行业创新Workshop在深圳成功举办

7月20日,讯飞【AI+智能家居】行业创新Workshop在深圳成功举办。本次会议,讯飞聚焦“AI赋能数字人居空间”,展示了在以场景为导向,全面布局家居空间交互AI技术下现阶段的三大成果:星火大模型已成功落地赋能地产销售助手,之后将持续推动家庭助手升级;联合生态完成“MORFEI新一代语音面板技术方案”开发落地;与中海携手研发的“离线自由说”、“方言自由说”课题实现产品批量化落地。
然而面对当今寒意阵阵的市场环境和日益内卷的行业现状,讯飞深知独木难成林,只有上下游产业方开放融合,才能破局发展。
在AIGC带来的变革浪潮中,智能家居行业也迎来了前所未有的发展机遇。在以“话行业机遇,探共生之道”为主题的圆桌论坛上,来自产业各界的大咖们共同探讨AIGC时代下智能家居行业“智变”的影响,洞见智能空间的未来发展脉络。如何把握行业趋势?如何应对风口和挑战?如何聚合生态力量探索一条共生共赢的发展路径共创未来?让我们在本次圆桌论坛中寻找答案:

主题:话行业机遇,探共生之道 

主持人:王胜阳(CSHIA执行秘书长)  

对话嘉宾:陈佳明——招商蛇口城市研究院院长助理、智能化研究所所长;陈立敬——星宸科技副总经理;尤中海——智引擎创始人;彭永坚——广州视声智能股份有限公司总裁;付佳毅——普华永道思略特( 上海)战略咨询执行总监。

01.AIGC带来技术革新,将给智能家居行业带来怎样的新变化?陈立敬:“AIGC将大幅提升行业效率。”

作为上游的芯片厂商,近半年来最直观的感受就是不断有客户来讨论未来大模型如何落地,云边端如何协同与算力调度,AIGC在千行百业的应用倒逼我们进行芯片的创新升级,同时谷歌等国外大厂已经开始用Chatgpt进行芯片设计,AIGC正在迅速拓宽其应用边界,无疑这将带来行业效率的大幅提升。

近几年来,我们始终和讯飞一起致力于提高行业效率,降低行业成本。自18年开始,我们和讯飞一样,也一直在思考,如何通过我们的努力,做好一款家庭中控面板,人机交互体验始终是智能家居的重点,因此我们第一款中控面板的芯片集成多核cpu,融合语音&视觉多传感器,为用户提供更自然的交互形式,通过降低NRE费用和授权费用,实现用户开发门槛的降低和成本管理的极致,而AIGC的发展将会成为行业降本提效的新引擎,助力我们在这条路上走得更稳更远。

02.面对家居空间内不同群体的受众,如何精准把握用户的需求点?付佳毅:“AIGC的自主学习能力能让住宅拥有大脑,精准把脉用户需求。”

智能家居行业向来是技术驱动型的,AIGC是个很好的转型点,但仍需过程。正如移动互动网时代的发展路径,3G到4G的跨越是源于pc端app转移至手机端,用户开始习惯用手机上网;4G到5G的跃升是源于短视频等行业的内容井喷,用户需要更低廉的上网流量和更快的上网速度。可以看到技术创新伊始,无法预料到未来的应用场景会发展成怎么样。
正如现在智能家居的语音技术,虽然比其他按键、触屏等交互方式先进,但仍然存在要站到屏面前进行对话的机械之处。因此我们需要挖掘客户需求,探索更便捷的应用场景,用户对于应用场景的喜好改变才能倒逼技术普及。例如中控屏的陪伴式场景,老人并不是需要触摸屏和语音交互,他们需要的是子女的陪伴。如果我们通过AIGC技术创造出子女形象的数字人,并且在设备中录入子女声音的声纹,以这样的形式做交互,或许能比普通的智能语音屏更能切中用户需求。
数字化可以重新定义家居场景,就像特斯拉用一个统一的控制单元重新定义了智能汽车,颠覆了仍旧坚持传统逻辑的老牌汽车;住宅也可以以统一的数字化生命体做反应,将方方面面的数字化结构做整合,在能耗管理、环境管理、需求关切上,通过AIGC做人性层面的升级,这将远超传统数字化控制能解决的问题,AIGC的自主学习能力能让住宅拥有大脑,面对家居空间内不同群体的受众,始终在思考如何与用户更好地进行互动,精准把脉用户需求。

03.与传统家居相比,AIGC赋能的智能家居如何在用户的全生命周期中提供更好的保障和服务?彭永坚:“AIGC将推动研发转型,低成本高效率实现用户体验升级。”

面对AIGC带来的新机遇如何做好产品定义是我们一直在思考的问题。过去很多年,智能语音是个很火的窗口,尽管智能汽车的语音已经发展得非常成熟,但地产始终没有成功案例。一个原因是地产对于智能家居装配的费用投入不足;另一个是如果要为了提升用户体验替换技术服务商,背后将是一系列产品设计、产品结构、声音美学、软件的替换,带来成本的增加和研发的难度,而AIGC的出现能大幅提升研发效率,推动研发转型做更专业更聚焦的工作,低成本高效率地实现用户的体验升级。尤中海:“在变化的环境中,找到用户体验的确定性。”

现在所有的技术方向,都是让21亿人生活得更爽,让60亿人过上体面的生活,如何打造更懂用户需求的数字空间,需要产业链的共同努力,也需要不受缚于固有技术。

就像我们针对亚非拉无法建立有效的网络体系的现状,提出了一项全新的服务方案:基于新型能源结构打造全新的通信底层架构,并以全屋直流电满足低压需求。不同于网络这个虚拟的世界,数字空间是固定的,我们要在不断变化的市场环境和不断更迭的技术发展中,找到用户体验的确定性,真正让技术被获得。

04.下一个行业千万级出货量的品类集中在哪几个方向?

陈佳明:“绿色、健康、科技是未来的产品需求方向。”

16年我们就提出了“云管家“概念,尽管上层营销推广得非常好,但落地应用层面还是积累了非常多的经验教训。就像智能汽车颠覆传统汽车的价值点是无人驾驶一样,我认为未来住宅颠覆传统住宅的价值点,一定是“管家”。不同于我们现在的“家庭管家”,在设定、唤醒前还是需要输入命令词、场景模式等,AIGC的赋能将大大降低使用者的门槛。

今年我们做了项调研,统计了居住空间中最令消费者记忆深刻的产品TOP3,它们分别是Wi-Fi、集成控制面板和中控屏。中控屏作为智能品类中用户互动最多的产品,同时也能作为家和小区的连接器,我十分期待它与AIGC融合后的可延展性。

“绿色”、“健康”、“科技”是行业未来的三个关键词。绿色是全人类的需求,能节约能源的事是优先的事;健康是客户的强需求,除了安全需求,健康是所有人的共识问题;日新月异的科技迭代速度,大家都在观察AIGC能为行业带来什么变化。因此如果未来有一款搭载了大模型的产品能结合绿色、健康,同时配合低廉成本做成普适性的东西,极大可能就是新的产品方向,但具体是什么样的产品形式,需要大家共同思考和努力。

技术创新的脚步不会停止,用户对美好生活的向往亦不会停止。MORFEI作为讯飞全屋智能细分赛道下的专业选手,坚持致力于用人工智能推动智能家居行业高质量发展,联合产业链合作伙伴,以技术赋能提升用户体验,共生共赢共襄未来。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

Netflix重金招聘AI专家,引起好莱坞工会担忧!

人工智能的使用一直是编剧和演员罢工的主要话题。好莱坞的每个人,在劳动方面都担心人工智能的使用。他们不想完全消除它,但他们要求对其使用提供明确的书面保护和指导方针。这是贾斯汀·贝特曼(Justine Bateman)在美国作家协会(Writers Guild of America)罢工开始时发出警告的内容,也是美国电视和广播艺术家联合会(SAG-AFTRA)主席弗兰·德莱舍(Fran Drescher)在演员罢工第一天发表评论的内容。

“我在圣塔莫尼卡,看到有一个小盒子在滚来滚去地进行送货,我的心都碎了,因为以前有人骑着自行车送货,他们今天失业了,这就是我们这个行业和世界各地工人正在发生的事情,”德莱舍在抗议线上说。

如今,这家流媒体公司发布了两个人工智能领域的工作岗位。该公司正在招聘机器学习平台产品经理。年薪从30万美元到90万美元不等。根据职位描述,这个职位将领导流媒体公司在人工智能领域的努力。公司希望这个人能帮助他们“购买和创造优秀内容,通过个性化帮助会员“选择适合的内容”,优化“支付处理和其他以收入为重点的举措”。该职位还要求申请人展示“为集中式机器学习基础设施团队创建和执行愿景的能力,该团队支持机器学习从业者和数据科学家在各种用例中的应用。”

还有另一份职位招聘,招聘对象是游戏部门的人工智能和机器学习技术总监。该角色的薪水范围在45万美元到65万美元之间。这些薪酬被证明非常丰厚,但对于演员和编剧来说,他们表示他们无法从这项技术中获得同样的报酬。工会成员表示,电影公司愿意按日支付演员的报酬,以换取扫描和创造“数字形象”。该媒体指出,背景演员每天的工资只有200美元。这是根据美国电视和广播艺术家联合会的合同。

直到5月初,美国作家协会一直站在抗议线上,美国电视和广播艺术家联合会于7月13日投票决定罢工。目前还没有消息表明电影公司和工会之间何时可能达成协议。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

《瞬息全宇宙》幕后特效公司 Runway 开放 AI 视频生成工具,可注册账号免费试用

《瞬息全宇宙》特效背后的科技公司Runway近日宣布,旗下AI视频编辑工具Gen-1和Gen-2已向全球用户开放了,现在任何人都可以注册账号免费试用。
Gen-1模型早在今年2月份就推出,仅通过简单的文本提示就能修改视频的艺术风格,想象一下把实景镜头变成梦幻卡通世界,是不是非常厉害?

而更厉害的Gen-2,直接用单个文本提示就能生成惊人逼真的视频场景!比如输入“山脉的航拍无人机镜头”,瞬间就能获得令人震撼的航拍画面!
现在你可以体验到完全免费的服务,注册后还能获得一定数量的代币,用这些代币免费生成多达20段4秒视频。超过代币限额后,不用担心,只需支付0.05美元(约1.43元人民币)一个代币,即可继续生成更多视频,可以说是非常划算了。

Runway Gen-2已上线苹果App Store和Web版本,就算没有苹果设备也能在浏览器中体验,赶快试试这个让你的视频编辑变得无比轻松的黑科技。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

OpenAI、谷歌、微软等 宣布成立前沿模型论坛,旨在推动模型的安全发展!

 7月26日,Anthropic、谷歌、微软和 OpenAI 宣布成立前沿模型论坛,这是一个新的行业机构,专注于确保前沿人工智能模型的安全和负责任的开发。前沿模型论坛将利用其成员公司的技术和运营专业知识,使整个人工智能生态系统受益,例如通过推进技术评估和基准,以及开发公共解决方案库来支持行业最佳实践和标准。

OpenAI、Google、微软、Anthropic发声正在推出前沿模型论坛,该机构专注于前沿人工智能模型的安全性和可靠性。该论坛旨在帮助:(i)推进人工智能安全研究,以促进前沿模型开发的可靠性,最大限度地降低风险,并实现对能力和安全性的独立、标准化评估;(ii)确定前沿模型可靠开发和部署的最佳实践,帮助公众了解技术的性质、功能、局限性和影响;(iii)与政策制定者、学者、民间社会分享有关信任和安全风险的知识, 推进可靠的人工智能系统开发;(iv)支持开发有助于应对社会最大挑战的应用程序,例如减缓和适应气候变化、早期癌症检测和预防以及应对网络威胁。
  前沿模型论坛还将设立一个顾问委员会来协助战略指导和优先事项部署。同时,论坛欢迎其他开发前沿人工智能模型的组织参与,并愿意合作以实现这些模型的安全发展。

论坛会员标准

 该论坛将前沿模型定义为大规模机器学习模型,其能力超出了目前最先进的现有模型的能力,并且可以执行各种任务。论文会员资格向以下组织开放:

  • 1、开发和部署前沿模型(由论坛定义)。
  • 2、表现出对前沿模型安全的坚定承诺,包括通过技术和制度方法。
  • 3、愿意为推进论坛的努力做出贡献,包括参与联合倡议并支持该倡议的发展和运作。 论坛欢迎符合这些标准的组织加入这一努力,并合作确保前沿人工智能模型的安全和负责任的开发。

论坛工作重点

 各国政府和业界一致认为:虽然人工智能为造福世界提供特别多的可能性,但仍需要适当的防护来降低AI带来的潜在风险。美国、英国政府、欧盟、经合组织、七国集团和其他组织已对此做出了重要贡献。(YY:中国也做出了很多贡献!)

 依据之前努力的结果,我们需要在安全标准和评估方面开展进一步的工作,以确保人工智能模型开发、部署的可靠性和安全性。未来一年,论坛将重点关注三个关键领域,以支持前沿人工智能模型安全可靠的发展,具体地:

 1.确定最佳实践:促进行业、政府、民间社会和学术界之间的知识共享和最佳实践,重点关注安全标准和安全实践,以减轻各种潜在风险。

 2.推进人工智能安全研究:通过确定人工智能安全最重要的开放研究问题来支持人工智能安全生态系统。该论坛将协调研究,以在对抗稳健性、机械可解释性、可扩展监督、独立研究访问、紧急行为和异常检测等领域推进这些努力。最初将重点关注开发和共享前沿人工智能模型的技术评估和基准的公共库。

 3.促进公司和政府之间的信息共享:建立可信、安全的机制,在公司、政府和相关利益相关者之间共享有关人工智能安全和风险的信息。论坛将遵循网络安全等领域规则展示出最佳实践。

微软副董事长兼总裁Brad Smith表示:“创造人工智能技术的公司有责任确保其安全、可靠并始终处于人类控制之下。这一举措是将科技行业聚集在一起,负责任地推进人工智能并应对挑战,使其造福全人类的重要一步。”

 OpenAI全球事务副总裁Anna Makanju表示:“先进的人工智能技术具有给社会带来深远影响的潜力,而实现这一潜力的能力需要监督和治理。至关重要的是,人工智能公司——尤其是那些致力于最强大模型的公司——必须在共同点上保持一致,并推进深思熟虑且适应性强的安全实践,以确保强大的人工智能工具拥有尽可能广泛的利益。这是一项紧迫的工作,本论坛完全有能力迅速采取行动,以提高人工智能安全水平。”

 Anthropic首席执行官Dario Amodei表示:“Anthropic 相信人工智能有潜力从根本上改变世界的运作方式。我们很高兴与行业、民间社会、政府和学术界合作,促进该技术的安全和负责任的开发。前沿模型论坛将在协调最佳实践和分享前沿人工智能安全研究方面发挥至关重要的作用。”

论坛如何运作

 在接下来的几个月中,前沿模型论坛将成立一个顾问委员会,以帮助指导其战略和优先事项,代表不同的背景和观点。

 创始公司还将建立关键的制度安排,包括章程、治理和资金,并由工作组和执行委员会来领导这些工作。我们计划在未来几周内就论坛的设计和有意义的合作方式与民间社会和政府进行磋商。

 前沿模型论坛欢迎有机会帮助支持和融入现有的政府和多边倡议,例如七国集团广岛进程、经合组织关于人工智能风险、标准和社会影响的工作,以及美国-欧盟贸易和技术理事会。

 论坛还将寻求以现有行业、民间社会和每个工作流程的研究工作的宝贵工作为基础。人工智能合作伙伴关系和 MLCommons 等举措继续在整个人工智能社区做出重要贡献,论坛将探索与这些和其他有价值的多方利益相关者的努力合作和支持的方法。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

网易有道正式发布国内首个教育大模型—“子曰”大模型

教育科技公司网易有道发布国内首个教育大模型“子曰”以及六大创新应用成果,覆盖口语训练、作文批改、习题答疑等领域,展现了“子曰”大模型在自然语言处理领域的技术实力及广泛应用前景。北京青年报记者了解到,大模型“子曰”能为学生提供个性化的分析和指导,实现引导式学习,还具备全科知识整合能力。通过连接多模态知识库、跨学科整合知识内容,大模型能随时满足学生的动态需求,帮助孩子培养更综合的能力。

发布会上,网易有道推出了大模型时代的英语口语练习神器——虚拟人口语教练Hi Echo。有道词典业务负责人与 Echo 进行了多组随机对话。Echo 能迅速理解场景和上下文,并给出迅速反馈。她的面部表情和口型生动而自然,发音也非常地道,重音、弱读、升降调等细节处理得非常到位。

在对话过程中,Echo能够像真人老师一样循循善诱,启发式进行对话引导,还能进行实时反馈。对话结束后,Echo会从发音、语法等维度给予建议和润色,能有效解决长期困扰英语口语学习者无话可说、不知从何说起、害怕说错等问题。

“中国人在说英语时往往面临开口难、不敢说、不知道该从何说起的困境,其中的关键就在于缺乏语言环境。”有道词典业务负责人表示,Echo恰恰能为用户带来这种真正贴合实际的“语境”,帮助他们更好地练习英语口语。

网易有道不仅关注用户在英语学习中“不敢开口说英语”的痛点,还覆盖了多种学习场景,借助“子曰”大模型的支持为用户提供多种高效学习方案。

例如,在写英语作业时,学生们不仅有解决具体问题的需求,还需要学会举一反三。“子曰”大模型赋能的“语法精讲”功能可以为学生提供针对性的解题思路和方法,还能推荐同类型的考题,帮助学生触类旁通,真正理解考纲中的考点。

此外,有道在发布会上推出的“AI作文指导”应用,不仅具备“作文批改”功能,还具备“作文指导”功能。据介绍,该应用旨在解决“学生不会写”和“老师没时间改”的问题。针对学生在写作、前、中后过程中面临的题目主旨难确定、写作素材匮乏等难题,该应用都能够给予指导,帮助学生“下笔如有神”。批改环节中,AI作文指导还会从表达、结构、内容深度、情感丰富度四大维度全面提供改进建议。

网易有道CEO周枫认为,一个好的技术有没有价值、能不能发挥巨大的作用,很多时候关键在场景和应用的选择以及细节的打磨。“通过软件、硬件、AI技术的结合,做出精品是我们现在做的事”。他说,“子曰”大模型在教育行业的应用,不仅可以帮助学生更好地学习,也可以帮助老师更好地教学,借此实现因材施教的教育理想。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

Meta 之后,英特尔推出34 个开源 AI 参考套件,AI 领域会掀起开源潮吗?

最近,芯片巨头英特尔与埃森哲合作,向开源社区提供了包含34 个开源 AI 参考套件的产品组合,这标志着英特尔在促进开源 AI 生态发展方面迈出了重要的一步。这些参考套件可以帮助开发者和数据科学家更快更轻松地部署人工智能,为多种架构的本地、云端和边缘计算环境提供 AI 服务。

每个套件都包含了模型代码、训练数据、机器学习管道指令、相关库和oneAPI 组件等内容,旨在优化 AI 性能,简化 AI 引入应用的过程。这些套件基于英特尔端到端的 AI 软件产品组合和开放的 oneAPI 异构编程模型构建,可以充分发挥英特尔 AI 芯片的计算优势。与传统的模型开发流程相比,英特尔 AI 参考套件可以极大地提高工作效率。

这些预配置的AI 套件覆盖了众多关键行业的典型应用场景,如消费品、能源、金融服务、医疗健康、制造业、零售业等。在这些应用场景中,英特尔 AI 参考套件展现出显著的优势:

  • 使用面向企业对话机器人的套件,可以利用 oneAPI 把推理速度提升 45%。这可以大大提升客户服务机器人的响应能力。
  • 应用于生命科学视觉质量控制的套件,可将视觉缺陷检测的训练速度提升 20%, 推理速度提升 55%。这将极大地提高医药制造业的质量控制效率。
  • 预测公共设施资产健康状况的套件,可以将预测准确度提高 25%。这对于电力、水利等公用事业提升服务质量非常关键。
  • 利用这些套件,可以将 AI 模型开发周期从数周缩短至数天,大大降低了研发成本。这可以加速各行各业将 AI 技术应用到实践中。

英特尔副总裁兼人工智能与分析总经理李伟博士表示:

“这些开源的参考套件可以帮助数百万开发者和数据科学家以最简单、高性能且经济高效的方式来构建和扩展各种领域的 AI 应用。”

埃森哲董事总经理John Giubileo 也对此表示欢迎:

“与英特尔合作开发这些 AI 参考套件,可以更好地满足客户的 AI 需求,提高他们的工作效率。”

随着社区反馈不断改进,这些AI 参考套件必将帮助开发者更好地开发和部署人工智能,推动各行各业 AI 化进程的加速。英特尔表示,所有套件均可在官网或 GitHub 免费下载。

值得一提的是,英特尔开源的这些AI 套件,都是基于其独特的优势构建的:

首先是其领先的AI 芯片技术。英特尔拥有从数据中心到边缘的全面 AI 芯片产品线,如 CPU、GPU、VPU、FPGA 等,可以提供强大的算力保障。这些芯片与开源套件的结合,能够发挥卓越的性能。

其次,英特尔在AI 软件方面进行了大量投入。其一 API 编程模型、AI Analytics 工具包、OpenVINO 工具包等,为开发者提供了全面的支持。这为开源套件的开发奠定了坚实基础。

再次,英特尔一直积极推动AI 生态建设,与很多行业领导者如埃森哲建立合作。英特尔了解行业真正的 AI 需求和痛点,所以设计的套件更加贴合实际。

最后,英特尔拥抱开源,这使得英特尔的AI 套件可以被广泛使用,也方便进行持续优化。开源是当前 AI 技术快速进步的重要动力。

开源正在推动AI技术进步

近期,Meta推出了开源可商用的大规模语言模型LLama 2。这对很多大模型来说都是降维打击。业内专家认为,开源可以降低获取先进AI技术的门槛,让更多团队参与创新,共同推进技术发展,AI会迎来更多开源项目。

英特尔开源AI套件也是这个趋势的体现。开源可以加速AI技术在各行各业的应用,使创新成果惠及更广泛的用户。与此同时,开发者的反馈也将促进这些开源工具的持续进步。

可以预见,开源生态的壮大将给AI技术发展带来正面影响。一方面它推动竞争和创新,另一方面它也降低获取先进技术的成本。这些共同作用将有助于AI向着更广泛应用的方向发展。

人工智能的迅速发展给人类带来了巨大的挑战和机遇。随着AI技术的发展,90%的职业会被AI替代,导致大量的人失业。同时也将产生新的大量的AI工作机会。拥抱AI,学习AI,不要做汽车时代的马车夫。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

AI技术助力小红书推出“此刻”功能 打造个性封面!

【ITBEAR科技资讯】7月25日消息,今日,小红书发布了一项名为“此刻”的全新功能,为用户带来了更多有趣的内容发布方式。这项功能允许用户直接输入文字,随后算法将根据输入的文本内容生成一张相应的图片,供用户用于发布。另外,用户还可以在画板上涂鸦,然后通过AI的美化处理,将涂鸦转化为更具艺术感的图像。

据ITBEAR科技资讯了解,使用这一功能非常简便。用户只需在App底部点击“+”按钮,然后选择“此刻”功能。接着,点击“点这里,说说想法”并输入希望作为封面的文字,最后点击右上角的“下一步”。

这一功能提供了三种不同的生成效果,分别是“记事本”、“聊感悟”和“想吐槽”。用户可以自行选择喜欢的呈现类型,来决定封面的内容和风格。如果用户对自动生成的封面不满意,还可以点击“换一张”进行更改。

这一创新功能的实现离不开AIGC技术的支持。目前,这一功能已经在最新版本的小红书App中全量上线,用户可以随时前往体验。

小红书此次推出的“此刻”功能为用户带来了更多创意和个性化的内容发布方式,相信会受到用户的欢迎。未来,随着AI技术的不断发展,类似的创新功能可能会在更多社交媒体平台上出现,为用户带来更加丰富多样的使用体验。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

Gartner:看穿生成式AI的“炒作”,审视AI技术为企业带来的真正价值

来源: 赛博研究院

新的工具和技术都为企业业务增长和成本控制提供了新的机会。类似ChatGPT这样的工具,未来将有极大可能渗透、辐射并完全重新定义员工体验、客户体验、业务和IT的运营业务,以及企业的核心产品或服务建设。研讨会中,Gartner指明了ChatGPT和AIGC产业对中国企业影响的十个事实如下:

本文将聚焦“ChatGPT与LLM、生成式AI的关系,人工智能实施的三大障碍,部署类ChatGPT对于企业有哪些风险,企业如何利用类ChatGPT这个机会提升员工技能/数据分析水平以及Gartner如何看待AIGC未来的走向”几个方面,展开进一步的讨论。

ChatGPT与LLM、生成式AI的关系

弄清生成式AI定义

生成式AI(Generative AI)——生成式AI是指人工智能技术从数据和模型中学习工件的组件(要素),并利用它生成全新的、完全原创的工件(一个产品或物品或任务),同时保持与原始数据或模型的相似性。

基础模型(Foundation model)——基础模型是一种大型的机器学习模型,使用转换器算法在大量无标记数据上进行训练;这种训练通过一系列微调(适配器)机制进行增强,从而产生一种可适用于各种应用的模型。

大语言模型(LLM)——LLM是一种专门针对自然语言的基础模型。

ChatGPT是一个建立在 LLM(这里指OpenAI的GPT模型)之上的会话应用程序。

生成式AI还能生成什么?

生成式AI生成的内容大致可以分为产品与学习方法两大类。产品涉及音视频、编程与数据资产、自然语言、设计等领域;学习方法则主要包含战略、策略两个方向的内容。

AI实施的三大障碍

Gartner调查了AI技术在企业中使用所面临的障碍。根据报告,AI技术实施最大的障碍包括数据可获取性的挑战、数据量和(或)复杂性、无法/难以衡量其价值

企业部署类ChatGPT面临的风险

Gartner将部署类ChatGPT的技术会给企业带来的风险主要分为了输出不可信知识产权、数据隐私与网络安全两大类。两类风险的具体体现如下。

风险一:用户面临的ChatGPT输出常见风险

1、事实不准确(Factual Inaccuracies):在重要细节上出错,输出的内容存在不真实性。

2、幻觉(Hallucinations):完全捏造的输出。对内容没有实际的 “理解”;它只是预测文本。

3、过时信息(Outdated Information):ChatGPT的“知识”截止日期为2021年9月。

4、偏见信息(Biased Information):训练数据的偏见会导致输出结果的偏差。

5、侵犯版权(Copyright Violations):输出结果可能与受版权保护的作品相似。

风险二:知识产权、数据隐私与网络安全

ChatGPT使用风险缓解的行动计划

企业如何利用类ChatGPT提升员工技能/数据分析水平

Gartner预测,到2030年,90%的数据工程师、数据与分析内容创建者和业务分析师将被“数据GPT”所取代。

提示工程将成为释放生成式AI价值的重要技术。从输入的角度,提示工程可以嵌入企业已有的知识并为大语言模型设置背景;从输出的角度,提示工程可以为输出结果做好安全的保证以及促进正确答案的生成。

提示工程(Prompt engineering)是一种人机交互设计的方法,它在计算机系统或应用程序中为用户提供相关提示、建议或反馈信息。这些提示信息可以帮助用户更好地理解系统的功能和如何与系统进行交互,从而提高用户的使用体验和效率。

普通群体可以学习提示工程技术,来改变一些提示词;而专业群体则通过精进LLM微调技术,改变整个模型。

AI相关技术成熟度曲线

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

大模型热潮下埃森哲强调生成式AI推动企业重塑

生成式人工智能——高处的果实?

2023年,最为引发业界关注的技术热点,非生成式人工智能莫属。此前,经济学家朱民表示,生成式AI在根本上改变了我们对数字经济的理解。“以后这个世界就是有生成式AI和没有生成式AI之间的一个区别。”

俞毅对生成式人工智能也颇有感触,2022年8月,他在美国接触了多家技术公司,其中便包括知名AI企业Midjourney,令他眼前一亮,那时他便感觉到,很多事情发生了变化。

更广的调研印证了这样的变化。埃森哲访谈了全球4000多位高管,跨越20多个行业,有42%的全球受访企业有意在今年大力投资ChatGPT及生成式人工智能和大语言模型,98%的高管认为生成式人工智能将能够改造企业整体的运营。企业对跨职能的重塑、技术推动的重要性有着共识。

但是,其中存在不小的落差,俞毅表示,全球范围内真正采取企业重塑战略的领军企业比例只有8%,大部分企业还是观望心态。埃森哲希望通过研究访谈触发更多的企业思考——人工智能会对已有的业务产生影响,具体怎么进行企业重塑,以及如何通过技术抓住新的机会,获得持续增长。

此次大模型热潮背后的大型语言模型(LLMs)和基础模型是推动生成式人工智能进步的重要转折点。它们不仅破解了语言复杂性的密码,使机器能够学习上下文、推断意图并独立创造,而且还可以快速微调以适应各种不同任务。这些技术将对未来的工作方式、商业模式和社会生活产生深刻影响,使人类创造力和生产力发生巨大改变。

现阶段,大多数企业会以直接购买“模型即服务”来开展业务应用。不过对许多企业来说,最大的价值或将源于使用自身的数据定制或微调模型,满足其独特需求。

比如,企业方有望随时便捷地获取和使用生成式人工智能及大语言模型应用程序。企业可以通过应用程序编程接口(API)调用这些程序,并运用提示学习(prompt tuning)和前缀学习(prefix learning)等提示工程技术,针对自身的具体需求加以定制。

另外,为了提高生成式人工智能和基础模型在特定业务应用方式中的价值,企业将越来越多地利用自身数据对预训练模型加以微调来实现定制,从而让绩效实现质的飞跃。

例如,在线旅行代理公司通过部署ChatGPT插件作为“智能客服”,为用户提供旅游出行的个性化建议,帮助用户更快确定行程安排。对于意外的行程更改,旅客可以通过全天候在线的智能客服快速解决问题。

除此之外,生成式AI还可以具体落地于内容创建、代码编写、流程自动化、信息安全等领域。俞毅观察到,有些行业的客户起步比较早,例如,全球一家规模较大的保险公司,首先用生成式AI在一个节点承保审核方面做了应用,里面牵涉的文档多而复杂,通过生成式AI对历史数据、市场环境等的考量和分析,横向比较看,现阶段企业的承保、审核的过程能够快20%至30%。

俞毅认为,生成式人工智能在企业里的目标、应用场景还是相对明确的,这是好的基础。当前的应用比较偏前端和用户交互层面,未来需要继续拓展到工业及企业级应用领域。企业要往上“看”,去够高处的果实,与此同时企业也要往下“沉”,打好地基。

“目前有很多企业的数字化核心还不够牢固,这方面的能力建设包含了产品研发、供应链、核心系统、人力资源等全流程。否则,和生成式人工智能结合来进行企业重塑就会面临困难。”他说道。

技术趋势中谨慎前行

越来越多的中国企业正在积极探索生成式人工智能技术,并开始应用大型语言模型来实现更多的创新和效率提升。在埃森哲看来,企业方既需看到明确的方向,也应在过程中谨慎探索,例如选择一些低风险领域进行可行性评估,再开展生成式人工智能试点,探索创新潜力。

同时,技术应用初期,在合规、安全、技术伦理等方面企业仍要引起足够重视。俞毅表示,安全合规问题是企业比较关注的点,企业、行业面临的合规环境越来越复杂。

大多数的企业已经意识到让生成式AI更“有责任感”的重要性并开始采取积极行动。埃森哲指出,77%受访企业高管将对于AI的监管列为优先事项。此外,有八成受访高管表示,其企业将投入10%或更多的AI总预算,以满足未来的监管要求。

7月13日,网信办等七部门正式发布了《生成式人工智能服务管理暂行办法》(下称《办法》),从生成式人工智能服务提供者的算法设计与备案、训练数据、模型,到用户隐私、商业秘密的保护,监督检查和法律责任等方面提出了相关要求。同时,《办法》中明确了对生成式人工智能产业的支持和鼓励态度。

生成式人工智能所面临的风险因素中,合规风险贯穿于模型设计、搭建、使用各个阶段,涉及个人和商业隐私、版权和著作权等各个方面。

其次是数据风险。如果一台基础模型长期浸染在存有偏差的数据当中,它就会被这些数据“诱导”,从而输出错误的信息或执行歧视性操作。另一方面,某些群体特质也会使生成式AI为其打上固化标签,“一刀切”地去执行某些程序,而失去公平性。

埃森哲认为,打造负责任的生成式AI,不是一项“见招拆招”、“亡羊补牢”的局部任务,而是在生成式AI基础模型的设计之初就应未雨绸缪,并在其全生命周期中持续领航匡正的系统性工程。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

重磅!ChatGPT安卓版正式发布,免费使用

美东时间7月25日,OpenAI在社交平台正式发布了ChatGPT安卓版。(下载地址:https://play.google.com/store/apps/details?id=com.openai.chatgpt)ChatGPT免费提供使用,支持ChatGPT Plus用户。目前,美国、印度、孟加拉国和巴西可下载。OpenAI计划在下周将使用范围扩大到更多国家。早在今年5月19日,OpenAI推出了面向iOS系统的ChatGPT应用,现在终于迎来了安卓版ChaGPT。

ChatGPT安卓版主要功能介绍支持语音交互:除了文本输入之外,用户还可以通过语音与ChatGPT交互。跨设备同步用户历史记录:允许用户在不同平台之间无缝切换不会丢失以前的对话,例如,你在PC上使用了ChatGPT,在安卓手机上可以继续之前的问答记录。此功能可确保在所有设备上提供一致且个性化的体验。

用户通过ChatGPT可以干什么自动生成文本:ChatGPT可以帮助用户自动生成文章、博客、广告文案等各种形式的文本内容,同时还可以对现有文本进行编辑和改写。例如,帮我写一段金融大会的演讲稿。知识问答:ChatGPT可以回答各种领域的问题,包括科学、技术、历史、文化等,为用户提供知识性信息。例如,历史上有哪些著名的科学家?语言翻译:ChatGPT支持多种语言之间的实时翻译,帮助用户跨越语言障碍进行交流。

生成诗歌:例如,写一首关于春天的诗,ChatGPT会返回一首描述春天的诗。还可以将该诗歌进化成影视剧本等。

教育辅导:ChatGPT可以作为学习辅导工具,回答学生在学习过程中遇到的问题,并提供解释和建议。

AI伴侣:ChatGPT可以倾听用户的心情和想法,提供基本的情感支持和陪伴。但需要注意的是,不能替代专业心理治疗或咨询。

代码生成:通过文本提示ChatGPT可以快速生成代码,例如,帮我生成一个吃豆游戏的源代码,并解释其工作原理。以上只是部分案例展示,ChatGPT还有更多神奇玩法。移动版ChatGPT会与手机的应用、设备等做深度集成。例如,今年6月iOS用户获得了对 Siri和Shortcuts的支持,可以在快捷方式中创建 ChatGPT 提示并将其保存为链接发送给朋友。未来,相信安卓版ChatGPT将增加更多深度应用集成 ,提供更便捷的服务。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

ChatGLM 金融大模型挑战赛 | 冠军送 12B 模型授权,30w算力

ChatGLM 金融大模型挑战赛大语言模型的诞生注定会给各行各业带来颠覆性的变革。为了推动国内大模型的应用生态,促进各行各业的快速迭代,我们已经开源了 ChatGLM-6B 和 ChatGLM2-6B 模型,并在7 月 14 日将这两个模型完全免费商业授权使用
同时,我们也在思考如何利用 ChatGLM2-6B 解决真实行业问题。为此,在中国中文信息学会社会媒体处理专委会的支持下,我们联合安硕信息、阿里云、魔搭社区、北京交通大学,推出了「ChatGLM 金融大模型挑战赛」。本次比赛的中心主题是:如何用大语言模型更好地服务金融行业。为鼓励大家提出创造性的解决思路和方案,我们将为参赛者提供充足的算力、数据和技术支持。同时,也为冠军团队提供超级丰厚的奖励:3 万元现金奖励,价值 180 万的 ChatGLM2-12B 模型商业授权一份,价值 30 万元的 GPU 算力 1 年


SMP 2023 ChatGLM金融大模型挑战赛(The Evaluation of Large Model of Finance Technology,SMP2023-ELMFT)由中国中文信息学会社会媒体处理专委会主办,智谱 AI、安硕信息、阿里云、魔搭社区、北京交通大学联合承办,天池平台为指定赛事平台。第十一届全国社会媒体处理大会(SMP 2023)将于2023年11月在合肥召开。SMP 大会专注于以社会媒体处理为主题的科学研究与工程开发,为传播社会媒体处理最新的学术研究与技术成果提供广泛的交流平台,SMP 2023 由中国中文信息学会社会媒体处理专委会主办,安徽大学、中国科学技术大学和合肥工业大学联合承办。

一、赛事日程

报名:2023年7月20日-8月16日。在天池平台完成个人信息注册,即可报名参赛。

初赛:2023年7月20日-8月16日。参赛团队通过天池平台下载镜像,本地调试算法,在线提交结果,系统进行实时评测并返回成绩。初赛排名前 40 名的团队将进入复赛。

复赛:2023年8月17日-8月29日。复赛仍然为在线提交结果,实时评测并返回成绩。复赛前 8 名队伍晋级决赛答辩环节。

决赛:暂定2023年9月初,具体时间另行通知。决赛将以线下或线上答辩的形式进行,晋级决赛的队伍需提前准备答辩材料,包括答辩PPT、参赛总结、核心代码。

颁奖:2023年11月23日-11月26日,具体日期另行通知。获奖团队将参加 SMP 2023 大会,进行技术报告,并接受现场颁奖典礼。

二、奖项设置

本次大赛奖金池共计10万元人民币现金奖励和价值超200万元的模型、算力、API等资源,具体如下(以下奖金均为税前):

冠军(1 名):

  • 3万元人民币奖金,颁发获奖证书
  • 智谱ChatGLM2-12B 的商用授权推理服务1年(价值180万元人民币)
  • 阿里云「ChatGLM2-12B 部署算力」GPU算力1年(价值30万元人民币)

亚军(2 名):

  • 每只队伍可获得2万元人民币奖金,颁发获奖证书
  • 价值2万元的智谱AI API 费用
  • 阿里云「ChatGLM2-6B 部署算力」训练&部署GPU算力(价值 2万元人民币 )

季军(5名):

  • 每只队伍可获得6千元人民币奖金,颁发获奖证书
  • 价值1万元的智谱AI API 费用
  • 阿里云「ChatGLM2-6B 部署算力」训练&部署GPU算力(价值 1万元人民币 )

三、赛题描述

本次比赛要求参赛选手以ChatGLM2-6B模型为中心制作一个问答系统,回答用户的金融相关的问题,不允许使用其他的大语言模型。参赛选手可以使用其他公开访问的外部数据来微调模型,也可以使用向量数据库等技术。本次比赛评估模型能力的赛题按照涉及模型的能力和复杂程度大体分为初级、中级、高级三种类型,每种类型的题目拥有不同的分值:初级:数据基本查询(40分)参赛者需要利用提供的ChatGLM2-6B开源模型和上市公司年报原始数据,并以此为基础创建信息问答系统。系统需能够解决基本查询,如:某公司2021年的研发费用是多少?等问题。中级:数据统计分析查询(30分)在初级阶段的基础上,参赛者需要进行金融数据的统计分析和关联指标查询。系统需基于各类指标,提供问题和答案,如:某公司2021年研发费用增长率为多少?等问题。高级:开放性问题(30分)如:某公司2021年主要研发项目是否涉及国家创新领域,如新能源技术、人工智能等?比赛各阶段的详细内容和评测方式,请参考比赛官网。

四、赛事组织
主办单位中国中文信息学会社会媒体处理专业委员会(CIPS-SMP)
联合承办智谱 AI,安硕信息,阿里云,魔搭社区,北京交通大学大赛指定平台阿里云天池平台

五、加入比赛
报名参赛

(扫码报名)

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

我国人工智能产业城市综合实力TOP20出炉

7月24日,企查查大数据研究院发布《中国AI创新之城竞争力全景报告》,以赛道融资表现为主要考量标准,结合相关企业存量、相关专利数量,对各城市人工智能产业发展进行综合评估,对国内城市进行综合实力排名。

今年2月,ChatGPT以其场景的强通用性,迅速渗透各个行业,人工智能技术再一次超越了人们认为无法达到的极限。伴随人工智能赛道持续升温,引发科技圈、创投圈乃至全民讨论热潮。

企查查数据显示,2013年以来,我国累计新注册84.5万家人工智能相关企业,其中近年AI进入“狂飙期”,超七成新注册企业成立于2020年至2022年。特别是2020年,我国投入人工智能赛道的企业数量呈现爆发式增加,全年新注册11.4万家相关企业,同比激增181.0%,2021年相关企业新注册量进一步同比增加98.9%至22.6万家,2022年全年新注册量突破25万家。今年1月至5月,我国新注册12.5万家人工智能相关企业,同比增加21.2%。

从区域分布上,数据显示,人工智能相关企业集中分布在广东省、江苏省、山东省、浙江省等地,其中山东现存5.6万家,跻身国内省份前三。就城市分布,主要集中在一线及新一线高能级城市,济南相关企业存量省内最多,跻身全国TOP20。

仅统计企业名称、经营范围、产品介绍中包含人工智能、AI的在业存续企业

此次《报告》还发布了我国人工智能产业城市综合实力TOP20,考量指标还包括了融资频次、披露融资总额、专利数量、企业存量等方面内容。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

解放宝妈时间的最新神器:AI妈妈讲故事

忙了一天的工作,回到家里,还要做饭、洗衣服、辅导作业、减肥操……

好容易收拾完,又到了宝宝睡前故事的时间,有多少宝妈快要崩溃啊!

绞尽脑汁编故事,给孩子讲完,还要再来一个,宝贝越来越精神,我们却越来越困,要是有个人能替我讲故事该多好!

AI妈妈讲故事来拯救你啦!

只需录制一段1分钟的声音,就可以利用AI模型训练,生成你的专属AI声音!

不用担心故事内容,你可以自定义关键词和故事风格,让AI自动给你生成故事!

比如我的宝贝喜欢小兔子,宝贝的名字叫菲菲,我们想让菲菲去森林里采蘑菇,我们就可以给出关键词,小兔子、菲菲、森林、蘑菇这些关键词,让AI给你生成

我们再把关键词换成小兔子、菲菲、飞船、外星人,它就生成了一个新的故事

我们可以让小兔子遇到了唐朝的大诗人李白,让他们产生交集,讲一个故事

利用AI生成的故事,千变万化,不会重复,配合着妈妈的声音娓娓道来,让孩子在故事中安然入睡!

想要体验的宝妈们,可以加v:c1011709 免费申请体验(截止到2023-7-31)

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

淘宝上线AI创作小助手,布局AIGC

据 Tech 星球报道,淘宝APP已经上线AI创作小助手,目前该AI创作小助手,支持用户通过AI创作不同风格的自画像,可用作淘宝账号头像。

AI 创作小助手的主要服务还是AIGC绘画领域,能够调起用户的新鲜感,探索围绕用户的更多AIGC玩法,未来是否会上线图文生成、对话生成等玩法,值得关注。

从官方的介绍看,AI创作小助手的功能或不只是头像创作,未来应该还会推出更多的玩法。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

C-Eval中文大模型权威排名公布!APUS得分名列第四,难题排名全球第一!

C-Eval全球大模型综合性考试评测榜公布,全球排名前四的分别为清华智谱的ChatGLM2、OpenAI的GPT-4、商汤的SenseChat, APUS的AiLMe-100B v1。然而值得关注的是,在难题排行榜中,APUS位列全球榜首!

C-Eval是由清华大学、上海交通大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集,包含13948道多项选择题,涵盖52个不同学科和四个难度级别。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

好莱坞终结者?Fable公司推出多模态影视生成器 Showrunner AI

就在今年第六季的《黑镜》里有一集叫《琼糟透了》,讲的是未来人工智能通过搜集用户的信息自动生成电视剧。而电视剧里的科幻内容正在变成现实。

昨天旧金山初创公司Fable发布了名为SHOW-1的Showrunner AI技术,可以生成以您为主角的电视节目新剧集。这个剧情是不是很熟悉?

从去年到现在,AIGC一直都在指数级的发展,大家一直都在猜测它将走向何方,现在看了多模态整合出的系统性的创造力工具可能是方向之一。而这种工具直接指向的就是视频影视类的工具。

不过值得深思的是最近好莱坞的编剧和演员正在因为AIGC的发展而罢工。

这个公司已经获得了两项艾美奖和一项皮博迪奖,并发布了一篇研究论文,概述了其AI Showrunner 的潜力,这个AI工具可以完成 编写、制作、导演、选角、编辑、配音和制作电视节目的剧集。

“AI Showrunner 所做的就是为你创建类似《南方公园》这样的剧集。所有这些都是由AI Showrunner 创建的,” Fable首席执行官Edward Saatchi在接受采访时表示。“不仅是对话。它还实现动画、配音和编辑。对于电视剧 AI Showrunner可以生成剧集,或者用户可以创建提示并根据两个句子来创建电视剧集。有人说AI不会讲故事,那么,它现在可以了。”

AI Showrunner 可以用来做什么?

官方推特:https://twitter.com/fablesimulation

官方论文:https://fablestudio.github.io/showrunner-agents/

这家公司的目标是通用人工智能,一个真正活着的AI,不仅仅是在我们说话时才会出现的聊天机器人,而是能在模拟器中过着真实日常生活、随时间成长的AI人(西部世界既视感)

他们构建了“节目负责人”智能体,并正在建造SHOW-1模型,以便为AI提供无限的故事。并且希望大家能观看自己在模拟世界中关注、构建或训练的AI的生活,可以把它看作是AI的真人秀。《老友记》这部剧让我们感觉好像看到了朋友一周的生活——它让我们与他们建立了联系。AI电视剧展示AI一周的生活也会让我们与那些AI建立联系。

这简直是AI版本的《楚门世界》,不知道里面的AI会怎么想。

这家公司正在与创作者合作,据说会在今年晚些时候宣布几个附带AI电视节目的原创IP模拟:

  • 一个太空探索模拟“奖金”
  • 一个讽刺硅谷的模拟“退出硅谷”
  • 一款有趣的侦探模拟游戏,名为《查理·木星》

他们认为单个聊天机器人终将失败,因为它们没有生活,也无法有同理心。没有人真的想和一个瓶中的大脑无休止聊天,这些AI应该拥有自己的生活, 因此我们需要AI的社会,应该更像《失控玩家》而不是《她》。

让每个人成为剧中主演

你可以通过上传自己的照片和声音来生成自己的角色,从而在剧中出演以你为主演的电视剧。这个真的很绝,我第一个想到的就是粉丝产业和二次元,每个成功的影视IP都有自己庞大的粉丝群体。在过去人们只能通过线下活动和周边产品来满足自己对这些作品的参与度。但是现在你可以直接进入剧里,跟你最喜欢的角色进行互动,并且无限生成剧情,这是一个永远不会完结的coserplay。

“我不仅想创作我喜欢节目的续集,还想出现在我喜欢的节目中。比如,我想在《星际迷航》中作为少尉角色出现,或者想在《南方公园》中出现。” Saatchi说。
Saatchi 认为娱乐公司可以采用这项技术赋权给粉丝,让他们基于自己喜爱的IP生成个性化内容。好莱坞曾看不起这样的尝试,甚至起诉粉丝。但他认为时代在变化,这可以成为新的收入来源。这种技术可以用于创造一个粉丝可以将自己置入喜爱节目、创作新剧集、并竞相创作史上最佳剧集的世界。Fable 正在向AI研究者开放该技术,以探索如何创建可以为其中的AI提供持续影视节目多模态。他们也承认在好莱坞编剧和演员举行罢工期间发布这项技术确实令人不安,并表示AI对好莱坞确实是一个真实存在的威胁,编剧需要对好莱坞使用AI获得明确保证。在《南方公园》剧集的免责声明中,Fable指出,名人配音是“生成得很差”,仅为“研究目的”。(非常强的求生欲啊😂)Saatchi指出,这项技术有多个方面。“ AI Showrunner 技术可以被工作室用来破坏艺术表达,也可以被编剧导演用来将原创脚本搬上银幕,无需巨额预算和团队。

生成式影视的未来

工作室和创作者将必须仔细考虑Saatchi所说的 “生成式影视” 的未来商业模式,在这种模式下,AI要为IP持有者、创作者/演员或粉丝创作电视节目。

“当涉及自己的IP时,创作者创作出一个IP,他们建立那个世界的模拟,并生成可以变现的节目,然后在YouTube上发布。” Saatchi说,“他们可以有一个频道,如果是一个非常好的节目,就可以把它卖掉赚钱。”

Saatchi认为IP所有者可以向人们出售类似Disney+的订阅。人们可以用迪斯尼角色创作自己的剧集。这可能比重复观看一部剧集二十次更令人满意得多。不过粉丝创作的内容可能不会拥有所有权,而只是通过支付费用来获得创作特权,但不能在付费墙外共享或从中获利。这在某种程度上对粉丝来说有点苛刻,因为有些粉丝已经能够通过创作自己的内容在流行中获利,比如《堡垒之夜》的粉丝。作为研究的一部分,AI“节目负责人”正在用于开发动画版本的人际剧情、太空战斗、医院危机和谋杀之谜。Saatchi认为随着AI技术的发展,未来可能出现由AI复制创作的世界。一旦AI接管创作,某部剧可能可以永远继续下去,无论是由工作室控制还是由观众定制剧情。研究人员展示了一个AI围绕《南方公园》角色创建的虚拟模拟项目,每周生成一集精彩集锦,展示了AI在电视剧创作方面的可能性。这个项目并不商业化,主要是为了探索技术的可能性。Saatchi表示,作为艺术家和讲故事者,发现AI的强大效果令人不安。他们希望以非商业的方式分享研究结果,以便编剧能够与工作室积极谈判,确保好莱坞在AI应用方面采取适当的规则。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

OpenAI推出ChatGPT安卓版本,畅享智能对话

随着科技的不断进步,人工智能成为了我们生活中不可或缺的一部分。ChatGPT作为一个领先的智能对话应用,一直致力于提供优质的交流体验和个性化的服务。

自去年11月发布以来,OpenAI公司的ChatGPT工具以惊人的速度吸引了大量用户,但最近的流量似乎有些不尽人意。为了改善这种情况,据OpenAI在7月22日在推特上宣布,本周将发布ChatGPT安卓版本,用户可以从即日起在谷歌商店预约下载。此外,根据媒体报道,微软也宣布了他们的AI工具Office 365 Copilot的定价。根据此定价方案,每位用户将需要支付30美元/月的服务费用,而这个价格将以大多数企业客户已经支付的价格为基础。

而早在今年5月份发布了ChatGPT的iOS应用程序版本,已经可以在iPhone和iPad等移动设备上使用。

OpenAI近日推出了安卓版ChatGPT,这无疑是一个重磅“大招”。如果安卓版ChatGPT能像iOS版本那样受到广泛欢迎,那么在接下来的几周内,我们将看到OpenAI的浏览量数据发生巨大变化。

安卓版ChatGPT的问世意味着更多的用户将能够在他们的安卓设备上体验到令人惊叹的人工智能聊天能力。对于OpenAI来说,推出安卓版ChatGPT是一个重要的战略决策。随着安卓操作系统在全球范围内的普及,这个决策将有助于OpenAI扩大其用户群,并进一步增强其在人工智能领域的影响力。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

Stability AI新模型FreeWilly击败Llama 2,性能媲美ChatGPT,登顶开源模型第一

7月21日,独角兽Stability AI联合CarperAI实验室发布基于Llama 2 70B微调的新模型FreeWilly 2,以及基于Llama 1 65B微调的新模型FreeWilly 1

在最新的 HuggingFace 的 Open LLM 排行榜上,FreeWilly 2拿下开源模型第一,平均得分比Llama 2高了4个百分点。

排行榜链接:https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard

模型地址:https://huggingface.co/stabilityai/FreeWilly2

模型地址:https://huggingface.co/stabilityai/FreeWilly1-Delta-SafeTensor

FreeWilly 模型采用了基于标准Alpaca格式,并经过监督微调(SFT)的全新合成数据集来进行训练。

根据官方的介绍,FreeWilly 2 在基准测试中表现优异,甚至有部分任务还超过了GPT-3.5。这样,FreeWilly 2 成了首个可以和 GPT-3.5 相抗衡的开源大模型,连前几天被称为「最强开源模型」的Llama 2也未达成。 

PART 01FreeWilly 数据来源

Stability AI在官方博客中表示,FreeWilly 模型的训练方法是受到微软论文《Orca: Progressive Learning from Complex Explanation Traces of GPT-4》的直接启发。所以 FreeWilly 模型的数据生成过程与它相似,但两者的数据来源却存在差异。

论文链接:https://arxiv.org/pdf/2306.02707.pdf

FreeWilly 的数据集包含了 60 万个数据点(大约是原始 Orca 论文使用的数据集大小的 10%),它是通过以下由 Enrico Shippole 创建的高质量指令数据集来启发语言模型生成的:

  • COT Submix Original
  • NIV2 Submix Original
  • FLAN 2021 Submix Original
  • T0 Submix Original

通过这种方法,Stability AI用一个较简单的 LLM 模型生成了 500,000 个示例,又用一个较复杂的 LLM 模型生成了 100,000 个示例。为了确保比较的公平性,Stability AI对这些数据集进行了仔细筛选,删除了来自评估基准的示例。尽管训练的样本量只有原始 Orca 论文的十分之一,但所生成的 FreeWilly 模型在各种基准测试中都表现出了卓越的性能,这也验证了合成生成数据集方法的可行性。PART 02FreeWilly 性能评估

为了评估 FreeWilly 模型的性能,Stability AI的研究人员采用了 EleutherAI 的 lm-eval-harness 基准,并加入了AGIEval基准。
lm-eval-harness 基准

lm-eval-harness 基准:由 EleutherAI 非盈利人工智能研究实验室创建,是一个专门为 LLM 进行 few shot 任务测评的工具,包括了 200 多种指标的测评。HuggingFace Open LLM 排行榜就使用了该基准来进行指标( ARC (25-s), HellaSwag (10-s), MMLU (5-s) 及 TruthfulQA (MC) )计算。

AGIEval 基准

AGIEval 基准:由微软创建,专门用于评估基础模型在「以人为本」(human-centric)的标准化考试中,如高考、公务员考试、法学院入学考试、数学竞赛和律师资格考试中的表现。

论文链接:https://arxiv.org/pdf/2304.06364.pdf
数据链接:https://github.com/microsoft/AGIEval

FreeWilly 1 和 FreeWilly 2 在 lm-eval-harness 基准上的评估结果如下:

FreeWilly 1 和 FreeWilly 2 在 AGIEval 基准上的评估结果如下(全部是 0-shot):

FreeWilly 1 和 FreeWilly 2 在 GPT4ALL 基准上的评估结果如下(全部是 0-shot):

从结果上看,FreeWilly 1 和 FreeWilly 2在多个方面都表现优秀,包括复杂的推理、理解语言的微妙之处,以及回答与专业领域相关的复杂问题(如法律和数学问题解决)。显然,开源模型正在进一步缩小与ChatGPT等最领先闭源模型的差距。

不过,虽然两个模型都是开放获取的,但官方表示,这两款模型都是研究实验,是以非商业许可的形式发布的,仅可用于研究目。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

ChatGPT:“顶流”技术图景下的文旅实操性

ChatGPT是OpenAI公司开发的自然语言处理模型,是AIGC(即狭义上的“生成式人工智能”)技术发展的重要表现,其通过海量语料库的训练,模拟人类语言习惯和偏好,并根据指令预测用户意图,进行内容生成。作为新一代AI明星产品,ChatGPT凭借突出的性能火爆“出圈”,正在引发相关的技术讨论、资本布局和落地探索。

2022年11月30日,美国OpenAI公司发布生成式AI工具ChatGPT,以两个月突破一亿用户的战绩,掀起新一轮AI科技热潮。ChatGPT及其背后的人工智能技术,在众多行业引发产业结构和劳动力技能的革新迭代。
上海市文化和旅游局对此高度重视,组织力量开展专项研究,从ChatGPT类技术模型的特征、功能及相关应用场景入手,聚焦文旅服务范式、文旅供给内容、文旅营销趋势、文旅产业格局、行业管理生态等层面,分析梳理ChatGPT顶流技术图景下文旅业或将迎来的改变和发展可能,并结合上海实际,对如何“拥抱顶流”进行思考,助推文旅领域抢占新机遇、布局新赛道、锻造硬核实力、实现高质量发展。
01
ChatGPT领衔的顶流技术风口解读
ChatGPT是OpenAI公司开发的自然语言处理模型,是AIGC(即狭义上的“生成式人工智能”)技术发展的重要表现,其通过海量语料库的训练,模拟人类语言习惯和偏好,并根据指令预测用户意图,进行内容生成。作为新一代AI明星产品,ChatGPT凭借突出的性能火爆“出圈”,正在引发相关的技术讨论、资本布局和落地探索。
一是技术层面,被认为是AI从“感知”到“认知”的技术奇点。相关专家观点认为,从底层逻辑而言,ChatGPT并非新技术,而是人工智能学习范式的升级,在“类人化”上迈出了重要一步,代表了人工智能从“规则式感知分析”迈向“拟人化认知互动”。ChatGPT具备突出的内容重组能力,区别于“搜索引擎通过关键词触发既有内容”和“决策式AI(如AlphaGo等)根据清晰规则进行智能决策”,ChatGPT更加擅长用归纳演绎的方式进行内容的创新生成,是数据信息的创新重组。ChatGPT具备惊艳的思维推理能力,ChatGPT虽然不具备自主心智和情感意识,但有着很强的语言理解能力,能够结合上下文语境进行逻辑推理,为用户带来更加流畅自然的人机交互体验。ChatGPT具备很强的拟人交流能力,ChatGPT在训练中引入了人类评价和反馈模型,很大程度上能够生成“贴近人类语言习惯和价值偏好”的内容,从而带来“类人化”的交流感受。
二是资本层面,作为“科技符号”正在引发现象级的布局浪潮。ChatGPT自发布以来,已经从“现象级的产品”进化为一种“科技符号”,掀起了ChatGPT类技术模型及相关AIGC赛道的竞技布局。例如,Google对标ChatGPT发布AI对话系统Bard;社交媒体公司Meta推出类ChatGPT语言模型LLaMA;百度发布国内首款类GPT大语言模型“文心一言”,并推出升级版“文心千帆”大模型平台;京东云旗下言犀人工智能应用平台宣布将推出产业版ChatGPT“ChatJD”;阿里达摩院正在研发“阿里版”ChatGPT;上海学术界和产业界已开发出Moss、“曹植”和“魔力写作”等多个大语言模型。截至目前,大部分互联网头部均已官宣加入这场“人工智能竞赛”。
三是应用层面,强大的自然语言交互功能引起广泛的落地探索。ChatGPT问世以来,在信息搜索、文本生成、智能聊天、翻译问答、自动文摘、智能编程等方面的交互表现突出,搜索引擎、企业办公、在线教育、文旅服务、游戏娱乐、新闻传媒、生活电商等领域探索场景落地步伐也在加快。例如,微软发布集成ChatGPT/GPT-4技术的新版必应(bing),打造AI搜索引擎体验,推出GPT-4技术驱动的Copilot,开启AI协同办公;Quizlet结合推出AI导师Q-Chat,提升在线学习体验;Expedia、KayaK、OpenTable等OTA平台成为ChatGPT插件功能的第一批启用者;网易将推出游戏版ChatGPT,利用AI赋能游戏NPC角色创作;澎湃新闻等媒体机构,宣布成为“文心一言”首批生态合作伙伴;生鲜电商Instacart在杂货配送、搜索问答中嵌入ChatGPT技术。
然而,人工智能是把双刃剑,随着各种功能应用展开,ChatGPT类技术模型本身存在的“信息失实、算法偏见、可解释性不足”等缺陷及其带来的“数据信息泄露、意识形态操控、诱发网络犯罪、内容生成侵权”等社会伦理和治理问题都在显现。目前已有多国政府和企业禁用和调查ChatGPT软件,如何“趋利避害”应当成为未来应用探索的重点。
02
ChatGPT类技术图景下的文旅可能
就当前节点而言,文旅及与文旅密切相关的游戏、电商等领域正成为ChatGPT类技术模型落地应用的首要场景。
(一)催生文旅服务发展新范式
一是信息获取服务将被颠覆。当下市场,游客主要通过OTA、小程序、社交APP等旅游应用获取信息,需要花费大量精力对碎片信息甄选筛别。而ChatGPT类技术模型凭借强大的信息检索能力和优质的内容生成模式,将打破这一固有模式。例如,随着Expedia、Kayak、OpenTable等OTA平台插件接入ChatGPT,游客可以通过ChatGPT,同时获取网站集成信息和智能筛选信息。
二是智能客服场景有望优化。作为人工智能应用的细分赛道,智能客服在文旅领域早有布局。但结合C端评价来看,用户体验参差不齐,看似“高效”但常常“答非所问”。ChatGPT类技术模型能够学习模拟人类语言,联系上下语境进行推理,大大提升客服的自动化、精准度和交互性,咨询投诉等文旅服务有望更加通畅。ChatGPT类技术模型在多语言支持方面,也将为国际旅游多语种服务提供新的思路。
三是智能旅行助手或将出现。ChatGPT类技术模型可以根据用户需求、历史行为等向量,为用户精准推荐个性化商品。具体到文旅领域,假定旅游内容平台和交易平台的信息壁垒完全被打破,基于ChatGPT类技术的精准“货找人”模式将会出现。文旅市场主体可以通过嵌入ChatGPT类技术模型,开发虚拟旅行助手,匹配用户偏好,为游客提供个性化行程创建、旅游线路规划、最优消费组合建议。
(二)赋能文旅供给内容新升级
一是文旅产品迭代将会加速。在可联网交互的模式下,ChatGPT类技术模型将通过文本、图片、视频等生成方式,对各类信息进行演绎创作。应用到文旅领域,就意味着可快速汇集分析“网红产品、市场趋势、消费爆点”等文旅讯息,使得旅游产品、旅游场景的研发变得更为简单便捷,带来文旅产品的加速迭代。比如,可以基于目的地的产品、市调及竞品情况,利用ChatGPT类技术模型,研发全新的旅游线路,也可以利用ChatGPT类技术模型的绘画视频生成功能,将非遗故事、潮流设计等内容融入旅游新文创研发。
二是文旅产品玩法有望出新。以ChatGPT为代表的AI技术突破将大幅改善文旅内容的体验方式,催生出更沉浸、更交互、更破壁的文旅玩法。以文博场馆为例,在智能导览系统中接入ChatGPT类技术模型,游客能根据各自兴趣点,以交互问答方式获取文物背后的故事和历史,从而大大拓展游览体验的外延。再如密室剧本杀场景中,利用ChatGPT类技术模型对虚拟NPC进行拟人化训练,则会赋予玩家更加有趣的互动体验和更加真实的沉浸体验。
(三)引领文旅营销发展新趋势
一是文旅品牌露出将面临新的算法规则。ChatGPT类技术模型从庞大数据库中筛选和组织最合适答案的智能搜索模式,将打破传统搜索引擎的信息汇集呈现方式。当ChatGPT类技术平台成为文旅信息总入口,比起广告植入和海量资讯投放,如何让ChatGPT检索到文旅品牌显得更为重要。生成式AI模型成为基础服务或流量入口的情境下,对标搜索引擎时代的SEO,可能会催生新的AEO(AI Engine Optimization)赛道,即基于AI学习算法规则设计标准的信息外露方式,使得文旅品牌信息更好地被ChatGPT发现并推荐给用户。
二是数字人文旅营销场景或会加速打开。在ChatGPT类技术模型的多模态功能加持下,虚拟数字人将具备更广泛的知识储备和更好的问题解决能力,互动性、趣味性和逻辑性都将有所增强,会给虚拟文旅代言、虚拟文旅直播、虚拟旅游推介等带来更多的想象空间,未来甚至有可能重塑KOL等网红生态。目前相关雏形应用已出现,例如,元境科技在虚拟数字人中嵌入ChatGPT类技术模型,并在TikTok落地跨境电商直播、虚拟主播互动等场景。
(四)带来文旅产业格局新变化
一是在线旅游市场集中度可能进一步增强。头部OTA企业在旅游场景、旅游交易等方面拥有丰富且优质的信息沉淀,短期内会成为ChatGPT类技术公司或平台积极招揽的对象,能够在流量市场上占据先发优势。同时,丰富的语料资源,还会使得头部OTA在“投喂、训练”ChatGPT类技术模型中具有一定话语权。一定时期内或者说短期内,市场流量向头部OTA平台集聚的态势将会凸显。
二是文旅的专业化和细分化将成为大趋势。未来如果ChatGPT类技术模型嵌入交互成为新的互联网流量入口,行程定制、旅游咨询、文创研发、旅游营销等领域的同质化可能加剧,这将倒逼文旅市场主体在专业化和细分化上下功夫。例如,旅游规划咨询公司、私人定制旅游公司可能会朝着提升专业策划能力、孵化自有IP品牌等专业化方向发展;在线旅游企业可能为了在流量大盘中增加露出机会,选择深耕自身具有语料优势的细分垂类领域。
三是数字文旅赛道或将迎来新的发展拐点。ChatGPT类技术的发展,代表着强人工智能方向的新突破,将会给在线旅游、数字文创、在线文博、文旅数字人等数字文旅细分赛道注入新动能,带来文旅产业结构的优化和重塑。例如,文旅数字人营销场景的加速打开,将推动更多数字人企业跨界接入文旅领域,延长文旅产业链条。再如,ChatGPT类技术模型在艺术创作和内容交互上的巨大想象空间,也会加快文旅数字藏品的研发和相关应用场景的拓展。
(五)引发文旅行业治理新变革
一是文旅数字化管理将迎来新的契机。从相关调研结果看,囿于数据融通壁垒和资金技术压力,文旅市场主体在推动文旅数字基建和文旅场所智慧化管理方面投入不高,较为依赖政府推动。ChatGPT类技术模型可能会倒逼市场主体加快推进“文旅新基建”,从而为数字管理升级提供新的可能。例如,ChatGPT类技术模型作为智能助手嵌入旅游场景,为实现游客的实时交互,将会催生线下传感器的布设和数据信息共享模式的构建。
二是文旅行业监管将面临新的形势。ChatGPT类技术模型存在着各方面的风险与隐忧,一旦落地应用,也将会给文旅监管带来新的风险挑战。比如,ChatGPT类技术模型场景下,文旅IP产品、文旅策划方案等相关内容的侵权风险增加,需要在知识产权层面进行界定和规范。再如,目前国外的ChatGPT类技术模型在语料训练过程中,带有明显立场偏向,而旅游作为文化传播的载体,如何规避意识形态风险也将成为监管的重点。
三是文旅人才建设将进入新的阶段。ChatGPT类技术模型的成熟发展,会推动生产力的发展进入到人机协同时代,将会对现有的人才结构和人才培养体系产生影响。未来一些简单、重复、机械的基础服务工作,都会被人工智能所取代,文旅人才的培养需要转入“激活创新创意”的专业化轨道。同时,ChatGPT类技术模型的成熟应用,还会在AI提示词设计、AI营销算法等领域催生新的职业需求,“AI+文旅”的复合型人才将成为未来文旅发展的重要支撑。
03
ChatGPT类技术模型的文旅应用思考
文旅产业是流量型经济,链接和拥抱以ChatGPT为代表的AI技术将是大势所趋。上海作为全球科技创新中心,在构建“AI+文旅”模式方面自带基因优势,并具标杆意义。基于此,调研组结合ChatGPT类技术图景下的文旅发展趋势,提出四方面思考建议。
一是加强相关应用支持政策的预研储备。密切跟踪ChatGPT类技术模型的发展现状和未来趋势,结合现有产业应用领域的做法与经验,研判未来文旅应用场景中可能存在的共性问题和普遍诉求,做好相关支持性政策的研究储备,搭建上海文旅AI产业应用政策工具箱。重点围绕文旅“新基建”布设、文旅ChatGPT类模型研发支持、文旅数据语料共享机制构建等内容,从项目申报、资金扶持、基建补贴、机制保障等方面,落实好相关政策的前瞻布局。
二是开发基于ChatGPT类技术的文旅场景。结合上海文旅资源优势和产业发展现状,支持市场主体探索开发具操作性、可信性和优质人机交互体验的人工智能文旅场景。例如,引导数字酒店、数字景区(点)等主体接入ChatGPT类技术模型,优化人工智能客服场景;推动ChatGPT类技术嵌入建筑可阅读、海派城市考古和文旅场馆的语音导览系统,探索开发交互式语音导览体验;充分发挥上海数字内容产业优势,鼓励开发ChatGPT类技术加持的文旅数字人营销场景等。
三是探索政企深度协同的文旅监管模式。ChatGPT类技术模型嵌入文旅基础服务的情境下,文旅市场主体作为数据语料的拥有者,在行业监管中的角色和功能将会进一步增强。未来,上海可立足现有“一网统管”优势,深度联动市场主体,聚焦以ChatGPT为代表的AI文旅应用,构建“行业标准指导+企业规范管理”的政企协同监管模式。聚力政府监管服务,围绕文旅知识产权评估与鉴定、ChatGPT类文旅生成内容抽检等方面,制定相关的行业管理标准;聚焦企业治理,督促引导文旅市场主体制定ChatGPT类技术模型应用规范,确保文旅内容可靠、文化导向正确、交易信息安全。
四是孵化“链接未来”的新文旅人才队伍。结合ChatGPT类技术模型应用场景下,文旅从业结构的专业化、细分化、创新化发展趋势,依托上海丰富的互联网人才资源,充分发挥上海职业人才培养机构聚集和高校跨学科资源丰富等方面的优势,加快推进“链接未来”的新文旅人才培养和孵化。以产学研结合的思路,加快建设新文旅人才孵化基地,积极搭建“AI+文旅”职业教育服务平台,实施“AI+文旅”复合型人才培养工程,努力推动基于旅游新职业的教育体系改革,为人工智能时代的文旅人才转型做好铺垫。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

苹果推出“Apple GPT”,加入AI聊天机器人竞赛!

根据彭博社的报道,苹果正在积极测试一项名为”苹果GTP”的技术。这个平台的目标是开发生成式AI工具,以追赶OpenAI,而OpenAI是一家以AI智能为核心的研究实验室。据知情人士透露,苹果已经搭建了开发大语言模型的框架,并且已经开发了自家的聊天机器人。然而,目前尚不清楚苹果如何将这项技术转化为实际的产品。

苹果GTP的用户界面与OpenAI的AI GTP相似。背后的大语言模型框架名为Ajax,它基于谷歌的机器学习框架Google Jax,并在Google Cloud云端运行。这意味着苹果正在利用谷歌的技术和云计算能力来支持他们的AIGTP开发。

 

约翰 詹南德里亚(John Giannandrea)是苹果的AI智能负责人,克雷格 费德里吉(Craig Federighi)是软件工程负责人,他们是这个项目的负责人。这表明苹果对AI智能技术的发展非常重视,并且有意投入资源来推动这个领域的创新。

 

苹果公司一直以来都是技术创新的领头羊,在AI智能技术的发展上也不例外。作为AI智能负责人,约翰·詹南德里亚一直在致力于将AI智能技术应用到各个领域,包括人工智能、自然语言处理、机器学习等。他的加入,对于苹果公司AI智能技术的发展具有重要的意义。

 

而软件工程负责人克雷格·费德里吉,则是负责苹果公司软件开发工作的重要人物。他领导的团队一直在不断推动软件技术的创新与发展,包括iOS、macOS、watchOS、tvOS等多个产品的开发和升级。他的加入,也将为苹果公司的AI智能技术发展提供强有力的支持。

 

可以预见的是,苹果公司在AI智能技术的发展上将会迎来新的机遇和挑战。作为全球最具创新力和影响力的科技企业之一,苹果公司将会继续投入资源,推动AI智能技术的创新和发展,为人们创造更加智能化、便利化的生活体验。

 

虽然苹果GTP的具体细节尚未公开,但这一消息对苹果股价产生了积极的影响。股价在今天早盘略微下跌,但随后迅速拉升。午盘时,苹果股价达到历史最高点198.23美元,涨幅超过2.3%。这表明投资者对苹果在AI智能领域的发展前景持乐观态度。

 

要注意的是,这一消息目前尚未有官方确认。然而,苹果一直以来都在致力于AI智能技术的研发和应用,所以若这个消息属实的话,将是苹果在AI智能领域迈出的重要一步。我们期待苹果未来能够进一步推出基于这项技术的实际产品,为用户带来更多智能化的体验。

刘永好:企业必须积极跟进AI技术,不然随时可能被淘汰

新希望集团董事长刘永好在接受《中国企业家》杂志采访时表示,当OpenAI公司发布的相关消息刚传到国内,就已经召集公司技术部门,强调重点研究,“赶紧用上”。深感新鲜的同时也发现,经过大数据训练后,现在的人工智能所能解决问题的高度和广度,已远超从前,更重要的是,它正在迅速改变世界。

“对于食品企业,鸡肉、猪肉的分割、包装、筛选、搬运都是一个劳动密集型企业,我们新希望十几万员工,其中很多人都在做这些最基础的工作,简单又初级,尽管有一定的自动化,但本质还是重复劳动。”刘永好认为, “如果AI技术落地,一个非常大的变化是,多数工作都可以用智慧大脑指挥下的智慧机器人来实施。那人类做什么?我们必须考虑这样的事。这就是硬核科技所带来的时代进步,未来企业必须对这个领域有所认识、积极跟进和推动,否则被淘汰了都不知道。那个时候整个社会都将会变,人类有可能去做更有情怀的事,做更多享受的事,做更多能够驾驭理想的事,做更多飞跃的事。就像马斯克在考虑如何到火星上定居,有人在考量用什么方式能活到240岁。”

谷歌开发代号为“Genesis”的人工智能工具,可撰写新闻文章和制作头条新闻

谷歌正在开发一种代号为“Genesis”的人工智能工具,该工具将能够根据当前事件的信息来创作新闻内容和制作头条新闻。谷歌将该项目描述为一种“负责任”的记者助手,但这也引发了一些媒体的担忧和质疑。

 

谷歌与主要新闻机构接洽

据《纽约时报》援引匿名消息人士的报道,谷歌已经向《纽约时报》、《华盛顿邮报》和新闻集团等主要新闻机构的高管展示了Genesis的演示。谷歌向他们宣传其人工智能工具的优势,例如可以帮助记者提供标题或不同的写作风格的选项,以及可以提高记者的工作效率和生产力。

 

谷歌强调其机器人不会取代目前雇用的编辑和数字记者

谷歌发言人詹妮·克里德在接受《纽约时报》采访时表示,该公司正处于“探索可能提供人工智能工具来帮助记者工作的想法的早期阶段”。她说,这些工具不能取代记者在报道、创作和事实核查文章中的重要作用。她还说,谷歌的目标是让记者有选择使用这些新兴技术的权利,就像谷歌在Gmail和Google Docs中为用户提供辅助工具一样。

 

一些参加演示的高管表示,该产品的计划“令人不安”

然而,并非所有参加演示的媒体高管都对Genesis感到兴奋或信任。《纽约时报》援引两位高管的话说,他们认为Genesis似乎忽视了撰写“准确而巧妙的新闻报道”所需的人力,并担心该工具可能会导致记者技能下降或误传信息。另一位高管则表示,他对Genesis感到“令人不安”,并认为谷歌应该更加透明地公开其技术细节和目标。

部分媒体高管对Genesis的开放态度

与此同时,也有一些媒体高管对Genesis持更加开放或乐观的态度。他们认为Genesis可能是记者潜在的“私人助理”,可以通过处理基本任务来帮助减轻他们的工作量。他们还指出,谷歌并不是唯一一个在开发人工智能新闻工具的公司,其他一些媒体公司也已经在使用类似的技术来生成内容或分析数据。

谷歌首席执行官桑达尔·皮查伊也曾在今年早些时候表达过他对Genesis的愿景。他在接受《连线》杂志采访时说,他认为人工智能可以帮助记者“更好地理解世界”,并提供“更多的洞察力和更多的创造力”。他还说,他希望Genesis能够成为一种“协作”的工具,而不是一种“竞争”的工具。

 

谷歌表示,其人工智能工具并不是要取代记者的工作

尽管谷歌对Genesis的开发和推广充满信心,但该公司也意识到了这种技术可能引发的争议和担忧。谷歌发言人克里德在接受《纽约时报》采访时强调,该公司并不是要用Genesis来取代记者的工作,而是要与他们合作,为他们提供更多的选择和机会。她说,谷歌一直在与新闻出版商合作,特别是小型出版商,以探索如何利用人工智能技术来帮助记者。

谷歌对Genesis的开发和推广还处于早期阶段,其对新闻行业的影响还有待观察。然而,在这种技术被广泛采用之前,有必要了解其潜在的风险和收益,并保持警惕和批判性的态度。

通用人工智能如何赋能千行百业?业界热议大模型发展路径

随着以ChatGPT为代表的通用人工智能大模型的出现,大模型逐渐成为驱动社会生产力、生产效率发生巨大变化的新引擎。在日前举行的2023(第二十二届)中国互联网大会“大模型的发展路径”论坛上,与会行业专家围绕“大模型时代,通用大模型、行业大模型及相互协同的发展路径”等人工智能大模型领域热点问题展开了讨论。

需加快建立人工智能开源开放生态

针对通用人工智能的定义及发展现状,北京智源人工智能研究院院长黄铁军指出,“通用人工智能”往往对应GAI(General Artificial Intelligence)和AGI(Artificial General Intelligence)两个概念,GAI是指(具有)通用性的人工智能,AGI严格意义上叫做人工通用智能。两者的含义具有根本性差别,通用人工智能强调的是通用性,而AGI强调的是全面超越人类的一种人工智能。“今天我们说的大模型,实际上是指从通用人工智能向真正超(越)人的人工智能的过渡阶段。”

“一个大语言模型是把人类的所有语言,主要是书面语言,训练成一个千亿、万亿的神经网络,从而具备了融会贯通的能力。”黄铁军表示,不同于传统IT系统的确定性,如今真正的智能已经出现,“从某种意义上讲,这种模型背后有其自己对世界模型空间的认知”。

2022年11月,ChatGPT一经推出便掀起大模型发展的热潮,迄今国内已有八十余个大模型公开发布。

针对当前通用大模型研发应用现状,黄铁军强调,要建立开源开放的生态。“从技术体系演进来看,英特尔联盟在技术上主导了PC时代,移动互联网时代iOS和Android两个生态主导了迄今为止手机的生态。进入智能时代,这样的生态也一定会出现,且正在出现。”

黄铁军指出,目前国内存在的一个问题是从“大炼模型”变成“大炼大模型”,造成严重资源浪费。“一个大模型的聪明程度、智力程度,甚至能不能代替科研人员发现新的物理定律,是我们追求的。”他认为,对中国而言,很多企业机构都能训大模型,关键在于大家要通过开源方式联合迭代创新,(推动行业发展)往前走。

大模型落地行业需解决安全、可信等问题

早在今年2月13日,北京市经济和信息化局正式发布《2022年北京人工智能产业发展白皮书》,提出全面夯实人工智能产业发展底座。支持头部企业打造对标ChatGPT的大模型,着力构建开源框架和通用大模型的应用生态。

4月28日召开的中共中央政治局会议提出,“要重视通用人工智能发展,营造创新生态,重视防范风险”,为通用人工智能行业发展指明了方向。

如何让通用人工智能赋能各行各业的发展?现阶段还面临哪些挑战?未来有哪些发展路径?

华为云大数据与AI总经理李伟指出,不同于传统AI时代AI技术分支众多,业内做了很多小模型,Transformer架构的提出,为业界带来这样的机会,即通过预训练、超级大规模数据让大模型具有极高的泛化能力、海量数据和强大的拟合能力,从而突破精度的限制,一个大模型可以覆盖多个场景。

“早期的视觉、语音、语义、生成能力等海量离散小模型逐渐汇聚成了大模型。当前To C基础能力应用拓展到To B通用场景能力”,李伟同时表示,通用大模型落地行业存在三个挑战,一是大模型通用性强,但专业能力是比较弱;二是大模型知识虽然多,但技能不足;三是数据的安全合规问题,数据是企业核心资产之一,大模型可以有效地存储和挖掘知识,但训练和使用大模型需要保障企业数据安全合规。

中国移动集团级首席科学家冯俊兰也指出,大模型相关理论核心技术在不断突破,智能水平大幅提升,同时可控性、安全性、可信性是亟需攻关的。“攻关思路是依托现在泛在的算的资源、网的资源,在开放环境中对AI能力进行灵活地配置、调度部署,以满足日益复杂的需求。”

“每一个行业总体来看都是一个非常复杂的系统,怎么能够在这样的复杂系统去真正集成好(数据、知识和各种系统),现在的大模型还有很大挑战。”冯俊兰认为,大小模型协同、人机协同将是未来行业发展的路径。

针对大模型如何进入千行百业,中国信通院云计算与大数据研究所副所长魏凯表示,未来大模型发展一个路径是从基础模型到行业模型的路径,第二个是模型即服务的发展。“未来可能是大模型驱动小模型,模型即服务可能是相互嵌套的”“一个模型调用另用一个模型,把这些模型缝合起来、串联起来、并联起来完成一个复杂的场景具体任务”。

北京智源人工智能研究院副院长、总工程师林咏华表示,通用大模型是行业大模型重要的基础。首先,通用大模型是知识体系的基础,不能强求通用大模型里面包含所有行业的专业知识。其次,通用大模型或者基础模型是下游行业模型很重要的能力框架。同时,通用模型自身发展需要跟行业模型进行相辅相成的配对或者迭代。

马斯克携初创企业重回人工智能赛道,头部玩家大手笔引AI垄断担忧

[环球时报驻美国特约记者 张思思 环球时报特约记者 甄 翔]马斯克携初创企业xAI重新杀回人工智能(AI)赛道,为本已沸腾的人工智能产业竞争再添一把“旺火”。在OpenAI成功推出人工智能聊天应用ChatGPT,并获得巨额融资后,微软、谷歌、苹果等美国科技巨头都在大张旗鼓投入人工智能技术。少数头部玩家激烈“内卷”引发人工智能巨头垄断的质疑。马斯克表示,创立xAI就是为阻止人工智能领域出现“一家独大”的局面。

各大巨头加速卷入竞争

不仅是马斯克,美国科技巨头都在瞄准OpenAI,微软、谷歌、亚马逊等已大张旗鼓投入人工智能技术。据美国科技网站The Verge 19日报道,Meta公司将旗下的大语言模型LLaMA 2开源,商业和研究机构可免费使用,此举意在跟OpenAI旗下免费使用的人工智能应用展开正面竞争。与此同时,美国芯片巨头高通公司宣布将同Meta公司合作,从2024年起为笔记本、手机和头戴设备提供LLaMa支持,从而实现人工智能应用无需云端服务支持。

其他巨头也在高歌猛进。微软的一种生成式人工智能已经打破了ChatGPT的速度纪录。上个月,谷歌发布了一套人工智能工具,包括电子邮件、电子表格和各种文本等。此前被认为稍显落后的苹果19日也被彭博社爆出在开发“阿贾克斯”人工智能技术,并创建聊天机器人“苹果GPT”。该消息发布后苹果股价一度蹿升2.3%达创纪录的198.23美元。

“当前美国的几家科技巨头正在围绕人工智能展开激烈竞争。”清华大学教授、新闻学院元宇宙文化实验室主任沈阳对《环球时报》记者分析称,人工智能大模型竞争分为几个层面竞争,第一个层面是芯片层面,例如高通和Meta的合作;第二个层面是操作系统层面,这里主要涉及微软、谷歌和苹果,其中微软既入股OpenAI,又与Meta合作,谷歌主要依靠自身的安卓系统,苹果目前稍显落后,但也会依靠自己的系统;第三个层面是应用软件的竞争,包括社交媒体应用,以及office软件应用;此外还有在内容层面上的竞争。

“被两三家实体垄断的风险”

有分析注意到,人工智能产业的头部竞争,已经成为硅谷巨头的内部游戏。马斯克新成立的xAI将从谷歌、微软、OpenAI和特斯拉招募有行业经验的人士,这不禁令人产生了未来头部AI人才均“出自同门”的担忧。

“科技巨头的垄断是一件坏事,人工智能巨头的垄断则会更糟。”《纽约时报》本月以此为题发表的分析文章认为,OpenAI、微软、谷歌等少数头部企业在“塑造人工智能主导的未来”方面占据很大领先优势,这不是好消息。

报道称,目前谷歌和微软领先其他竞争对手。鉴于人工智能可能会对就业、隐私和网络安全造成巨大伤害,在没有外部强制保护的情况下,这些公司取得的人工智能进展令人担忧。从20世纪90年代开始,互联网提供了更低成本的表达意见的方式。但随着时间的推移,沟通渠道集中到了包括脸书在内的少数人手中。

xAI旗下员工凯尔·科希克在社交媒体上参加对话活动时,直言人工智能已经出现垄断现象。凯尔·科希克此前曾就职于OpenAI,他认为人工智能面临的最大风险是整个产业“被两三家实体所垄断”,解决这个问题的办法就是引入竞争。

“人工智能领域竞争的好处主要有以下几点:一是多家机构寻求不同的科研发展路径,会推动科技的多样化;二是多家机构在竞争中能相互促进,推动各机构不断强化科技实力,同时也能相互监督,面临瓶颈时能被及时发现;三是通过竞争能加速找到高效的人工智能商业化途径。”凯尔·科希克这样分析。

人工智能模型培训需要海量资本投入,这导致有实力加入人工智能赛道的机构有限。国际高科技产业研究机构集邦科技在报告中分析称,OpenAI训练人工智能产品时,需要数万颗英伟达A100芯片的算力,而这款高端芯片的售价在每片1万美元左右,且供不应求。

国盛证券在一份人工智能产业分析报告中估算,ChatGPT训练一次的成本约为140万美元,对于一些更大更高级的人工智能模型,训练成本介于200万至1200万美元之间。今年年初,平均每天约有1300万独立访客使用ChatGPT的数据,对应的芯片需求为3万多颗A100芯片。ChatGPT综合初始投入约为8亿美元。如果计算用电成本,投入金额还会进一步扩大。此外,云服务也是人工智能重要“烧钱”领域。

在软硬件之外,企业日常运营、人才招聘,OpenAI也都要承担不小的支出。公司一名普通软件工程师年薪资水平在20万至37万美元,主管级别在30万至50万美元。

在美国在线问答平台Quora上,不少业内人士在分析人工智能垄断危害。他们透露,今年2月OpenAI旗下的ChatGPT刚刚开始大火不久,一度出现短暂服务掉线,导致全球用户无法使用。有分析认为,如果未来人工智能服务高度集中在一两家企业,一旦垄断企业服务停机或掉线,将给全球带来灾难性冲击。

马斯克的“野心”也受到质疑

沈阳对《环球时报》分析称,马斯克的重新入局对人工智能产业是一个利好,但是真正的目的恐怕并没有“反对巨头垄断”那样高尚,马斯克成立xAI有很强烈的经济动机,否则也不可能维持尖端团队。据美媒透露,马斯克对xAI招贤纳士提出十分诱人的经济回报,如果马斯克对xAI的200亿美元估值最终得以实现,那么现在入伙的研发人员收益可达数亿美元。

有分析认为,马斯克创办或接手一家企业,往往源于他对该领域企业运作情况的不满。作为OpenAI的早期投资人,马斯克首次涉足人工智能领域的原因是认为谷歌联合创始人拉里·佩奇“没有足够认真地对待人工智能安全”。然而,当OpenAI取得一系列突破,在2022年推出ChatGPT之前,马斯克选择离开OpenAI,理由是OpenAI已变得“为利润而贪婪”。他还认为,作为上市公司,谷歌和微软都受到外界指令对公司决策的影响。

马斯克宣称新成立的xAI是一家非公开交易的公司。有网友在社交媒体上提出,马斯克已经拥有太空探索技术公司、特斯拉、推特、脑机接口等一系列科技企业,随着xAI的宣布,他还有多大的商业野心?

据美国媒体报道,马斯克的商业版图正再一次扩大,从汽车到太空,从卫星到推特,现在又扩展到人工智能。xAI将使用推特的数据来训练人工智能系统和产品,而且该新人工智能将与特斯拉在“芯片前沿”和“人工智能软件前沿”方面进行合作。

武汉人工智能企业数年均增幅超30%

湖北日报讯 (记者张倩倩、通讯员张寻)7月19日,武汉市高新技术产业协会发布《2023年武汉人工智能企业库》,相关数据显示,截至2022年底,武汉市新增168家人工智能企业,总数达到650家,增幅达35%。

据统计,入库企业中,规上企业达224家,占比34.5%,国家级专精特新“小巨人”企业61家,占全市总量19.7%,另有49家营收过亿元企业、13家上市企业、141家省级专精特新企业、4家独角兽企业,企业平均有效发明专利达14件,主要指标同比有大幅提升。

产业链分布方面,66%的入库企业为人工智能应用层企业,较2021年上升5个百分点;区域分布方面,74%的企业集中在东湖高新区和武汉经开区,其中东湖高新区企业数占比59%,武汉经开区占比15%。

近年来,武汉市人工智能企业数量年均增幅保持在30%以上,产业发展驶入快车道。武汉市高新技术产业协会产业研究院相关负责人分析指出,武汉人工智能计算中心、武汉超算中心“双中心”提供了低成本优化算法的有效路径;武汉人工智能研究院、北京大学武汉人工智能研究院、武汉市数字经济发展研究院三大新型研发机构共同发力,紫东太初多模态大模型、江城太素多模态训练数据集等广泛赋能,较大缩短了企业人工智能开发周期;《武汉市新型智慧城市“十四五”规划》等政策支撑,经开区人工智能科技园、融创智谷等人工智能园区的集聚效应也起到显著推进作用。

人工智能10大趋势

【趋势一】统一未来:多模态模型加速文本、图像和视频融合

多模态模型:多模态模型能够处理视觉信息、文本信息、听觉信息等多元化数据,可以对不同表现形式的信息进行融合理解,进一步提升大模型的迁移学习能力,是人工智能全面理解真实世界的重要一步。发展情况:文本、语音、图片等单模态人工智能模型已经相对成熟,大模型正在朝着多模态信息融合的方向快速发展。从CLIP的诞生再到GPT-4的图像处理能力,图文多模态技术已经取得了显著的进步。大模型不止满足文字和图像,开始向着音频、视频等领域拓展。

未来展望:未来模型将面对更加复杂多样化的交互场景,更加注重各种形式的信息融合,多模态技术将在智能家居、智慧城市、医疗诊断、自动驾驶等方面打开全新的应用空间。

多模态模型迭代历程

【趋势二 】逾越虚拟边界:具身智能成为AI发展新形态

具身智能:具身智能是可以和物理世界进行感知交互,并具有自主决策和行动能力的人工智能系统。具身智能中的智能体能够以主人公的视角感受物理世界,通过与环境产生交互并结合自我学习,从而产生对于客观世界的理解和改造能力。发展情况:斯坦福大学教授李飞飞将具身智能列为计算机视觉未来的关键发展方向,并将其称之为人工智能研究的“北极星”。现阶段来看,谷歌推出RoboCat大模型,英伟达推出Nvidia VIMA,具身智能已经成为AI龙头企业竞相争夺的高地。

未来展望:通用人工智能与机器人产业正处在快速发展、互相融合促进的战略机遇期,作为两大领域交叉的核心应用,具身智能有望在未来取得快速发展。具身智能将促使智能体具备自主规划、决策、行动、执行等能力,实现人工智能的能力进阶。

【趋势三】大模型智慧火花:走向通用人工智能的途径愈发明晰,脑机接口创造新的交互方式

通用人工智能(AGI是指具有像人类一样的思考能力,可以适应广泛的领域并解决多种问题的机器智能,AGI是人工智能研究的重要目标之一。狭义人工智能是指当下已取得显著进展但局限特定领域的人工智能,如语音识别、机器视觉等。我们正处于狭义人工智能相对成熟、通用人工智能曙光乍现的阶段,目前以GPT-4为代表的自然语言大模型被认为是通往通用人工智能的重要潜在路径,OpenAI CEO萨姆·奥特曼(Sam Altman) 表示,AGI时代可能很快就会到来,未来十年内行业可能会拥有超强的AI系统。

人类与人工智能之间的沟通方式也在不断升级,脑机接口有望成为下一代人机交互方式。当前,脑机接口技术正在突破人类的生理界限,不仅为残障人士提供了前所未有的可能性,而且有望成为下一代的人机交互方式。

【趋势四】数据的力量:海量数据带来模型能力涌现,高质量数据提升模型性能

深度学习的进步建立在以更大的模型处理海量数据基础之上。GPT-1模型从1.17亿参数上升至GPT-3的1750亿参数,模型效果取得了显著突破,同时还有能力的涌现。但是模型参数量的增大带来算力需求的激增,模型架构和参数量提升带来的收益正处于递减状态。

阿伯丁大学、麻省理工大学等研究机构的一项研究显示,高质量的语言数据将在2026年耗尽,低质量的语言数据和图像数据将分别在2030 -2050年、2030 -2060年间枯竭。以数据为中心的人工智能更加专注于数据的价值,进一步推动AI模型的性能突破。

斯坦福大学吴恩达教授提出二八定律:80%的数据+20%的模型=更好的AI。以数据为中心的策略可以解决数据样本不足、数据偏差等问题,高质量数据集成为推动模型性能进一步提升的关键要素,高质量的数据处理、数据标注服务以及完善的数据收集和评估体系的价值将进一步凸显。

【趋势五】数据中心的AI变革:智算中心成为关键基础设施

云计算是当前重要的AI算力提供方案,AI服务器市场获得迅猛发展。根据TrendForce数据,2022年全球AI服务器的出货量占整体服务器比重约1%,随着大模型训练侧和推理侧的需求爆发,AI算力资源需求预计将呈指数增长。根据IDC数据,预计未来5年中国智能算力规模的年复合增长率将达52.3%,全球价值万亿美金的数据中心存量市场将从通用计算逐步过渡向AI计算。

云计算正从CPU为中心的同构计算架构向以CPU+GPU/NPU为中心的异构计算架构深度演进。预计,大模型带来的GPU存量空间将从2023年的277亿美金上升至2025年的1121亿美金,以GPU为代表的AI计算资源中短期将处于供不应求的状态。

随着专有领域的计算需求提升,AI芯片追求更高的性能和更低的功耗,芯片的多样性和生态丰富性将不断提升。部分头部互联网厂商将着力推进AI芯片的自主研发,如谷歌着力打造专注深度学习的TPU,同时不断丰富其AI生态布局。

【趋势六】大模型C端角色:个人智能助理与新一代的流量入口

大语言模型将成为个人智能助理。大模型目前具备接入互联网、进行内存管理等能力,通过目标任务自动拆分、计划制定、计划实施等方式,能够自主完成用户的需求,成为每个人的智能助理,如制定旅行计划并进一步预定宾馆和餐饮。

大模型正在成为新一代的流量入口。GPT-4正在逐步开放插件功能,通过底层模型连接第三方应用,从而构建丰富的生态系统。GPT-4自插件功能开放以来,目前已经接入超过500个插件(其中包括教育、金融等场景)。随着大模型能力的不断增强以及插件生态的不断丰富,大模型有望成为新一代的人机交互方式以及流量入口,2023年5月OpenAI官网访问量为18.6亿次,是全球第19名次的互联网访问IP。

趋势七】大模型B端应用:专业数据与成本驱动行业模型百花齐放,打开广阔应用空间

数据壁垒带来企业端大模型百花齐放。通用大模型可以帮助用户解决一般性问题,而当企业需要处理其特定行业的数据和任务时,往往需要针对其行业数据库来对基本模型进行微调,垂直行业的特性和需求不尽相同,因此大模型的应用也呈现出多样化的趋势。B端应用出于对模型的经济性考量,未来将呈现阶梯式、差异性需求。

大模型在垂直领域的商业化落地对模型的运行成本更为敏感,模型的推理成本与模型的参数量多少密切相关,需要不同参数规模的大模型组成多层次的产品组合,从而在不同场景下实现最佳的经济性,进一步提升大模型的丰富度。

【趋势八】大模型轻量化:降低应用成本、带动端侧算力发展

随着大模型小型化、场景化需求增加,同时出于对AI应用的经济性、可靠性和安全性考量,部分场景的推理将逐步从云侧扩展向端侧,带动端侧算力需求的进一步提升。

目前多个大模型都已推出“小型化”“场景化”版本。5月23日谷歌发布的PaLM-2大模型,其中最轻量版本“壁虎”可在移动端运行,运行速度快且支持离线操作,其他多个大模型也都有其对应的小参数版本。

大模型端侧应用布局不断加速。端侧算力正在快速发展过程中,高通通过量化、编译和硬件加速进行优化,使Stable Diffusion能在搭载第二代骁龙8移动平台的手机上运行。高通在微软Build2023开发者大会上展示了最新的端侧AI能力以及在下一代Windows 11上开发生成式AI的工具,并表示未来几个月大语言模型有望在端侧运行。

【趋势九】大模型的深远影响:重构劳动力市场、改写科研范式

大语言模型对劳动力市场结构的影响深远而复杂。据OpenAI联合宾夕法尼亚大学的研究报告预测,约80%的美国劳动力可能有至少10%的工作受到大语言模型的影响。

大语言模型的应用带来劳动力市场结构的调整和变化。短期而言,大语言模型可能替代部分低技能或重复性工作;中期来看,大语言模型也将创造新的人工智能相关就业机会;长期来看,大语言模型的应用将会深度改变各行业的工作模式和商业模式,让企业的组织架构更加扁平化和小型化。过程中需要个人和企业去积极适应,发展人类独有的创新、协作和社交等能力,与人工智能共同进化。

AI与前沿科学的结合展现出了巨大潜力,可显著降低前沿科技研究中的智力成本并提升研究效率。生命科学、气象预测、数学、分子动力学等前沿科学均得到了人工智能的广泛助力,AI for Science将带来科研范式的变革和新的产业形态。
【趋势十】AI治理与技术的平衡:AI可解释性亟待增强,监管紧迫性日益凸显

在人工智能的快速发展中,加强AI监管与推动AI技术的进步同等重要。AI能力带来应用的便利性,同时也可能引发数据隐私、算法偏见、AI伦理等一系列问题。

从技术角度来看,可以通过可解释AI等技术手段增强AI的可信度。可解释AI使人工智能的决策过程透明化,增加输出内容的可理解性和可信任度,对于构建用户对AI系统的信任、提升系统的有效性、应对潜在的伦理问题都至关重要。

从规范角度来看,各国政府也都已经开始采取行动,制定和执行各种AI政策和法规。4月份,我国网信办出台《生成式人工智能服务管理办法(征求意见稿)》,明确了生成式人工智能的定义,从明确条件要求、划定责任主体、形成问题处理机制、明晰法律责任几个方面为行业划定底线。

等您来“战”!这个人工智能领域顶级大赛火热报名中!

大赛介绍

粤港澳大湾区(黄埔)国际算法算例大赛是受广州市黄埔区政府委托,由琶洲实验室(黄埔)于 2022 年创办的算法算例领域国际性赛事,旨在通过发挥实验室在数字经济领域的引领和带动作用,推动大湾区大数据与人工智能算法生态体系建设。

为进一步推动高质量发展集聚新动能,大赛积极响应国家、粤港澳大湾区、广州市黄埔区数字化创新发展战略,站位高远,走在数字经济与人工智能发展的世界前沿,同时“立足湾区、瞄准全国”,围绕大数据、人工智能、物联网、云计算等新一代信息技术,瞄准解决国家重大需求和领域尖端技术,聚焦智慧城市、智慧健康、智能制造、智慧金融等行业领域,面向全国遴选优质算法,面向全球聚集大数据与人工智能高精尖技术,面向国际招揽算法高端人才。

参赛收获

  • 院士专家直面交流

        大赛由院士领衔,有大咖坐镇,给选手与院士专家面对面沟通交流、探讨前沿课题的宝贵机会;

  • 知名企业工作邀约

        大赛赛题由企业根据行业实际需求形成,将给予能提供算法解决企业实际问题的优秀选手直接与行业大咖面试的机会,如果选手的算法最终被选中,将直接获得主办方推荐入职人工智能龙头企业的机会;

  • 政策基金支持创业

        相关政策大力扶持,大赛优胜选手有机会获得优厚的种子基金,鼓励选手创新创业!2022 首届大赛回顾

       首届大赛以“湾区逐‘例’、共创算‘法’”为主题,琶洲实验室(黄埔)统筹各方资源,精心策划了算法算例与数字经济圆桌会、赛题遴选调研与研讨会、初赛、决赛、决赛答辩等系列活动,逐步构建起立足黄埔、面向全国、辐射全球的高水平人工智能算法大赛格局。

首届大赛参赛规模达到了国内外人工智能领域比赛的顶尖水平,吸引了来自加拿大渥太华大学、新加坡国立大学、香港中文大学、北京大学、清华大学、中山大学等国内外顶尖高校439所,以及来自华为、京东、百度、美团等454家企业队伍报名。报名选手达6634人、团队达1678个。

首届大赛充分展现前瞻性强的特点,走在人工智能发展领域的前沿。大赛擂台制赛道“预训练语言模型应用调优算法”,在ChatGPT等“人工智能技术驱动的自然语言处理工具”的技术发展方向上做到提前布局。

首届大赛品牌影响力持续提升,发挥出纽带桥梁作用,吸引了中科曙光、南方电网等企业主动合作,形成了良性的大赛产业生态循环。此外,还吸引了来自粤港澳大湾区众多人工智能领域的选手参赛,激发了粤港澳大湾区的数字技术创新潜力。目前,首届大赛遴选出来的十个冠军算法成果已发布在《国家科学评论》杂志。

创新擂台制赛题

赛题一:序列任务的持续学习

赛题任务:设计新颖且高效的持续学习算法,使得神经网络在新任务上学习新知识的同时,尽可能地保留在历史任务上的知识。

报名通道:https://iacc.pazhoulab-huangpu.com/contestdetail?id=64af505d4a0ed647faca627e&award=1,000,000

赛题二:基于语言增强的图像新类别发现

赛题任务:设计基于语言增强的图像新类别发现算法,以多标签图像分类为例,提升利用语言知识的图像新类别发现性能。

报名通道:https://iacc.pazhoulab-huangpu.com/contestdetail?id=64af50524a0ed647faca6272&award=1,000,000

赛题三:高效可靠的文生图方法

赛题任务:设计特定语义下的图像内容个性化生成和精细的生成控制,推动扩散模型在模型个性化和可控生成技术的发展。

报名通道:https://iacc.pazhoulab-huangpu.com/contestdetail?id=64af50464a0ed647faca6266&award=1,000,000

赛题四:大语言模型综合能力强化

赛题任务设计提升大模型在无害性、可信性以及推理能力三个方面综合能力的算法。

报名通道:https://iacc.pazhoulab-huangpu.com/contestdetail?id=64af503a4a0ed647faca625a&award=1,000,000

赛题五:跨场景单目深度估计

赛题任务:设计能够从一个源场景中有效预测另一个目标场景的深度信息的跨场景单目深度估计算法。

报名通道:https://iacc.pazhoulab-huangpu.com/contestdetail?id=64af502c4a0ed647faca624e&award=1,000,000

创新竞赛制赛题

赛题一:神经隐式表示的物体三维重建 

赛题任务:基于神经隐式表示的技术,利用面向特定物体类型照片和相机位姿信息设计物体三维重建的算法。

报名通道:https://iacc.pazhoulab-huangpu.com/contestdetail?id=64af50214a0ed647faca6244&award=1,000,000

赛题二:看视频说话

赛题任务:设计能够针对视频的对话模型算法,根据给定的视频片段进行对话。

报名通道:https://iacc.pazhoulab-huangpu.com/contestdetail?id=64af50154a0ed647faca623a&award=1,000,000

赛题三:路侧毫米波雷达标定和目标跟踪

赛题任务:基于标定文件和雷达点云数据集,实现对路侧毫米波雷达的动态标定和交通车辆精确检测与跟踪算法。

报名通道:https://iacc.pazhoulab-huangpu.com/contestdetail?id=64af500a4a0ed647faca6230&award=1,000,000

赛题四:急诊多器官多病种筛查

赛题任务:设计基于急诊CT影像数据,实现多器官快速分割的算法,辅助急诊多病种高效筛查。

报名通道:https://iacc.pazhoulab-huangpu.com/contestdetail?id=64af50004a0ed647faca6226&award=1,000,000

赛题五:快速运动场景下的视频插帧

赛题任务:设计视频插帧算法,实现对快速运动场景下低帧率视频的插帧,输出高帧率,且运动平滑、自然的视频。

报名通道:https://iacc.pazhoulab-huangpu.com/contestdetail?id=64af6ccc4a0ed647faca76ee&award=1,000,000
2023 大赛时间线

7月15日—9月20日

比赛开始报名及初赛(初赛阶段均可报名)

9月21日—10月6日

初赛评测

10月7日后

决赛及决赛评测

11月初—中旬

决赛答辩及结果公示

12月

颁奖典礼及奖金发放2023 大赛报名及参赛须知

(1) 登录大赛官方主页:

https://iacc.pazhoulab-huangpu.com

在大赛选题中点击对应赛题“立即报名”按钮,提交报名信息,即可参与比赛。

(2) 确认报名信息、组队信息准确有效,如查出小号、冒名等情况将被取消参赛资格、成绩及奖金。

(3) 参赛对象:大赛面向全社会开放,个人、高等院校、科研单位、创客团队、企业等均可报名参赛。各赛道中每位选手仅能加入一支参赛队伍,每支队伍组队上限5人。
(4)第二届粤港澳大湾区(黄埔)算法算例大赛共10道赛题,同一选手(同一姓名、手机号、身份证号)可报名多个赛道。

注:针对竞赛制赛题,对应赛题支持单位(涉及题目编写、数据接触)的人员禁止参赛、禁止委托他人参赛。主办方的所有员工(含实习生)可以参赛,但只能参加初赛及复赛排名,不能晋级答辩及后续环节。

2023 大赛奖励

大赛设立 1000 万 总奖池

设置10个赛道,每个赛道 100 奖金

旨在吸引人工智能领域全球杰出人才和顶尖团队

培育和建设一批具有国际竞争力的

创新型人工智能产业集群2023 大赛支持单位

指导单位

鹏城实验室

广州市科学技术局

广州市工业和信息化局

支持单位

广州市黄埔区人民政府

广州开发区管理委员会

广州高新区管理委员会

主办单位

琶洲实验室(黄埔)

协办单位

中国工业与应用数学学会

(大数据与人工智能专业委员会)

中国计算机学会

中国指挥与控制学会

中国人工智能学会

工业和信息化部电子第五研究所

西安电子科技大学广州研究院

国家卫健委能力建设和继续教育中心2023 大赛组织架构大赛指导委员会

袁亚湘(中国科学院院士、国际工业与应用数学联合会主席、中科院数学院研究员)

戴琼海(中国工程院院士、中国人工智能学会理事长、清华大学教授)

梅   宏(中国科学院院士、中国计算机学会理事长、北京大学教授)

王怀民(中国科学院院士、国防科技大学前副校长)

戴   浩(中国工程院院士、军事科学院系统工程研究院研究员)

徐宗本(中国科学院院士、琶洲实验室(黄埔)主任)大赛专家委员会

徐宗本(中国科学院院士、琶洲实验室(黄埔)主任)

袁亚湘(中国科学院院士、国际工业与应用数学联合会主席、中科院数学院研究员)

戴琼海(中国工程院院士、中国人工智能学会理事长、清华大学教授)

梅   宏(中国科学院院士、中国计算机学会理事长、北京大学教授)

王怀民(中国科学院院士、国防科技大学前副校长)

戴   浩(中国工程院院士、军事科学院系统工程研究院研究员)

周志华(欧洲科学院院士、南京大学计算机系主任、人工智能学院院长)

石光明(鹏城实验室副主任)

申恒涛(欧洲科学院院士、电子科技大学计算机科学与工程学院院长)

焦李成(欧洲科学院院士、西安电子科技大学计算机学部主任)

吴   枫(中国科学技术大学副校长)

姚   新(南方科技大学计算机系主任)

刘铁岩(微软亚洲研究院副院长)

林宙辰(北京大学智能学院教授)

郝志峰(汕头大学党委副书记、校长)

李树涛(湖南大学副校长)

杨   彤(欧洲科学院院士,香港科学院院士、香港理工大学讲席教授)

张   潼(香港科技大学讲座教授)大赛评测委员会

胡事民(中国计算机学会副理事长、清华大学计算机科学与技术系教授)

王巨宏(腾讯公司副总裁兼腾讯技术委员会主席)

陶大程(澳大利亚科学院院士、京东探索研究院首任院长)

田   奇(华为云人工智能首席科学家)

陈宝权(北京大学智能学院副院长)

戴礼荣(中国科学技术大学电子工程与信息科学系教授)

刘   挺(哈尔滨工业大学副校长)

程学旗(中国科学院计算所副所长)

陈   雷(香港科技大学计算机科学与工程系讲座教授)

李飞飞(阿里巴巴达摩院数据库与存储实验室主任)

卢   凯(国防科技大学计算机学院院长)

金   海(中国计算机学会副理事长、华中科技大学计算机学院教授)

王井东(百度视觉首席科学家)

陈海波(上海交通大学并行与分布式处理研究所所长)

马建峰(西安电子科技大学网络空间安全学部主任)

田永鸿(北京大学计算机学院博雅特聘教授)

程明明(南开大学计算机系主任)

孟德宇(西安交通大学数学与统计学院教授)

郑伟诗(中山大学计算机学院副院长)

左旺孟(哈尔滨工业大学计算机学院教授)

彭   玺(四川大学计算机学院教授)

宋井宽(电子科技大学计算机科学与工程学院教授)算法大赛中心

张  海  (大赛委员会秘书长)

(琶洲实验室(黄埔)主任助理、西北大学数学学院教授)

徐  行  (大赛委员会副秘书长)

(电子科技大学计算机科学与工程学院研究员)

为保饭碗,好莱坞对人工智能“致命清算”?

来源:新京报

撰稿 / 张田勘(专栏作家) 编辑 / 何睿 校对 / 赵琳

好莱坞大片《碟中谍7:致命清算(上)》正在全球热映,好莱坞却陷入了历史性的大罢工,编剧和演员们联合起来,似乎要对人工智能(AI)来一场“致命清算”。
这次好莱坞大罢工,开始于当地时间7月13日。当天,代表16万演艺人员的美国演员工会及广播电视艺人联合工会(SAG-AFTRA)宣布,他们与制片公司的谈判破裂,确定从即日起罢工。导演克里斯托弗·诺兰,演员希里安·墨菲、马特·达蒙等人纷纷表示支持。而此前,美国编剧工会(WGA)已在5月2日开始罢工。
好莱坞为何要发起大罢工?除了演员、编剧与资方的薪资矛盾外,AI强势崛起,可能砸掉演员和编剧饭碗的威胁成为主要原因。因此,这不仅是好莱坞63年来首次全行业罢工,也被认为是人类抵抗AI威胁的首次集体行动。
早在2001年,好莱坞著名导演斯皮尔伯格就通过他的科幻巨制《人工智能》,对未来的AI世界做出了种种设想。但是,他大概也没有料到,22年后,好莱坞却在凶猛的AI浪潮中首当其冲。

好莱坞星光大道资料图。图/新华社

━━━━━

第一张多米诺骨牌已倒下?
眼下,北半球正被热浪裹挟,但好莱坞的历史性大罢工,又让人感觉到AI浪潮的凛冬将至。AI的崛起和发展将直接影响到人类社会,AI将在很多领域取代人工,也是必然的。但没有想到的是,AI所造成的威胁如此之紧迫,以至于全球影视工业帝国也坐不住了——好莱坞率先大罢工。
这个画风似乎与工业革命时期的卢德运动相似。由于机器取代手工,1811年英格兰的手摇纺织工开始罢工并捣毁织袜机,并于1811年与1812年在英格兰迅速蔓延。许多工厂及其中的机器被焚毁。
当然,此次好莱坞大罢工并没有直接捣毁人工智能软件和设备,但其前所未有的规模也足以震撼全球。毕竟,历来星光熠熠、风头无两的好莱坞尚且如此,谁知这一多米诺骨牌接下来会传递到哪个行业呢!
3月26日,美国高盛公司发表报告称,在美国和欧洲,AI将取代目前的1/4工作岗位,生成式AI将取代3亿个工作岗位。而最近,OpenAI与宾夕法尼亚大学联合所做的报告结果,似乎与此英雄所见略同——美国有 80% 的劳动力至少有 10% 的任务会受到 GPT的影响,大约 19% 的员工至少会发现 50% 的任务受其影响。
高盛具体列举了23个行业会受到AI影响,首当其冲的是办公室和行政工作,受影响程度达46%。而艺术、设计、娱乐、运动和媒体领域受AI的影响程度,位列倒数第8,程度为26%。
高盛和OpenAI 与宾夕法尼亚大学的预测结果,也意味着,与农业和工业革命时期大多是蓝领工作受影响不同,如今的AI时代,更多是白领和知识阶层被直接威胁。即便在医疗行业,一项新的同行评审研究显示,人工智能现在比 72% 的全科医生的诊断结果还准确。
AI的迅猛发展,让一些乐观预测认为,AI能让人类生活更美好,但也有一些人悲观地认为,AI会威胁甚至毁灭人类。这两种看法都有一定道理,但也都有其片面性。
更可能的情况是,AI会影响并取代很多人的工作,但也有新的工作岗位因此产生。而在此过程中,人类需要管理好AI,并与之相互适应。这也考验着人类是否有足够智慧与长远眼光。


▲好莱坞街景资料图。图/新华社

━━━━━

为何是好莱坞?
对于此次好莱坞大罢工,或许有人疑惑,为何受AI影响并非太大的影视行业会率先揭竿而起,如此激烈抵抗AI威胁呢?
原因或许在于,影视业对AI的影响已有切肤之痛,甚至可能会被AI一锅端掉。此次好莱坞大罢工,就明确表达了两方面的担忧,一是作家和编剧,二是演员及相关人员。
作家和编剧们担心制片和平台公司为节省开支,会用AI海量炮制剧本内容。事实上,通过深度学习和生成式转换,AI可以既快又好地生成无数剧本,这对于人工编剧要花几年甚至10年磨一剑的剧本撰写而言,AI优势十分明显。
因此,作家和编剧,尤其是初始剧本的写作者首先会失去高报酬,甚至丢掉工作。他们由此认定,需要海量语料训练的AI,简直就是一个侵犯知识产权的犯罪,是一部彻头彻尾的“剽窃机器”。
让演员担心的,则是大量的合成数字人会取代其表演。如今年,好莱坞老牌男星哈里森·福特主演的《夺宝奇兵5》,片中就利用AI让观众看到了青年时期福特的英姿。甚至已有AI技术公司利用数据采集技术批量抓取演员信息生成影像,让演员从此 “长生不老”。
这就会带来多个问题。首先是,演艺公司是否有权搜集演员个人信息供其反复使用?即便是授权使用,该如何付酬也是一个具体问题。此外,数字人取代真实演员,不仅让演员薪酬减少或失去工作,更会阻碍新人入行和表演艺术进步。一旦从新陈代谢机制上过度依赖AI,演艺行业则前途未卜。
毫无疑问,这些现实问题都涉及AI管理和应用,也就是人们如何与AI共存。在此方面,各国都已经开始了相应的行动步骤。
早在2022年10月,美国就发布了《人工智能权利法案蓝图》,2023年3月,美国人工智能委员会发布报告,提出要构建“基于风险的、分布式的、协调的”人工智能监管治理框架。
2023年6月,欧洲议会投票通过了《人工智能法案》,该法案将正式进入欧盟委员会、欧洲议会和成员国三方谈判协商程序,以确定最终立法文本。我国七部门也于2023年5月23日审议通过了《生成式人工智能服务管理暂行办法》,并于2023年7月13日公布。
关于AI的所有法律框架,都旨在促进AI健康发展和规范应用,协调社会公共利益,保护公民、法人和其他组织的合法权益,并维护国家安全。但这些法律法规只是纲领性法规或指南,具体到各行各业,还要有详尽条款和执行办法。
没有规矩,不成方圆。有了法规,才会让人与AI和谐共存,才会让AI助力人类生活更美好,而非毁掉人类。
以此而言,好莱坞此次历史性大罢工,不仅是呼吁、推动影视演艺行业的AI管理,为保住编剧、演员饭碗的抗争,也是对各行各业未雨绸缪应对AI强势崛起的提醒。

加州理工学院教授:AI永远是人类的附属品

由ChatGPT和GPT-4引发的“人工智能狂潮”远比人们预想的持续更久,伴随而来的争议与忧虑也在不断发酵。回归科学,反思以GPT-4为代表的AI能力的边界:它能做什么?不能做什么?最重要的是,人类现在必须采取什么行动来实现“有益的AI”?《中国新闻周刊》近日就以上问题专访美国加州理工学院电气工程和计算机科学教授亚瑟·阿布-穆斯塔法(Yaser S. Abu-Mostafa)。他是人工智能领域的知名专家,同时也是IEEE神经网络委员会的创始人之一,曾在多家科技公司担任机器学习顾问。

现将访谈实录摘要如下:

AI的应用远比设计更复杂和危险

记者:此前,埃隆·马斯克等人签署了联名公开信,业内形成了对人工智能发展的两种截然不同的看法,你更认同哪方?

阿布-穆斯塔法:联名公开信意图是好的,但无法起到任何实质效果,因为不会真的有公司遵守并暂停六个月的AI研发。我认为这是对人工智能“过于快速发展”的下意识反应,是没有经过深思熟虑的行为。我个人不赞同暂停更强大AI模型的研发。现在要做的不是暂停,而是如何更好阻止其“不良使用”。所以我没有签署公开信。

如何推动更强有力的人工智能监督?政府需要通过立法对如何“合理地使用”AI进行约束或限制,欧盟《人工智能法案》是一个开始。立法必须经过谨慎考量,而不是短期内出于对人工智能的恐惧或为了应对想象中的风险而匆忙制定。目前为止,我还没有看到任何提议或法案经过了深思熟虑,并可以得到有效执行。

2023年7月6日,上海,2023世界人工智能大会上,特斯拉“擎天柱”Tesla Bot人形机器人。陈玉宇摄

记者:如何使AI真正符合人类的价值观和道德准则?

阿布-穆斯塔法:这完全取决于AI系统的开发者和使用者。人工智能没有内在的道德或恶意,它只是服从命令,做人类训练它去做的事情。如果人类给它的是充满偏见的数据,就会诞生一个充满偏见的AI。因此OpenAI需要不断调整,选择一些好的数据或让ChatGPT不回答恶意问题。但复杂之处在于,即使开发者把整个AI系统设计得很“符合人类价值观”,仍会有用户从不同角度使用它,这是开发者控制不了的。因此,AI应用远比设计更复杂和危险。

人类社会中,好坏标准是不明确的。训练一个AI下棋,如AlphaGo,规则是明确的,AI经过训练后很清楚如何界定“好的行为”——只要能赢就是一步好棋。但更多时候,要训练AI去完成一些缺乏客观好坏规则的任务,让系统自身去理解什么是“好的行为”非常困难。

韩国当地时间2016年3月9日,韩国职业9段李世石与谷歌人工智能系统“阿尔法围棋”(AlphaGo)进行了一场“人机大战”。李世石在五番棋首战中执黑186手中盘告负。图为媒体观看区。吴旭摄

记者:联名公开信指出,最近几个月,人工智能实验室正陷入一场失控的竞赛(out-of-control race),这是否真的在发生?

阿布-穆斯塔法:这是一种非常情绪化的表述。不过可以预料到,在短期未来AI产业格局中,世界范围内很可能只有两到三个非常强大的类似ChatGPT的人工智能工具占领整个全球市场,因为开发这样的大模型成本巨大,需要数千个GPU(图形处理器)核心运行2个月,以及海量的数据和算力。这也是为什么目前所有最新的大模型进展都来自科技公司,而不是大学。

五年后是否可能诞生一种能节省大量计算资源的新模型,还未可知。如果以后真的出现一种完全不同的模型,可以让成本从10亿美元降至1000万美元,这就改变了游戏规则,届时将会有大量玩家出现。

记者:大模型时代的到来,也和基于“预训练+微调”这种自然语言处理(NLP)的主流范式有关。2018年后,这种模式几乎重塑了人工智能的商业形态,你如何看待这种趋势?

阿布-穆斯塔法:“预训练+微调”是一种分而治之的巧妙方式,一次训练AI专注于一个问题并完善它。这使人们能在目前成就基础上再接再厉,而非从头开始。

OpenAI将其对公众开放的这个主意很聪明,现在他们获得了大量的数据和反馈,可用来训练新一代系统,而且这些资源是独家的,因为公众不会对下一个类似产品产生同样多的兴趣。

2023世界人工智能大会在上海举办,展会上微创机器人展示5G远程手术技术。

AI只是在复制人类的“外观”

记者:如何理性客观认知当下的人工智能水平和ChatGPT的能力边界?

阿布-穆斯塔法:我有个朋友问ChatGPT:“关于阿布-穆斯塔法,你知道什么?”ChatGPT列出了关于我的一份详细履历和人物小传,首段看起来非常专业,但接下来就有不少错误,比如搞错了我的大学。这充分说明了ChatGPT的本质:某种意义上,它只是把所有信息以一种非常特殊的彼此相关的方式放在一起。

人工智能使用了一种类似人类大脑的结构,这种结构以一种高效方式存储信息,看到新情况后推理判断什么是“最接近它的东西”。这就是深度神经网络所做的,已持续几十年。

目前,人工智能整体发展水平令人振奋。但即使在业内,真正了解所有技术细节的人很少,只有OpenAI、Google这些参与了大模型训练的人才能说清楚,但他们对外分享信息有限。我推测,下一步最重要的突破可能集中在AI系统如何用更少资源达到相同的性能水平。

记者:沿这条路继续走,AI是否能进化到理解“概念”和“常识”?有专家认为GPT-4已初具“自我反思”能力,你怎么看?

阿布-穆斯塔法:如果说人工智能已发展出自我反思能力,那一定是数量巨大的任务训练带来的,是通过合并足够数量的“分散而零碎的智能任务”实现的。比如说做1000个ChatGPT,其中一个对语言感兴趣,一个处理数学问题,一个负责视觉识别……直到其“能力”覆盖几乎人类所有领域,再合并为一,它一定能表现出一种“通用的智能”,这就是“多模态机器学习”的本质。

但这只是表象,只是看起来具备自我反思能力和通用智能。某种意义上,这个巨大系统只是试图复制人类的“外观”。

2022世界人工智能大会在上海拉开帷幕。

记者:怎么理解微软研究人员称,GPT-4已经显示出接近人类智能或通用人工智能的“火花”?

阿布-穆斯塔法:问题的关键是,“通用人工智能”(Artificial General Intelligence,AGI)到底是什么?对于通用人工智能,人类想追求的是:AI突然之间学会了以上所有,能举一反三,而不是一次次学会某个特定任务。但这是一个非常模糊的描述。

现在迫切需要就“通用人工智能”概念达成共识,用精确的计算机语言界定它,制定明确的检验规则。遵照这些规则,人类才能知道AGI是否已经实现、潜在的危险是什么。

人类为什么这么关心“通用人工智能”,因为它触及了人性中最根本的东西,侵犯了人类的自我(Ego),即人类是不是最独一无二的存在。对如何实现AGI,目前所有想法都只是推测,人们只能针对已看到的技术范式进行突破;但真实情况是,我们根本难以想象会走上一条怎样的路径。

当人们谈论“通用人工智能”时,承载了太多情感,有时甚至是不切实际的期望和恐惧,但这种恐惧把智能和“自我”混为一谈。人们必须冷静下来,理性地把AGI视作一个科学目标。

记者:人工智能是否能产生“自我意识”?

阿布-穆斯塔法:我认为AI领域的任何技术进步都不可能产生一个“有意识的实体”。意识和情绪的“显现”很容易做到,AI未来能“看起来像拥有了情感或意识”,就像电影里有一个演员表达出了某种强烈的情绪,但这只是表演,是纯粹的行为表象。

对人类意识的定义在科学上都是不确定的,客观上也不可测量。我知道我有意识,你有意识,你知道爱是什么,情感是什么,悲伤是什么,因为你能感觉到,你能与它们联系起来。但这些都是人类经验。为什么会这样?我们不知道。

我认为AI始终是一个无生命的机器,背后有严密的齿轮在驱动它,这些齿轮就是参数。复杂的输出可能会给我们留下“那里有一个与众不同的人”的印象,但这种输出不是来自意识,而是算法。为什么我们认为有

人在那里?因为当人们看到这个输出后,把它在脑海中与过去的记忆、情感,与人类自身联系在一起。

2023年6月26日,江苏苏州国际博览中心,观众在“2023全球人工智能产品应用博览会”上参观。王建康摄

常规工作或在更短时间内被AI替代

记者:未来哪些行业会从AI发展中受益,哪些可能被颠覆?

阿布-穆斯塔法:所有行业都会从人工智能的发展中受益,甚至以无法预料到的方式。

五年前有人问我:人工智能下一个20年如何发展?我说,AI将在20年内取代人类几乎所有常规智能工作(routine intelligence tasks),也就是“完成复杂任务但不需要创新的智能”,自动驾驶是一个典型例子。这是一个必须要积极解决的社会问题,否则很多人将面临失业。

ChatGPT诞生后,我修正了我的预期,我现在认为,可能不需要20年,这些常规工作在更短时间内就可能被AI替代,不管我们如何界定“通用人工智能”,常规智能是通向它的第一步。

记者:在常规智能工作之外,AI未来是否也会取代一些更具有创造力的工作?

阿布-穆斯塔法:以AlphaGo为例,你会发现AI在某种意义上也在进行“创造性的防御”:为赢得比赛,它发现了人类没想到的防御策略。我不知道这是不是创新或只是自动化的产物,因为这背后是AI对海量策略的尝试。“AI的创造力”目前也没有很可靠的定义。

2022年4月9日,在宁夏银川鼓楼步行街,一名小朋友与机器人“铁蛋”互动。袁宏彦摄

记者:人类应如何与AI共存?

阿布-穆斯塔法:我们没有与AI共存的压力,AI永远是人类的附属品。受访者简介:

亚瑟•阿布-穆斯塔法(Yaser S. Abu-Mostafa),埃及裔美国计算机科学家,加利福尼亚理工学院电气工程和计算机科学教授。研究涵盖人工智能、机器学习、模式识别和数据科学等多个领域,在人工智能教育和科普方面做出重要贡献。

开源大模型的“安卓时刻”要来了!Meta将发布商用版LLaMA

AI大模型竞赛白热化,Meta前来搅局,将开源大模型商业化。

周二,据英国《金融时报》,Meta准备发布其大语言模型LLaMA的商用版本,将允许初创公司和企业在该技术的基础上构建定制AI软件。

此举将意味着使Meta与微软支持的OpenAI 、谷歌等展开正面较量,后两家公司在开发生成式人工智能的竞赛中遥遥领先。

Meta副总裁兼首席AI科学家Yann LeCun上周六在普罗旺斯艾克斯举行的一次会议上表示:

人工智能的竞争格局将在未来几个月,也许在未来几周内彻底改变,届时将出现与非开源平台一样好的开源平台。

开源LLaMA模型即将商用化

此前文章指出,今年2月,Meta发布了其开源大语言模型LLaMA,该模型能帮助研究人员低成本开发专有AI软件,从而在AI领域掀起轩然大波。三位知情人士表示,新版本将更广泛地提供给企业,并可由企业定制。

与OpenAI等竞争对手形成鲜明对比的是,LLaMA为开源模型。从本质上说,Meta将其AI技术作为开源软件(可自由复制、修改和重复使用的计算机代码),这为外部人员快速构建自己的聊天机器人提供了所需的一切。

而将LLaMA商用化不仅有利于自身竞争,AI开发者希望找到替代竞争对手谷歌和OpenAI销售的专有软件的产品,同时也将间接有利于Meta的AI开发。

开源模型的好处包括用户的接受率更高,然后输入更多数据供人工智能处理。LLM拥有的数据越多,其功能就越强大。此外,开源模型使研究人员和开发人员能够发现和解决漏洞,同时提高技术和安全性,Meta等科技公司多年来一直因各种隐私和错误信息丑闻而面临审查。

虽然Meta的技术是开源的,且目前免费,但两位知情人士表示,该公司一直在探索商用化。一位知情人士表示,目前没有收费计划,Meta也不会在即将发布的版本中这样做。

Meta负责AI研究的副总裁Joelle Pineau拒绝就商业化发表评论,但他表示:

这些东西确实是开源的,但你不会完全放弃这项工作的知识产权。

大模型竞争格局或迎巨变

虽然免费提供软件似乎与赚钱背道而驰,但专家认为,企业也可以利用这一策略来打开市场。一位熟悉Meta想法的人士表示:

Meta已经意识到,他们在当前的人工智能炒作周期中落后了,但这给了他们一种打开生态系统的方式,他们似乎在做正确的事情。

本周早些时候,Meta全球事务主管Nick Clegg曾撰文赞扬了开源的好处称:

开源是消除AI相关恐惧的最佳解药。当然,开源也有助于Meta追赶竞争对手,因为它允许各种规模的公司改进这项技术,并在其上构建应用程序。

不过,Meta也将面临风险,在将下一个版本的LLaMA商业化的过程中,如果被发现使用受版权保护的材料训练该软件,该公司可能会面临法律诉讼。

来源:公众号MaxFutureAI 

《生成式人工智能服务管理暂行办法》全文

央广网北京7月13日消息 近日,国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局公布了《生成式人工智能服务管理暂行办法》。该文件全文如下:

生成式人工智能服务管理暂行办法

第一章 总则

第一条 为了促进生成式人工智能健康发展和规范应用,维护国家安全和社会公共利益,保护公民、法人和其他组织的合法权益,根据《中华人民共和国网络安全法》、《中华人民共和国数据安全法》、《中华人民共和国个人信息保护法》、《中华人民共和国科学技术进步法》等法律、行政法规,制定本办法。

第二条 利用生成式人工智能技术向中华人民共和国境内公众提供生成文本、图片、音频、视频等内容的服务(以下称生成式人工智能服务),适用本办法。

国家对利用生成式人工智能服务从事新闻出版、影视制作、文艺创作等活动另有规定的,从其规定。

行业组织、企业、教育和科研机构、公共文化机构、有关专业机构等研发、应用生成式人工智能技术,未向境内公众提供生成式人工智能服务的,不适用本办法的规定。

第三条 国家坚持发展和安全并重、促进创新和依法治理相结合的原则,采取有效措施鼓励生成式人工智能创新发展,对生成式人工智能服务实行包容审慎和分类分级监管。

第四条 提供和使用生成式人工智能服务,应当遵守法律、行政法规,尊重社会公德和伦理道德,遵守以下规定:

(一)坚持社会主义核心价值观,不得生成煽动颠覆国家政权、推翻社会主义制度,危害国家安全和利益、损害国家形象,煽动分裂国家、破坏国家统一和社会稳定,宣扬恐怖主义、极端主义,宣扬民族仇恨、民族歧视,暴力、淫秽色情,以及虚假有害信息等法律、行政法规禁止的内容;

(二)在算法设计、训练数据选择、模型生成和优化、提供服务等过程中,采取有效措施防止产生民族、信仰、国别、地域、性别、年龄、职业、健康等歧视;

(三)尊重知识产权、商业道德,保守商业秘密,不得利用算法、数据、平台等优势,实施垄断和不正当竞争行为;

(四)尊重他人合法权益,不得危害他人身心健康,不得侵害他人肖像权、名誉权、荣誉权、隐私权和个人信息权益;

(五)基于服务类型特点,采取有效措施,提升生成式人工智能服务的透明度,提高生成内容的准确性和可靠性。

第二章 技术发展与治理

第五条 鼓励生成式人工智能技术在各行业、各领域的创新应用,生成积极健康、向上向善的优质内容,探索优化应用场景,构建应用生态体系。

支持行业组织、企业、教育和科研机构、公共文化机构、有关专业机构等在生成式人工智能技术创新、数据资源建设、转化应用、风险防范等方面开展协作。

第六条 鼓励生成式人工智能算法、框架、芯片及配套软件平台等基础技术的自主创新,平等互利开展国际交流与合作,参与生成式人工智能相关国际规则制定。

推动生成式人工智能基础设施和公共训练数据资源平台建设。促进算力资源协同共享,提升算力资源利用效能。推动公共数据分类分级有序开放,扩展高质量的公共训练数据资源。鼓励采用安全可信的芯片、软件、工具、算力和数据资源。

第七条 生成式人工智能服务提供者(以下称提供者)应当依法开展预训练、优化训练等训练数据处理活动,遵守以下规定:

(一)使用具有合法来源的数据和基础模型;

(二)涉及知识产权的,不得侵害他人依法享有的知识产权;

(三)涉及个人信息的,应当取得个人同意或者符合法律、行政法规规定的其他情形;

(四)采取有效措施提高训练数据质量,增强训练数据的真实性、准确性、客观性、多样性;

(五)《中华人民共和国网络安全法》、《中华人民共和国数据安全法》、《中华人民共和国个人信息保护法》等法律、行政法规的其他有关规定和有关主管部门的相关监管要求。

第八条 在生成式人工智能技术研发过程中进行数据标注的,提供者应当制定符合本办法要求的清晰、具体、可操作的标注规则;开展数据标注质量评估,抽样核验标注内容的准确性;对标注人员进行必要培训,提升尊法守法意识,监督指导标注人员规范开展标注工作。

第三章 服务规范

第九条 提供者应当依法承担网络信息内容生产者责任,履行网络信息安全义务。涉及个人信息的,依法承担个人信息处理者责任,履行个人信息保护义务。

提供者应当与注册其服务的生成式人工智能服务使用者(以下称使用者)签订服务协议,明确双方权利义务。

第十条 提供者应当明确并公开其服务的适用人群、场合、用途,指导使用者科学理性认识和依法使用生成式人工智能技术,采取有效措施防范未成年人用户过度依赖或者沉迷生成式人工智能服务。

第十一条 提供者对使用者的输入信息和使用记录应当依法履行保护义务,不得收集非必要个人信息,不得非法留存能够识别使用者身份的输入信息和使用记录,不得非法向他人提供使用者的输入信息和使用记录。

提供者应当依法及时受理和处理个人关于查阅、复制、更正、补充、删除其个人信息等的请求。

第十二条 提供者应当按照《互联网信息服务深度合成管理规定》对图片、视频等生成内容进行标识。

第十三条 提供者应当在其服务过程中,提供安全、稳定、持续的服务,保障用户正常使用。

第十四条 提供者发现违法内容的,应当及时采取停止生成、停止传输、消除等处置措施,采取模型优化训练等措施进行整改,并向有关主管部门报告。

提供者发现使用者利用生成式人工智能服务从事违法活动的,应当依法依约采取警示、限制功能、暂停或者终止向其提供服务等处置措施,保存有关记录,并向有关主管部门报告。

第十五条 提供者应当建立健全投诉、举报机制,设置便捷的投诉、举报入口,公布处理流程和反馈时限,及时受理、处理公众投诉举报并反馈处理结果。

第四章 监督检查和法律责任

第十六条 网信、发展改革、教育、科技、工业和信息化、公安、广播电视、新闻出版等部门,依据各自职责依法加强对生成式人工智能服务的管理。

国家有关主管部门针对生成式人工智能技术特点及其在有关行业和领域的服务应用,完善与创新发展相适应的科学监管方式,制定相应的分类分级监管规则或者指引。

第十七条 提供具有舆论属性或者社会动员能力的生成式人工智能服务的,应当按照国家有关规定开展安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。

第十八条 使用者发现生成式人工智能服务不符合法律、行政法规和本办法规定的,有权向有关主管部门投诉、举报。

第十九条 有关主管部门依据职责对生成式人工智能服务开展监督检查,提供者应当依法予以配合,按要求对训练数据来源、规模、类型、标注规则、算法机制机理等予以说明,并提供必要的技术、数据等支持和协助。

参与生成式人工智能服务安全评估和监督检查的相关机构和人员对在履行职责中知悉的国家秘密、商业秘密、个人隐私和个人信息应当依法予以保密,不得泄露或者非法向他人提供。

第二十条 对来源于中华人民共和国境外向境内提供生成式人工智能服务不符合法律、行政法规和本办法规定的,国家网信部门应当通知有关机构采取技术措施和其他必要措施予以处置。

第二十一条 提供者违反本办法规定的,由有关主管部门依照《中华人民共和国网络安全法》、《中华人民共和国数据安全法》、《中华人民共和国个人信息保护法》、《中华人民共和国科学技术进步法》等法律、行政法规的规定予以处罚;法律、行政法规没有规定的,由有关主管部门依据职责予以警告、通报批评,责令限期改正;拒不改正或者情节严重的,责令暂停提供相关服务。

构成违反治安管理行为的,依法给予治安管理处罚;构成犯罪的,依法追究刑事责任。

第五章 附则

第二十二条 本办法下列用语的含义是:

(一)生成式人工智能技术,是指具有文本、图片、音频、视频等内容生成能力的模型及相关技术。

(二)生成式人工智能服务提供者,是指利用生成式人工智能技术提供生成式人工智能服务(包括通过提供可编程接口等方式提供生成式人工智能服务)的组织、个人。

(三)生成式人工智能服务使用者,是指使用生成式人工智能服务生成内容的组织、个人。

第二十三条 法律、行政法规规定提供生成式人工智能服务应当取得相关行政许可的,提供者应当依法取得许可。

外商投资生成式人工智能服务,应当符合外商投资相关法律、行政法规的规定。

第二十四条 本办法自2023年8月15日起施行。

彻底开源,免费商用,上海AI实验室把大模型门槛打下来

机器之心原创

作者:杜伟、泽南

终于,业内迎来了首个全链条大模型开源体系。

大模型领域,有人探索前沿技术,有人在加速落地,也有人正在推动整个社区进步。

就在近日,AI 社区迎来首个统一的全链条贯穿的大模型开源体系。

虽然社区有LLaMA等影响力较大的开源模型,但由于许可证限制无法商用。InternLM-7B 除了向学术研究完全开放之外,也支持免费商用授权,是国内首个可免费商用的具备完整工具链的多语言大模型,通过开源开放惠及更多开发者和企业,赋能产业发展。

今年世界人工智能大会 WAIC 上,上个月初「高考成绩」超越 ChatGPT 的「书生」大模型来了次重大升级。

在 7 月 6 日的活动中,上海 AI 实验室与商汤联合香港中文大学、复旦大学、上海交通大学及清华大学共同发布了全新升级的「书生通用大模型体系」,包括书生・多模态、书生・浦语和书生・天际三大基础模型。其中面向 NLP 领域的书生・浦语语言大模型迎来了 104B 的高性能版和 7B 的轻量级版

相较初始模型,104B 的书生・浦语全面升级,高质量语料从 1.6 万亿 token 增至了 1.8 万亿,语境窗口长度从 2K 增至了 8K,支持语言达 20 多种,35 个评测集上超越 ChatGPT。这使得书生・浦语成为国内首个支持 8K 语境长度的千亿参数多语种大模型。

而在全面升级的同时,更值得关注的是书生・浦语在开源上的一系列动作。

此次书生・浦语将 7B 的轻量级版 InternLM-7B 正式开源,并推出首个面向大模型研发与应用的全链条开源体系,贯穿数据、预训练、微调、部署和评测五大环节。其中 InternLM-7B 是此次开源体系的核心和基座模型,五大环节紧紧围绕大模型开发展开。

上海 AI 实验室开放其整套基础模型和开发体系。大模型的研究,第一次有了一套开源的、靠谱的全链条工具。

模型 + 全套工具,开源真正实现「彻底」

此前,AWS 等国内外公司纷纷推出了基础大模型技术平台。基于大厂的能力,人们可以构建起生成式 AI 应用。相比之下,基于上海 AI 实验室的基座模型和全链条开源体系,企业、研究机构/团队既可以构建先进的应用,也可以深入开发打造各自垂直领域的大模型。

在上海 AI 实验室看来,基础大模型是进一步创新的良好开端。「书生」提供的并非单个的大模型,而是一整套基座模型体系,在全链条开源体系加持下,为学界和业界提供了坚实的底座和成长的土壤,从底层支撑起 AI 社区的成长,并且与更多的探索者共同建设「枝繁叶茂」的生态。

因此,就此次书生・浦语的开源而言,它是一套系统性工程,旨在推动行业进步,让一线开发者更快获取先进理念和工具。用「全方位开源开放」来形容可以说名副其实,模型、数据、工具和评测应有尽有。相比业界类似大模型平台,书生・浦语首个实现了从数据到预训练、微调,再到部署和评测全链条开源。

轻量化模型,性能业界最强

书生・浦语的 7B 轻量级版 InternLM-7B 不仅正式开源,还免费提供商用。作为书生・浦语开源体系中的基座模型,它为上海 AI 实验室未来开源更大参数的模型做了一次探索性尝试。

我们了解到,InternLM-7B 为实用场景量身定制,使用上万亿高质量语料来训练,建立起了超强知识体系。另外提供多功能工具集,使用户可以灵活自主地搭建流程。目前 GitHub star 量已经达到了 1.5K。

开源地址:
https://github.com/InternLM

InternLM-7B 的性能表现如何呢?上海 AI 实验室给出的答案是:在同等参数量级的情况下全面领先国内外现有开源模型

我们用数据来说话。对 InternLM-7B 的全面评测从学科综合能力、语言能力、知识储备能力、理解能力和推理能力五大维度展开,结果在包含 40 个评测集的评测中展现出卓越和均衡的性能,并实现全面超越。

下图展示了在几个重点评测集上,InternLM-7B 与国内外代表性 7B 开源模型(如 LLaMA-7B)的比较。可以看到,InternLM-7B 全面胜出,在 CEval、MMLU 这两个评价语言模型的广泛基准上分别取得了 53.25 和 50.8 的高分,大幅领先目前业内最优的开源模型。

InternLM-7B 在开放评测平台 OpenCompass 的比较结果。

书生是如何做到的?在接受机器之心专访时,上海 AI 实验室林达华教授向我们介绍了致胜之道

与以往在单项或数项基准上达到高水平的模型不同,InternLM-7B 是一个基座模型,它不是针对某个特定任务或领域,而是面向广泛的领域提供比较强大和均衡的基础能力。因而强调各方面能力的均衡是它的一大特点。

为了实现均衡且强大的能力,InternLM-7B 在训练和评估过程中使用了创新的动态调整模式:在每训练一个短的阶段之后,便对整个模型全面评估,并根据评估结果及时调整下一阶段训练数据分布。通过这套敏捷的闭环方式,模型在成长过程中始终保持能力均衡,不会因数据配比不合理而导致偏科。

同时,InternLM-7B 在微调体系上也有明显升级,使用了更有效的微调手段,保证模型的行为更加可靠。

除了以上模型技术层面的升级,InternLM-7B 还具备可编程的通用工具调用能力。以 ChatGPT 为例,大模型可在解方程、信息查询等简单任务上调用工具来实现更准确有效的结果,但在复杂任务上需要调用更多机制才能解决问题。

InternLM-7B 具备了这种通用工具调用能力,使模型在需要工具的时候自动编写一段 Python 程序,以综合调用多种能力,将得到的结果糅合到回答过程,大幅拓展模型能力。

正是在训练 – 评估 – 训练数据分布调整闭环、微调以及工具调用等多个方面的技术创新,才让 InternLM-7B 领跑所有同量级开源模型变成了可能。

大模型开源,就需要全链条

在书生・浦语全链条开源体系中,不仅囊括了丰富多元的训练数据、性能先进的训练与推理框架、灵活易用的微调与部署工具链,还有从非商业机构的更纯粹学术和中立视角出发构建的 OpenCompass 开放评测体系。

与同类型开源体系相比,书生・浦语的最大特点体现在链条的「长」。竞品工具链可能会覆盖从微调到部署等少量环节,但书生・浦语将数据、预训练框架、整个评测体系开源了出来。而且链条中一个环节到另一个环节,所有格式全部对齐,无缝衔接。

上海 AI 实验室围绕书生・浦语大模型打造了五位一体的技术内核。除了大模型本身,值得关注的还有预训练环节开源的面向轻量级语言大模型训练的训练框架 InternLM-Train 以及评测环节的开放评测平台 OpenCompass

我们知道,在现有 AI 大模型开发范式中,预训练 + 微调是主流。可见预训练对于大模型的重要性,很大程度上决定了模型任务效果。而其中底层的预训练框架要在能耗、效率、成本等方面尽可能做到节能、高效、低成本,因此框架的创新势在必行。

书生・浦语开源了训练框架 InternLM-Train。一方面深度整合了 Transformer 模型算子,使得训练效率得到提升。一方面提出了独特的 Hybrid Zero 技术,实现了计算和通信的高效重叠,训练过程中的跨节点通信流量大大降低。

得益于极致的性能优化,这套开源的体系实现了千卡并行计算的高效率。InternLM-Train 支持从 8 卡到 1024 卡的计算环境中高效训练 InternLM-7B 或者量级相仿的模型,训练性能达到了行业领先水平。千卡规模下的加速效率更是高达 90 %,训练吞吐超过 180Tflop,平均单卡每秒处理 token 也超过 3600。

如果说预训练决定了大模型的「成色」,评测则是校验大模型成色的关键一环。当前由于语言大模型的能力边界极广,很难形成全面、整体的评价,因而需要在开放环境中逐渐迭代和沉淀。

书生・浦语开源体系上线了 OpenCompass 开放评测体系,更纯粹学术和中立视角之外,它的另一大特点是基准「全」。除了自己的一套评测基准,OpenCompass 还整合了社区主流的几十套基准,未来还将接纳更多,从而让开源模型更充分地彼此较量。

具体地,OpenCompass 具有六大核心亮点。从模型评测框架来看,它开源可复现;从模型种类来看,它支持 Hugging Face 模型、API 模型和自定义开源模型等各类模型的一站式测评,比如 LLaMA、Vicuna、MPT、ChatGPT 等。InternLM-7B 正是在该平台上完成评测。

从能力维度来看,它提供了学科综合、语言能力、知识能力、理解能力、推理能力和安全性六大维度。同时提供这些能力维度下的 40+ 数据集、30 万道题目,评估更全面。

林达华教授认为,能力维度的广度和复杂度是模型评测面对的最大挑战。一方面要充分考虑如何从不同的维度进行评价,一方面当要评测的指标变多的时候,还要兼顾如何以负担得起的方式去评测。

此外,OpenCompass 非常高效,一行命令实现任务分割和分布式评测,数小时内完成千亿模型全量评测;评测范式多样化,支持零样本、小样本及思维链评测,结合标准型或对话型提示词模板轻松激发各种模型最大性能;拓展性极强,轻松增加新模型或数据集、甚至可以接入新的集群管理系统。

目前,OpenCompass 上线了 NLP 模型的评测,也即将支持多模态模型的评测。

随着 OpenCompass 平台的影响力增加,上海 AI 实验室希望对于大模型基准的评测也会对整个领域起到带动作用。与此同时,在构建 AI 标准化的大模型专题组中,上海 AI 实验室也与很多厂商形成了良好的合作关系。

在大模型快速演进的关键时期,标准制定与实施是推动产业进步的现实需求,也将为产业的可持续发展指明方向。

林达华教授表示:「创新是人工智能技术进步的源动力,而基座模型和相关的工具体系则是大模型创新的技术基石。通过此次书生・浦语的高质量全方位开源开放,我们希望可以助力大模型的创新和应用,让更多的领域和行业可以受惠于大模型变革的浪潮。」

做真正有影响力的工作

值得一提的是,上海AI 实验室成立的时间并不长——成立于 2020 年 7 月。作为一个新型研发机构,其主要开展重要基础理论和关键核心技术。得益于其原创性、前瞻性的科研布局,以及强大的科研团队,实验室近期在多个关键领域实现重大突破。

「我们坚持上下游协同,做出的大模型第一时间在团队中进行分享,在应用中得到反馈,进而持续迭代,」林达华介绍称。

上海 AI 实验室的技术领先,还在于做好三个方面的事:不设定发表论文或盈利的 KPI,做真正前沿有影响力的工作;开放创新空间,鼓励团队间积极交流,勇于尝试不同的方向与想法;最后,实验室为研究团队提供了海量数据和算力作为支持。

此次书生・浦语的开源体系降低了大模型技术探索和落地的门槛,对于学界和业界而言意义重大,帮助更多研究结构和企业省去了基础模型构建的步骤,他们可以在已有的强大模型与工具体系的基础上继续演进,实现创新。

未来,上海 AI 实验室还将基于「书生・浦语」,在基础模型和应用拓展方面进行探索,努力构建适用于关键领域落地的基础模型。

书生开源体系可以大幅降低大模型技术探索和落地的门槛,如果你感兴趣,欢迎来试试。

马斯克成立人工智能公司——xAI

7月13日,马斯克在社交平台宣布,正式成立人工智能公司xAI。其目标是了解宇宙的真实本质。虽然xAI是一个独立的公司,但会与马斯克旗下的特斯拉、Space x等其他公司展开密切的合作关系。

xAI定于周五在线上举办活动,马斯克领导的团队将在线回答提问。其核心团队成员曾经分别在DeepMind、OpenAI、谷歌研究、微软研究、特斯拉等前沿公司或多伦多大学等学术机构任职过。

有媒体分析称,鉴于xAI的团队成员曾参与过AlphaCode、GPT-3.5和GPT-4等项目,马斯克新成立的Xai很可能会进军生成式AI,与ChatGPT、Bard等展开激烈竞争。

比较有意思的是,早在今年3月,包括马斯克在内的1000多名行业高管和专家签署公开信,呼吁在6个月内暂停高级AI的开发。马斯克等人在信中写道,高级AI可能会对社会和人类构成深远的风险。

在今年4月的一栏专访节目中,马斯克说道,“我将启动一个,称之为TruthGPT的东西,或者是一个最大限度地寻求真理的人工智能,它试图理解宇宙的本质。”

马斯克补充称,“我认为这可能是通往安全的最佳途径,从某种意义上说,一个关心理解宇宙的人工智能不太可能灭绝人类,因为我们是宇宙中有趣的一部分。”

当月,就有媒体报道过马斯克成立AI公司的计划。另有消息称,马斯克购买了大约1万个处理大型AI模型数据的GPU。

知情人士透露,他为了这1万个GPU极有可能花费了几千万美元,还多次抱怨推特财务状况不稳定。

值得一提的是,马斯克早在2015年曾担任OpenAI最初的董事会成员。2018年,马斯克辞去了董事会席位,理由是与他担任特斯拉首席执行官的角色“未来可能存在利益冲突”。

但Sam Altman称,马斯克认为 OpenAI 已经落后于谷歌等其他公司,马斯克提议自己接管OpenAI,但董事会拒绝了。

在xAI成立之后,马斯克管理的公司数量达到了6家,其他5家分别是特斯拉、SpaceX,社交媒体平台Twitter、脑机接口公司Neuralink和地下隧道公司The Boring Company。

来源:公众号AIGC开放平台

遏制对除草剂的依赖,Carbon Robotics用人工智能驱动的激光与杂草作战

以下文章来源于城食有农 ,作者城食有農

由 Carbon Robotics 开发的 LaserWeeder 是一款自主机器人,使用人工智能和二氧化碳激光技术来识别和消除田间杂草。据称其精度达到毫米级,不会损坏作物或扰乱土壤。LaserWeeder 的人工智能深度学习了 800 万个作物和杂草对象;在除草任务中,其每小时覆盖 2-4 英亩面积,相当于 75 名人工。

LaserWeeder 还能够间伐作物,以最大限度地提高作物健康和单位面积产量。

根据 Carbon Robotics 首席执行官 Paul Mikesell 的说法,该公司进入除草领域的决定是在与农民交谈后做出的。农田除草最大的挑战不是杂草本身,而是找到足够的劳动力来管理它们。

在美国的大部分农业劳工来自客工和持签证的临时工。然而,农业行业很难找到足够的劳动力来履行这些职责。对于像除草这样的事情,可能是聪明人能做的价值最低的工作,将人力部署到这个领域没有多大意义。

但是,许多种植者别无选择。再加上杂草中出现的除草剂抗性,特别是对草甘膦的抗性,这让农民们对杂草问题感到有点绝望。

LaserWeeder 机器上的计算机视觉能够识别杂草,区分出农作物。这减少了传统农业对除草剂的需求,并能帮助使用再生农法的农民减少或消除过度翻耕。

根据 Carbon Robotics 自己的数据,到目前为止,LaserWeeder 已经“成功消除”了 40 种不同作物的 5 亿多株杂草。

Carbon Robotics 主要专注于特种作物的除草任务,但该公司也已经在大宗农作物方面做了一些工作。Carbon Robotics 的技术对特种作物客户尤为重要,因为现有的除草剂选择并不足够多。

由于特种经济作物会被直接食用,人们关心植物的质量、营养成分和质地。种植者若想提高单位产量,最好方法是非常精确或有针对性的控制杂草,并在不影响植物的情况下除草。因此对于特种经济作物,化学除草剂并非是最好的选择。

这与大宗作物形成鲜明对比,因为大部分小麦和大豆都经过加工并转化为其他东西,所以人们很少关注每株植物的个体质量。

在经济低迷期仍融资 3000 万美元,Carbon Robotics 必有成功之处。可能这要归功于 Carbon Robotics 从一开始就在农田里打造其产品,而非闭门造车。

根据首席执行官 Paul Mikesell 的说法,Carbon Robotics 从第一天开始就在田间工作,了解真实农田环境中水分、热量和湿度,地面条件以及不同地区土壤类型的变化,了解有哪些不同的杂草以及杀死一株杂草需要多少能量。

另外,他们还与农民合作,不断进行早期测试,从而让 LaserWeeder 适应当地不同的耕作方式。

Carbon Robotics 的第一台机器人于 11 个月前发货。2023 年起,该公司将在美国 17 个州和加拿大的三个省提供 LaserWeeder 机器人以及可拖曳的 LaserWeeder 除草系统。 

新资金将帮助该公司扩大制造规模并进入新的地区市场。明年,Carbon Robotics 将进入欧洲,计划扩大工程团队并开发新产品和增强机器功能。

世界人工智能大会落幕,3天推动32个重大产业项目签约

在吸引创纪录的海内外嘉宾与参会者,全面展示人工智能最新发展成果与趋势,推动总投资近300亿元的32个重大产业项目签约之后,以“智联世界  生成未来”为主题的2023世界人工智能大会昨天在上海世博中心落下帷幕。

作为全球人工智能领域最有影响力的盛会之一,世界人工智能大会此前已在上海连续成功举办5届。今年的大会继续发挥“科技风向标、应用展示台、产业加速器、治理议事厅”的重要作用,汇聚世界各国顶尖学者、行业领袖,政府官员,以及相关企业负责人、投资人、创业者等,为他们搭建起世界级的合作交流平台,共话发展,共赢机遇。

本次世界人工智能大会精彩纷呈、硕果累累。短短3天时间内,共举办各类论坛133场,到会嘉宾大咖达1400余位。嘉宾们畅所欲言,围绕火热的大模型和生成式人工智能浪潮,深入探讨新AI赋能千行百业的前景与路径;围绕各类智能应用与产品对算力提出的巨大需求,强调打造上下游联通、软硬件并重、云边端融合的基础设施和智算生态;聚焦科学智能、具身智能、类脑智能、元宇宙、智能机器人等热点领域,强调全面夯实产业基础,激活未来发展动能;聚焦新技术快速迭代对经济、社会、文化等形成的潜在冲击,呼吁在坚持包容审慎、鼓励创新的同时,完善人工智能特别是大模型的相关治理体系。

大会期间举办的人工智能技术和应用展,吸引了创纪录的参观者。今年展览总展出面积超过5万平方米,为历届之最;截至闭幕日下午3点,线下总参观人数突破17.7万,全网流量突破10.7亿,全网曝光量64.1亿,均创历史新高。

闭幕式上,上海市经济信息化委相关负责人就即将出台的“大模型创新发展政策”进行吹风。据介绍,该政策围绕创新能力、创新要素、创新应用、创新环境4个方向,将重点打造3项计划和5个平台,以破解制约该领域发展的瓶颈。记者了解到,所谓3项计划,即大模型创新扶持计划、智能算力加速计划、示范应用推进计划,而重点打造的5个基础支撑平台则包括大模型测试验证与协同创新中心、大模型语料数据联盟、智能算力调度平台、软硬件适配测评中心、大模型开源社区和协作平台。

昨天的闭幕式邀请到一批全球知名商业领军者和创新先锋为行业发展寄语。美国国家工程院院士、AMD董事会主席兼首席执行官苏姿丰,顶级风投机构格雷洛克合伙人、OpenAI创始投资人雷德·霍夫曼,巴斯夫集团执行董事会主席薄睦乐,先正达集团首席执行官傅文德,Stability AI公司创始人兼首席执行官伊玛德·莫斯塔克,分别阐述了各自对于新AI与新商业的见解,表达了对智能未来的热忱憧憬。上海市法学会、上海市人工智能行业协会、商汤科技、复旦大学、达观数据等的代表共同发起《“模”都倡议》,提出更好释放以大模型为代表的人工智能新动能。

昨天还有一批全新的人工智能项目在现场签约,涵盖算力、数据、大模型、硬件、软件等不同领域,有助于上海不断强化创新策源能力,不断凝聚产业发展新动能,不断刷新智能应用新标杆,不断优化开放合作新生态。据统计,本次世界人工智能大会期间,共推动32个重大产业项目签约,总投资288亿元;有超过200家上下游企业完成对接,达成意向采购金额110亿元。

副市长刘多出席。
新AI为数字人注入“灵魂”,但也伴生风险

图片张江科学会堂分会场,观众正在体验一款智能健康检测系统。  本报记者  袁婧  摄

三维技术公司Canbeing创始人金文云为客户定制了许多高拟真的数字人。这些在虚拟网络空间里拥有高颜值、高情商以及动人嗓音的智能体,已开始成为网店的金牌导购、新闻平台的金牌主持,或是课后辅导的金牌教师。但随着事业越来越成功,金文云对于数字人的未来产生了一分困惑。

作为科幻迷,金文云牢记美国科幻作家艾萨克·阿西莫夫为确保人工智能(AI)不伤害人类而提出的“机器人三大定律”。在昨天举行的2023世界人工智能大会“AIGC数字人论坛”上,金文云说,我们要确保数字人不跨越“三大定律”。

和其他新技术一样,数字人考验我们能否“用发展的办法解决发展中的问题”的原则。昨天的论坛实际上给了大家一个难得的机会,去梳理AIGC(生成式人工智能)和数字人这两个当下的热门概念,特别思考二者结合会发生怎样的“化学反应”。

不只是以假乱真

首先要厘清数字人的概念。

AIGC数字人研究院高级研究员唐昱佳说,世界上首个数字人是卡通片《超时空要塞》中的女主角。根据片方安排,她“走出”动画片,在现实世界出版了一张音乐专辑,由此让人看到虚拟IP旺盛的生命力。

受技术所限,第一代数字人主要靠手绘。到本世纪初,随着动作捕捉技术的进步,影视作品中出现了3D数字角色,数字人进入第二阶段。到最近10年,因为深度学习算法突破,AI生成的第三代虚拟角色问世,ta们外形更接近真人(可能还有些CG味),可以按脚本讲话做事。

《每日经济新闻》就是这类技术的使用方。他们在新闻直播节目中引入两个数字主持。有些传奇色彩的是,因为太过逼真,而且从未官宣“身份”,以至于开播两个多月后,观众才意识到两个主播原来是虚拟的。再后来,不知疲倦的数字人逐渐成为电商宠儿。有媒体这样报道新一代数字“劳模”——《凌晨的公司空无一人,带货的全是数字人》。

如果数字人的进化到此为止,也不至于让金文云有什么纠结。但ChatGPT的火爆,让形势开始不同。“AIGC赋予了数字人灵魂。”唐昱佳说。

被AI深度驱动

受技术所限,前几代数字人就算不能用“徒有颜值”描述,至少也缺少完整“人格”。根据唐昱佳的研究,数字人有两种驱动类型:一是真人驱动,也就是让摄像头捕捉真人的动作,然后借助软件,将其套用在数字人的形象上,大致相当于给真人蒙一个“数字面具”;其二则是AI驱动,也就是说,数字人并不完全是真人的影子,他可以脱离真人独立运动、说话。

在ChatGPT等大模型诞生前,哪怕是AI驱动,数字人的表现还是不够到位。

优链时代是一家很有特色的3D数字人制作企业,CEO蒋亚洪透露,他们自研了一套算法以及一种特别的相机,只要用它给真人拍照,就可以迅速建模生成接近真人形象的数字分身。目前,他们已把业务落地,比如将游客的数字分身嵌入西湖美景,生成“元宇宙游杭州”视频;或是让数字人做出真人根本做不到的事——后空翻、大灌篮……上传社交媒体得到点赞。

这样的数字人虽属AI驱动型,但只能按照一套预录制的动作库来做动作,看起来有些生硬,而且也没有聪明到可以与人自如交谈。不过,短板可能很快被弥补。金文云表示,AIGC一定会造就出动作生成模型,从而让数字人可以摆脱预录制的动作库,自己生成丰富的肢体语言。更重要的是,大模型还能让数字人在讲话时彻底摆脱脚本。

上月底正式公测的现象级手游《逆水寒》,就首次导入了一种类GPT模型。游戏中,NPC(非玩家游戏角色)能自主和玩家对话、做动作,让许多人大为惊叹。实际上,这种技术完全可以移植到数字人身上,从而使得数字人不仅相貌逼真,连行为也更趋近真实。

火爆中保持冷静

真人般的外貌、真人般的肢体语言,但AIGC加持下的数字人,还有更远大的目标。

创壹科技是国内最具影响力的数字人公司之一,曾创造出顶流网红数字人“柳夜熙”。CEO梁子康昨天说,数字人是通往元宇宙时代的钥匙,而要打通虚实之间的界限,就得让数字人拥有接近真人的情感,“没有情感的数字人,只能做电商主播,根本没什么人会去看。”

目前,创壹科技已在情感仿真方面做了许多工作。梁子康透露,未来3年,他们的目标是打造出一个元宇宙数字人IP矩阵。

更多可马上落地的商业模式已经出现。商汤科技副总裁李星冶表示,他们不久前发布了一款App,普通人用手机自拍5分钟视频,就可以生成数字人,能讲150多种方言和外语。除了满足普通用户外,商汤科技还在推行一个“百变大咖”计划,将为100位意见领袖制作数字分身。

有了AIGC的赋能,数字人有望在以下场景落地——成为娱乐偶像、电商主播,或者在新闻、医疗、教育、法律等专业领域扮演专业角色。总体上,这个市场有望在10年内达到数百亿元规模。甚至,想得更远的唐昱佳认为,随着大模型和AIGC工具的繁荣,未来所有人都会拥有自己的数字分身,“人人都可以实现数字永生”。

中国将出台生成式人工智能监管规定

中国将出台生成式人工智能监管规定

中国将出台关于生成式人工智能(generative AI)的监管规定。目前,正寻求在鼓励本土企业开发这种革命性技术与想要控制其内容之间取得平衡。


两名与中国监管机构关系密切的人士表示,国家互联网信息办公室想要建立一套制度,要求企业须先获得许可证才能推出生成式人工智能。

这一要求比今年4月发布的监管草案更加严格。草案为企业提供了更大的操作空间,因为允许企业在产品推出后10个工作日内向有关部门进行备案。

新的许可证制度表明,中国正在协调其开发世界一流技术的雄心与其长期存在的审查制度。据知情人士透露,包括许可证制度在内的监管规定最早将于本月敲定。

“如果中国打算完全管控并审查人工智能生成的信息,他们将要求所有企业事先取得有关部门的批准。”一位了解网信办想法的人士表示。“但相关监管一定不能妨碍国内企业参与这场科技竞赛。”该人士补充道。