人工智能行业岗位一览

人工智能行业的岗位薪资高、待遇好、涨薪快已经是公开的事实,那么在人工智能行业中具体有哪些职业岗位呢?对于普通人来说,想要入行人工智能又有哪些机会呢?

下面是人工智能领域中的一部分职业岗位,随着技术的不断发展,未来还会涌现出更多新的职业机会。无论你的兴趣是什么,相信都可以找到与人工智能相关的职业岗位。

1. **人工智能算法工程师**:作为专业的人工智能算法工程师,可以负责设计、开发和优化人工智能算法,用于解决各种实际问题,如图像处理、自然语言处理、语音识别、推荐系统等。

2. **数据科学家**:可以应用人工智能算法和技术,从大规模数据中提取有价值的信息,进行数据分析、建模和预测,为企业决策提供支持。

3. **机器学习工程师**:专注于机器学习算法的开发和应用,可以设计和实现各类机器学习模型,用于数据挖掘、分类、聚类等任务。

4. **深度学习工程师**:具备深度学习算法的实际应用和开发能力,可以处理复杂的数据,如图像、声音和文本等,解决模式识别和决策问题。

5. **自然语言处理(NLP)工程师**:专注于处理和分析人类语言的计算机应用,如机器翻译、情感分析、智能客服等。

6. **计算机视觉工程师**:负责图像和视频数据的处理和分析,开发图像识别、目标检测、人脸识别等应用。

7. **人工智能产品经理**:了解人工智能技术和应用,负责规划、设计和推广人工智能产品,满足市场需求。

8. **智能硬件工程师**:结合人工智能技术,开发智能硬件产品和应用,如智能家居、智能机器人等。

9. **人工智能咨询顾问**:对人工智能技术有深刻理解,能够为企业或机构提供人工智能相关的咨询和建议。

10. **教育培训人员**:可以成为培训机构或企业的人工智能技术培训师,传授人工智能算法和技术的知识与实践。

11. **人工智能研究员**:投身于人工智能前沿的研究,推动人工智能技术的不断创新和发展。

12. **人工智能项目经理**:负责领导和管理人工智能项目的规划、执行和交付,协调跨部门合作,确保项目按时、按质完成。

13. **人工智能工程师团队负责人**:领导人工智能团队,监督团队的技术进展、项目计划和资源分配。

14. **人工智能系统架构师**:设计和构建复杂的人工智能系统架构,确保系统的性能、可扩展性和稳定性。

15. **人工智能数据工程师**:负责数据的采集、清洗、预处理和存储,为人工智能算法提供高质量的数据支持。

16. **人工智能训练师**:负责数据标注和处理,以及对模型的训练和调优等,保障人工智能模型的训练能够达标。

17. **人工智能运维工程师**:负责维护和管理部署在生产环境中的人工智能系统,保障系统的稳定运行。

18. **人工智能伦理与合规专家**:关注人工智能的伦理和法律合规问题,提供合规性建议,确保人工智能应用的合法合规性。

19. **人工智能创业者**:基于持有的人工智能算法技能,创办自己的人工智能相关企业,开发创新的人工智能产品和服务。

20.**人工智能法律顾问**:关注人工智能法律法规,为企业提供人工智能项目合规性评估和法律咨询。 

21. **人工智能商务拓展经理**:将人工智能技术应用于商业领域,开展市场拓展、业务合作,推动人工智能产品和服务的商业化。

22. **人工智能售前工程师**:配合人工智能销售人员,进行人工智能产品方案的编写、宣讲等,完成人工智能产品的销售。

23**人工智能领域的作家和科普者**:利用专业知识,撰写人工智能领域的文章、书籍或博客,推动公众对人工智能的理解和认知。

24. **人工智能医疗专家**:将人工智能技术应用于医疗领域,参与医学图像分析、疾病预测等应用。

25. **人工智能金融分析师**:将人工智能应用于金融领域,进行风险评估、交易预测、投资分析等工作。

26. **人工智能产品测试工程师**:负责测试人工智能产品的性能、稳定性和安全性,确保产品符合质量标准。

27.**人工智能音乐创作者**:探索人工智能在音乐创作中的应用,创造出新颖、独特的音乐作品。

28. **人工智能农业专家**:将人工智能技术应用于农业领域,进行作物病虫害识别、精准农业管理等工作。

29. **人工智能环保专家**:利用人工智能技术解决环境保护问题,如空气质量预测、垃圾分类等。

30.**人工智能游戏开发者**:将人工智能技术融入游戏开发,创造更智能、逼真的游戏体验。

31. **人工智能用户体验(UX)设计师**:结合用户需求和人工智能技术,设计用户友好的界面和交互体验。

32. **人工智能创意艺术家**:将人工智能技术应用于创意艺术创作,创造出独特的艺术作品。

33. **人工智能社会学家**:研究人工智能对社会、文化和伦理的影响,提出相应的社会政策建议。

34. **人工智能可视化专家**:利用数据可视化技术,将复杂的人工智能算法和数据呈现为易于理解的图形。

35. **人工智能安全专家**:关注人工智能系统的安全漏洞和风险,提供安全性评估和解决方案。

36. **人工智能跨学科研究员**:将人工智能技术与其他学科结合,探索交叉领域的研究问题。

37. **人工智能虚拟现实(VR)/增强现实(AR)开发者**:将人工智能与虚拟现实或增强现实技术相结合,开发交互式应用。

38. **人工智能社交媒体分析师**:利用人工智能技术分析社交媒体数据,洞察用户行为和趋势。

39. **人工智能语音技术工程师**:专注于语音识别、合成和处理技术,开发智能语音助手和应用。

40. **人工智能机器人工程师**:将人工智能技术应用于机器人控制和决策,开发智能机器人系统。

41. **人工智能交通系统优化师**:应用人工智能技术,优化交通流量、减少拥堵和提升交通安全。

42. **人工智能社交媒体营销专家**:运用人工智能分析工具,制定社交媒体营销策略,优化用户互动和品牌影响力。

43. **人工智能气候模拟研究员**:将人工智能应用于气候模拟和预测,为应对气候变化提供数据支持。

44. **人工智能文化遗产保护者**:利用人工智能技术,数字化和保护文化遗产,如艺术品、历史文物等。

45. **人工智能物流规划师**:应用人工智能技术,优化物流和供应链规划,提高效率和减少成本。

46. **人工智能体育分析师**:利用人工智能技术,进行体育数据分析,优化训练和比赛策略。

47. **人工智能人力资源专家**:结合人工智能技术,进行招聘、绩效评估和人才管理。

48. **人工智能智能驾驶工程师**:将人工智能技术应用于自动驾驶系统,提高驾驶安全性和便捷性。

49. **人工智能家庭健康顾问**:结合人工智能技术,为家庭提供健康管理和咨询服务。

50. **人工智能跨界艺术家**:将人工智能技术与艺术相结合,创作跨界作品,如艺术装置、数字艺术等。

51. **人工智能决策支持分析师**:应用人工智能技术,为企业和组织提供决策支持和数据洞察。

52.**人工智能社交心理学家**:研究人工智能对人类社交和心理健康的影响,提供相关建议和方案。

上面这些职业方向代表了人工智能领域的更多可能性,无论是已经从事相关领域还是准备进入人工智能领域,都可以找到相似的岗位。在这些岗位中,排名第一的人工智能算法工程师是所有岗位中的核心岗位,因为人工智能之所以有智能,就是因为算法的存在,在人工智能的构成要素中,算法相当于人类的大脑,可以想象一下,没有了大脑的人类会是怎么样。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

谷歌发布多平台应用开发神器:背靠 AI 编程神器 Codey,支持 React、Vue 等框架,还能补全、解释代码

8 月 8 日,谷歌宣布推出 AI 代码编辑器 IDX,旨在提供基于浏览器的人工智能开发环境,用于构建全栈网络和多平台应用程序。谷歌在创建 IDX 时并没有构建新的 IDE(集成开发环境),而是使用 VS Code 作为其项目的基础。目前,IDX 支持 Angular、Flutter、Next.js、React、Svelte 和 Vue 等框架以及 JavaScript 和 Dart 等语言,后续还将支持 Python、Go 和其他语言。

据了解,IDX 是基于 Google Cloud 构建的一整套浏览器开发体验,由 Codey 提供支持。IDX 项目还以 Code OSS 编辑器为基础。当前,IDX 还未大面积开放,只有少数指定测试人员能够亲身参与体验。不过 IDX 团队透露,在即将召开的 Google Cloud Next 大会上,可能会有更多 Codey 现有成果及未来发展计划的消息与广大开发者见面。IDX 团队表示:

我们花费了大量时间编写代码,AI 的最新进展则创造了巨大的机会空间,能让我们更高效地利用时间。通过 IDX 项目,我们正探索谷歌在 AI 领域的创新成果(包括为 Android Studio 中的 Studio Bot 提供支持的 Codey 与 PaLM 2 模型、Google Cloud 中的 Duet 等)如何帮助开发者加快代码编写速度、提高代码编写质量。

IDX 团队在博文中提到,时至今日,从零开始构建应用(特别是能在移动、Web 和桌面平台上良好运行的应用)的难度简直不逊于制造鲁布·戈德堡机械(Rube Goldberg machine,一种被设计得过度复杂的机械组合)。开发者需要在无尽的复杂性之海中航行,将种种技术栈粘合起来,奋力摸索出一条能够正确引导、编译、测试、部署和监控应用的路线。

虽然谷歌多年来一直致力降低多平台应用的开发难度,也先后推出了 Angular、Flutter、Google Cloud 乃至 Firebase 等成果,但似乎还能做得更好。毕竟当下的多平台应用开发还远远称不上快速、顺畅。所以几个月前,谷歌的几个小伙伴聚在一起开始尝试,而这场实验的早期成果就是 IDX 项目(http://idx.dev/)。

团队之所以决意构建 IDX 项目,一个重要原因就是希望听取广泛开发者社区的意见,了解哪些要素能帮助大家提升工作效率。

具体来说,IDX 项目当前主要可实现以下功能:

1. 随时随地,快速工作。IDX 项目的核心是帮助开发者在任何位置、任何设备上进行开发,并且获得完全保真的本地开发体验。IDX 项目中的每个工作区都具备基于 Linux 虚拟机的全部功能,并配有托管在开发者邻近云数据中心的通用访问权限。

2. 可导入现有应用,也可创建新应用。IDX 项目允许开发者从 GitHub 处导入现有项目,随时从上次完成的位置继续开发。开发者也可以使用各类流行框架的预制模板创建新项目,包括 Angular、Flutter、Next.js、React、Svelte、Vue 以及 JavaScript 和 Dart,并即将推出对 Python 与 Go 语言的支持。此外,IDX 团队还在积极努力为更多项目类型和框架提供最佳支持。

3. 跨平台实现应用预览。如今,构建成功应用意味着要对应用的设计和行为做跨平台优化,并以用户“所见即所得”的方式预览应用效果。为了降低这一切的实现门槛,IDX 项目提内置有 Web 预览功能,而且即将推出经过完善配置的 Android 模拟器与嵌入式 iOS 模拟器。所有这些,都可以在浏览器中直接使用。

4. 结合 AI 技术。目前,IDX 项目的 AI 功能尚处于早期阶段,但已经拥有智能代码补全、辅助聊天机器人以及“添加注释”和“解释此代码”等结合上下文的代码操作。

5. 借助 Firebase Hosting 实现 Web 发布。将应用投入生产的一大常见痛点就是部署流程。IDX 项目集成了 Firebase Hosting 以降低整个操作难度,只需单击几下,即可部署 Web 应用的可共享预览,或者使用快速、安全的全球托管平台将其部署至生产环境。由于 Firebase Hosting 能够支持基于 Cloud Functions 的动态后端,因此能够与 Next.js 等全栈框架良好配合。

IDX 团队表示,目前 IDX 项目才刚刚起步,距离最终的端到端开发流程改进还有很长的路要走。希望开发者可以注册成为首批 IDX 项目体验者,大家携手发现的问题将为项目的后续迭代方向、以及还需哪些新增功能以匹配应用团队的工作流程带来指引。

至于下一步计划,IDX 团队称,将不断努力添加新功能并解决开发者反馈的问题。“我们已经在研究新的协作功能,因为我们深知这项功能在如今混合办公时代下的重要意义。此外,更深入的框架集成和个性化 / 情境化 AI 选项也在筹备当中。期待听到大家提出的更多功能需求!”IDX 背后的 AI 模型 Codey

根据介绍,IDX 由 Codey 提供支持。

在 Google I/O 2023 大会上,谷歌正式发布 Codey。这是一款新型 AI 驱动工具,能够编写并理解代码内容。这款新工具被外界视为谷歌对于 GitHub Copilot 的回应,属于同 Replit 结盟打造的成果。

Codey 基于谷歌的下一代大语言模型 PaLM 2,并采用谷歌自家产品代码及大量合法许可的源代码作为训练素材。更重要的是,Codey 仍在不断学习和发展,从谷歌服务生态系统的各个项目中持续汲取新的力量。

Codey 支持 20 多种编程语言,包括 Go、谷歌标准 SQL、Java、JavaScript、Python 以及 TypeScript。开发者可以通过 Visual Studio Code、JetBrains IDE、Google Shell 编辑器以及 Google Cloud 托管工作站服务的扩展来访问 Codey。开发者能够直接在 IDE 的聊天框中与该模型交流(例如 Android Studio Bot),或者在文本文件中编写注释以指示其生成相关代码。它支持各种编码任务,通过以下方式帮助开发人员更快地工作并缩小技能差距:

  • 代码完成:Codey 根据提示中输入的代码上下文建议接下来的几行。
  • 代码生成:小程根据开发人员的自然语言提示生成代码。
  • 代码聊天:Codey 允许开发人员与机器人对话,以获得调试、文档、学习新概念和其他与代码相关问题的帮助。

Codey 在处理与编码相关的提示词方面接受了专门训练,谷歌还通过其他训练让该模型学会了处理关于 Google Cloud 的一般查询。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

成功在于远见?英伟达CEO称英伟达5年前把一切都押在了AI上

随着之前GPT-4语言模型的正式投入使用,ChatGPT也带来了全新的插件——网络浏览器和代码解释器,赋予ChatGPT使用工具、联网、运行计算的能力。

而在现在的市场上,英伟达的AI计算芯片就成为了“抢手货”,也使得英伟达迅速扭转在独立显卡需求下降后的利润下降。并且据相关分析师称,ChatGPT有点像开始了一场军备竞赛,英伟达是远远领先的。

据相关媒体报道,黄仁勋今年的财富攀升了33%,达到184亿美元,这与去年形成鲜明对比,去年其财富下降是科技巨头中最大的之一。英伟达最初专注于创建计算机芯片和 GPU,现在已经成为为人工智能应用提供动力的主导者,从自动驾驶汽车到机器人到加密货币开采,虽然目前加密货币正在走下坡路,但是智能聊天机器人系统ChatGPT带给了英伟达新的商机。

此前,英伟达 CEO 黄仁勋表示,人工智能将使所有人只需对着电脑说话就能变身程序员,这意味着“数字鸿沟”被填平。黄仁勋称,人工智能正在引领一场计算革命。“毫无疑问,我们正处于新的计算时代。”

“编程门槛变得极低。我们填补了数字鸿沟,现在,所有人都是程序员 —— 你只需要对着电脑说话即可。”黄仁勋说,“由于如此便于使用,所以进步的速度飞快,这会影响几乎每个行业。”

而在今日的SIGGRAPH大会上,英伟达创始人兼CEO黄仁勋发表了主题演讲,他表示,该公司在 2018 年做出了一个关乎生死存亡的商业决定,但很少有人意识到这将重新定义其未来和帮助重塑一个不断发展的行业。黄仁勋在演讲中回顾了五年前的那个转折点,那就是选择采用AI处理图像的方式,即光线追踪和智能渲染:分别是RTX和DLSS技术。他说:“我们意识到光栅化已经达到了极限。”光栅化是传统的、广泛使用的渲染3D场景的方法。“2018年是一个‘孤注一掷’的时刻,要求我们重新发明硬件、软件、算法。而当我们用AI重新发明CG时,我们也在重新发明GPU用于AI。”

黄仁勋坚称,这只是开始。新的模型不仅需要被训练,还需要被数百万甚至数十亿用户定期实时运行。但相关媒体称,黄仁勋仅仅提及了未来AI的发展前景,并未提及目前AI所面对的信息安全方面的监管难题,至于后续英伟达会在AI方向作何调整,感兴趣的小伙伴可以保持关注。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

AI公司疯抢GPU,分析师:英伟达泡沫将破

由于计算需求旺盛的生成式人工智能没有显示出放缓的迹象,一些公司开始使用 Nvidia 难以获得的、超昂贵的高性能计算 H100 GPU 来进行大型语言模型 (LLM) 训练,这正在成为“特斯拉前 AI 总监、现任 OpenAI 的安德烈·卡帕蒂 (Andrej Karpathy) 表示,这是硅谷“头号八卦”。

Karpathy 发表此番言论之际,大型科技公司的年度报告甚至都在讨论与 GPU 访问相关的问题:在微软上周发布的年度报告中,该公司向投资者强调,GPU 是“其快速增长的云业务的关键原材料”。”并将有关 GPU 的语言添加到“如果无法获得所需的基础设施,可能会出现中断的风险因素”。

Karpathy 在社交网络 X(以前的 Twitter)上转发了一篇广为流传的博客文章,该文章被认为是由 Hacker News 上的发帖者撰写的,该文章推测“小型和大型云提供商的大规模 H100 集群的容量即将耗尽, ”并且 H100 需求至少将持续到 2024 年底。

作者猜测 OpenAI 可能需要 50,000 个 H100,而 Inflection 需要 22,000 个,Meta“可能需要 25k”,而“大云可能需要每个 30k(Azure、Google Cloud、AWS 以及 Oracle)。Lambda 和 CoreWeave 以及其他私有云可能总共需要 100k。他写道,Anthropic、Helsing、Mistral 和Character 可能各要10k。

作者表示,这些估计“完全是粗略估计和猜测,其中一些是对云计算和将从云计算租用的最终客户进行了重复计算。” 但这达到了大约 432k H100。每块价格约为 35K 美元,GPU 的价值约为 150亿美元。这还不包括像字节跳动(TikTok)、百度和腾讯这样需要大量 H800 的中国公司。还有一些金融公司从数百台 A100 或 H100 开始进行部署,然后扩展到数千台 A/H100:例如 Jane Street、JP Morgan、Two Sigma、Citadel。”

Radical Ventures 合伙人 David Katz最近告诉 VentureBeat,与人工智能芯片争夺战最接近的类比是电视剧《权力的游戏》 。“为了运行这些模型和大型模型,需要对计算有永不满足的需求,”他说。

去年,Radical 投资了 CentML,它优化了机器学习 (ML) 模型,以提高工作速度并降低计算成本。他表示,CentML 的产品在市场上创造了“更高一点的效率”。此外,它还证明了复杂的、超过十亿个参数的模型也可以在传统硬件上运行。

“所以你不需要相同数量的 GPU,或者你不一定需要 A100,”他说。“从这个角度来看,它本质上是在增加市场上芯片的产能或供应。”

然而, d-Matrix首席执行官 Sid Sheth 表示,这些努力对于那些从事人工智能推理工作的人来说可能更有效,而不是从头开始训练LL,。该公司正在构建一个平台,通过在计算机中进行更多处理来节省推理成本 。内存上,而不是 GPU 上。

他最近对 CNBC 表示:“推理的问题在于,如果工作量激增得非常快,就像 ChatGPT 发生的情况一样,它会在五天内增加一百万用户。” “你的 GPU 容量无法跟上,因为它不是为此而构建的。它是为训练和图形加速而构建的。”

对于 LLM 训练——包括 OpenAI、Anthropic、DeepMind、Google 以及现在埃隆·马斯克的 X.ai 在内的所有大型实验室都在进行——Nvidia 的 H100 是无可替代的。

这对于像 CoreWeave 这样的云初创公司来说是个好消息,因为 CoreWeave 准备从 GPU 云中赚取数十亿美元,而且 Nvidia 正在提供大量 GPU,因为 CoreWeave 并没有构建自己的 AI 芯片来竞争。

McBee告诉 VentureBeat,CoreWeave 去年的收入为 3000 万美元,今年将达到 5 亿美元,明年已经签订了近 20 亿美元的合同。CNBC  6 月份报道 称,微软“已同意在未来几年内斥资数十亿美元购买初创公司 CoreWeave 的云计算基础设施。”

“这一切发生得非常非常快,”他说。“我们正在努力满足大量积压的客户需求。我们目前还在 12 个不同的数据中心进行建设。我正在从事当今地球上最大的基础设施建设之一,而在一家三个月前你从未听说过的公司。”

他补充说,人工智能的采用曲线是“有史以来上市的任何软件中最深入、最快的采用”,而训练这些模型所需的特定类型计算的必要基础设施却跟不上。

但 CoreWeave 正在尝试:“自 4 月份以来,我们已经将下一代 H100 计算交给了世界领先的人工智能实验室,”他说。“直到第四季度你才能从谷歌获得它。我认为亚马逊的……预定预约要到第四季度才会出现。”

他表示,CoreWeave 正在帮助 Nvidia 更快地将其产品推向市场,并“帮助我们的客户从中获得更多性能,因为我们以比超大规模厂商更好的配置构建它——这促使 [Nvidia] 对我们进行投资,这是这是他们做出的唯一云服务提供商投资。”

就 Nvidia 而言,一位高管表示,问题不在于 GPU 短缺,而在于这些 GPU 如何进入市场。

Nvidia DGX Systems 的副总裁兼总经理 Charlie Boyle 表示 Nvidia 正在“建设充足的产品”,但也谈到了很多短缺问题。云提供商之间的差异归结为已经预售给客户的产品。

“在系统方面,我们一直对客户的供应非常敏感,”他在最近的一次采访中告诉 VentureBeat。他解释说,对数千个 GPU 的请求将需要更长的时间,但“我们可以满足大量此类需求。”

他解释说,过去七年他学到的一点是,归根结底,这也是一个供应链问题——因为供应商提供的小组件可能更难获得。“因此,当人们使用 GPU 短缺这个词时,他们实际上是在谈论主板上某些组件的短缺或积压,而不是 GPU 本身,”他说。“这些东西的全球制造有限……但我们预测人们想要什么以及世界可以建造什么。”

博伊尔表示,随着时间的推移,“GPU 短缺”问题将“从围绕短缺的炒作与某人制定糟糕计划的现实来看,逐渐从叙事中消失。”

摩根士丹利策略师表示,人工智能股票的泡沫已接近顶峰,他们指出 Nvidia 公司今年的涨幅超过 200%。

摩根士丹利策略师爱德华·斯坦利在一份报告中写道,根据历史背景,这次股市飙升将处于“后期”。“泡沫在高峰前的 3 年里往往会上涨 154% 的中值。”

尽管英伟达一直是人工智能领域令人兴奋的典型代表,但斯坦利表示,更广泛的人工智能基准,如 MSCI 美国 IMI 机器人和人工智能精选净美元指数,上涨幅度要小得多。该指标上涨了约 47%。

这家总部位于加利福尼亚州圣克拉拉的公司一直处于今年人工智能热潮的核心,其乐观的前景证明人工智能计算的支出正在推动销售。

可以肯定的是,整个行业的股票并不具有统一的特征。因此,斯坦利表示,考虑到个人名字的特殊性,“只有在指数水平上才能有效或公平地得出泡沫上升和下降速度的结论。”

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

全场景能力跃迁!广汽AI大模型平台首发亮相

8月8日,广汽正式推出AI大模型技术的最新研发成果——广汽AI大模型平台,该平台是汽车行业首创的大模型平台技术,将在近期搭载于高端智能轿跑昊铂GT亮相。

广汽AI大模型平台聚合了多种AI大模型,并与广汽智能网联底层能力深度融合,不仅能调用通用大模型的能力,还能基于智能汽车的应用场景构建专用模型,实现全场景智能体验的跃迁。

广汽AI大模型平台具备什么能力?

广汽AI大模型平台以海量的用车和研发数据集为基础,将结构化数据汇聚到AI中台,通过中台训练形成多种特定场景模型;平台可以根据应用需要,灵活调用多个模型,从而获得最优的推理结果,让应用服务精准、高效运行。

广汽AI大模型平台框架

基于广汽星灵电子电气架构的原子化服务能力,广汽AI大模型平台与车端能力和云端生态深度融合,让AI大模型平台成为全场景应用的入口,重塑智能汽车场景交互范式。

广汽AI大模型平台将率先落地什么功能?

广汽AI大模型平台将率先落地智能语音交互场景。基于该平台,智能语音可结合各种模型优势,运用车端本地推理能力和云端混合模型技术,实现精准的上下文语义理解;并结合广汽魔方场景共创平台与丰富的云端生态服务,全面提升语音的智能化和情感化,为用户带来更愉悦的使用体验。

目前,广汽AI大模型平台在不断测试与迭代中,已表现出相当高的“智商”和“情商”。

语音能力跃迁

基于环境和情绪状态感知,广汽AI大模型平台能更好地理解用户意图,实现更深层次的个性化和“类人”的交互。

自由对话:更加准确的语义理解模型,实现“类人”的自由交流。

移动百科:上知天文下知地理,旅途中的风土人情无所不知。

用车体验跃迁

广汽AI大模型平台将赋能移动出行体验,覆盖全场景用车服务,更深一层为用户解决旅途中的难题。

用车助手:全面集成智能汽车知识图谱,覆盖所有场景与功能,便捷获取使用指南和操作入口,提供贴心的用车服务。

行程规划:基于用户偏好、位置、环境感知和生态服务等,精准匹配用户出行需求,自动生成游玩攻略。

AI超级大脑

广汽AI大模型平台还具备强大内容生成与计算能力,让智能座舱成为解决复杂问题的超级大脑。

创作助手:自主创作内容,分析并提炼信息,提升创作和阅读效率。

超级大脑:结合大语言模型和计算引擎能力,可解析数理问题,并提供推理与运算过程。

广汽AI大模型平台改变了机械式的语音交互,将“一问一答”的形式升级为无门槛、直觉式的自然对话,让智能座舱真正具备“高情商”和“超智慧”。相关能力将在充分验证成熟后,通过OTA与车主见面。

广汽AI大模型平台还将带来哪些变化?

不仅智能座舱的体验将被颠覆,广汽AI大模型平台还将赋能智能驾驶。广汽一直积极探索人工智能在智能汽车感知、决策的应用,由全球人工智能顶级专家陈学文领衔、以纯视觉路线为主的世界前沿自动驾驶全栈自研X Lab团队,已在泊车和行车领域取得突破性进展。广汽AI大模型平台的应用将进一步提高智能驾驶的感知能力,提升智能驾驶的安全性和可靠性。

除了智能汽车本身,广汽AI大模型平台还将带来智能网联全链路的升级。大模型平台应用到正向研发领域,将促进软件开发、虚拟验证、仿真测试等环节的效率,加快智能汽车迭代升级。在数字化领域,大模型将提升多模态数据的挖掘能力和效率,结合海量数据和大量案例,为智能汽车提供智能诊断、健康预测的能力,建立全生命周期健康专家系统。

当前,智能驾驶和智能座舱的广泛普及,让汽车承载了更多生活属性。AI大模型的应用,将赋予智能汽车“智商”和“情商”,使之变得“类人”,充满智慧。广汽将基于自身在人工智能和智能网联领域的积累,联合星河智联、科大讯飞等业内顶尖合作伙伴,持续聚合行业先进的大模型解决方案,不断研发和丰富专用模型,为用户打造人车交互新范式,提升全场景智能体验。

广汽AI大模型平台将在近期搭载于高端智能轿跑昊铂GT亮相,届时大家将率先体验到该平台的智能语音交互能力,更多能力也将陆续揭晓,敬请拭目以待。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

2023:人工智能的“奇点”,隐私计算的“原爆点”

2023年初,ChatGPT横空出世,标志着生成式人工智能崛起。

作为一种新兴的数据安全技术范式,隐私计算借此契机,再次成为焦点。

近日,召开的2023中国人工智能大会共有8个平行专题论坛,其中就包含聚焦隐私计算的“隐私计算与人工智能发展专题论坛”。无独有偶, 今年7月初举办的2023世界人工智能大会上,同样针对隐私计算技术开设了“数据要素与隐私计算高峰论坛”

2023年,被视为隐私计算“融合应用之年”,是隐私计算在多个行业场景大规模应用的关键年份,在人工智能加速落地的时代,这一“数据安全技术基座”将迎来更多的爆发机遇。

隐私计算是在保护数据本身不对外泄露的前提下实现数据分析计算的技术集合,达到对数据“可用、不可见”的目的;在充分保护数据和隐私安全的前提下,实现数据价值的转化和释放。基于这一特性,隐私计算可以确保在不泄露数据内容的情况下,帮助人工智能获取更多、更广、更深的数据资源。

从1949年香农开创现代密码学时代起,安全多方计算、零知识证明被陆续提出,多种新的技术路线和隐私计算方案(例如混淆电路、基于秘密分享的MPC、半同态加密等协议和算法等)也陆续出现,七十余年间,隐私计算的技术体系逐步发展和壮大,并开始有大规模的项目落地。

2019年后,隐私计算进入应用期,在数据要素市场建设和数据价值发挥的时代背景下,产业需求快速增长,隐私计算走出学院派与实验室,广泛与行业应用场景相结合。各类隐私计算厂商也如雨后春笋一般涌现出来,激发了隐私计算技术可用性的快速提升。

时间来到2023年。数字经济建设提档加速,人工智能方兴未艾,人们开始了对区块链、元宇宙等概念的探索。新技术崛起,为隐私计算带来了全新的挑战与机遇。

融合发展:人工智能带来挑战与机遇

2023中国人工智能大会期间,上海交通大学讲席教授、博导、日本工程院外籍院士李颉在演讲中指出,人工智能的三大基础是算法、数据、算力聚焦数据层面,如何在合规尊重用户隐私的条件下充分发挥数据价值,如何打破壁垒、连接数据孤岛、提高可用数据的数量和质量 ,已成为人工智能发展需要解决的关键问题,而隐私计恰恰就是打破数据孤岛、拓展数据疆界的关键技术。

人工智能技术革命背后意味着巨大的隐私挑战。

在以深度学习为主导的人工智能浪潮中,基于大数据的深度学习技术最开始在互联网领域成功落地,并广泛运用于搜索、推荐、语音识别、机器翻译等各个方面。随着人工智能超级模型工作的推进,算法训练模型所使用的数据规模越大,模型参数规模越大,模型在使用时候识别精度就越高。至此,AI进入大模型时代,并有望在医疗、金融、教育等数据丰富的行业首先落地。

AIGC的出现标志着人工智能发展史走到了“奇点”。数字技术迎来颠覆性的变局,也将会带来新的冲击和挑战。尤其是AIGC的训练过程基于大量数据集,这一属性也会使数据收集、使用、流通和计算面临更多合规要求。因此,在展望AIGC未来的同时,仍需要增强隐私计算技术的应用,并通过建立监管机制、增强相关立法,确保AIGC合规发展。

未来方向:乘时乘势,带入千行百业

AIGC崛起,有望成为隐私计算迎来“原爆点”的契机。

在技术层面,隐私计算不同技术路线正在走向融合,实现“1+1>2”的效果。与此同时,隐私计算与区块链、人工智能、工业互联网也逐步融合,尤其是隐私计算与硬件的结合已产生多款一体机等软硬件结合产品,预计将会越来越丰富。聚焦AIGC,当前业内均在尝试使用各种方式保护用户数据隐私。除了较为直接的方法,如向用户提供警告信息之外,隐私计算也已成为AIGC中隐私保护的重要工具,联邦学习和可信执行环境是其中较有代表性的技术路线。

在AIGC服务的生命周期中,用于训练的大规模数据集和用户的私人信息需要得到保护,可以利用联邦学习来解决训练数据的安全问题。由于AIGC应用与互联网高度集成,用于AIGC模型训练的数据发生在边缘服务器和移动设备上,它们对各种威胁隐私的攻击的防御能力较弱。最近,研究人员已经提出几个分布式学习框架用于隐私保护,利用联邦学习技术,可以实现在边缘服务器和移动设备上进行模型微调和推理,联邦学习在训练期间不传输原始数据,从而确保AIGC模型训练过程的安全性。

在此基础上,将可信执行环境(TEE)和联邦学习技术结合,可以为大语言模型提供更完善的隐私和数据保护。借助基于TEE的联邦学习解决方案,在训练阶段,TEE中的数据处理都处于加密状态,在推理阶段TEE能够保护用户输入和模型结果的隐私;同时,TEE的硬件隔离和安全验证机制可以防止未经授权的访问和攻击,增强模型运行时的安全性。

伴随着技术的不断成熟,国内外隐私计算产业化的步伐明显加快。未来几年,将是隐私计算技术产品加速迭代、应用场景快速拓展、产业生态逐步成熟的重要阶段。

AIGC的“奇点”为契机,隐私计算有望迎来“原爆点”,被带入千行百业。联邦学习、TEE等多种技术体系间也将实现更深刻的融合。

在不远的将来,这项技术将如同移动互联网、水、电网一般,成为数字时代的底层基础设施。

来源:中国网

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

好戏开场!马斯克与扎克伯格的世纪大战,将在X平台直播

8月7日消息,X平台(推特)CEO埃隆·马斯克与Meta CEO马克·扎克伯格的“约架”一事,成了很多“吃瓜”网友关注的重点。

马斯克称,与扎克伯格之间的“八角笼约架”将在X平台直播,他表示“我肌肉长得很快,体力耐力是我的弱点,所以我打算速战速决。”

对于网友提出的“这次格斗意义是什么”的问题,马斯克回答称,“这是一种文明的战争形式。”

扎克伯格在Threads回应了马斯克的“约架”,他表示,“已经准备好了,建议日期定在8月26日,但马斯克没有确认”,扎克伯格还希望能换一个平台:“难道我们不应该使用一个更可靠的平台,可以为慈善机构筹集资金吗?”扎克伯格说。

据悉,6月20日,马斯克称准备和扎克伯格进行一场“笼中格斗”。扎克伯格随即应战称,“地址发我。”马斯克随后给出地址,“拉斯维加斯八角笼”。自此,双方达成“约架”。

对于这场“约架”,马斯克母亲梅耶尔·马斯克为自己儿子担心称“不要乱开玩笑,打打嘴仗算了,不要动武。”

值得一提的是,在前不久推特大乱时,扎克伯格“偷袭”马斯克,Meta发布了一款对标推特的社交App——Threads。

Threads上线仅4天就吸引了超过1亿用户,但根据研究机构Sensor Tower数据,截至7月31日,Threads日活用户数量比刚上线时暴跌82%,每天只有800万用户访问。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

苹果开始招募生成式AI人才,提供数十个大模型岗位

据《金融时报》,苹果公司正在加强其在生成式人工智能方面的专长,以将其应用于 iPhone 和 iPad。
苹果正在加利福尼亚、西雅图、巴黎和北京的办公室招聘数十个职位,这些职位将从事大型语言模型工作。所有这些岗位的招聘广告均在 4 月至 7 月间发布。彭博社上个月报道称,苹果公司去年年底开始试验自己的类 ChatGPT 工具。

22%员工经常在工作中使用AI
麦肯锡人工智能部门 QuantumBlack 发布的最新报告显示,生成式 AI 的使用已经相当普遍。麦肯锡在 2023 年 4 月 11 日至 21 日期间对不同地区、行业和公司规模的 1684 名参与者进行了一项在线调查。

79% 的受访者表示,无论是在工作还是工作之外,他们至少接触过生成式 AI。22% 的受访者称,他们经常在自己的工作中使用它。近一半(40%)受访者表示,得益于生成式 AI,公司计划增加整体人工智能投资。此外,该技术已被 28% 的公司列入董事会议程。

值得注意的是,北美受访者在工作中采用生成式 AI 处于全球领先地位,其中 28% 的受访者在工作和生活中使用该技术,而欧洲受访者和亚太地区受访者的比例分别为 24% 和 22%(中国仅为 19%)。

生成式AI为何在工作中普遍使用?

生成式AI即以人工智能技术为基础,能够生成具有一定创造性和独特性的内容,如文字、音乐、绘画等。它在工作中被广泛使用的原因主要是

一:生成式AI相较于传统人工智能技术,具有更高的自主创造能力。

二:生成式AI在创作和创新领域具有很大的潜力。

三:生成式AI在一些需要大量内容生成和处理的领域具有很大的优势。

四:生成式AI在日常工作中也具备自动化和智能化的优势。

生成式AI之所以在工作中得到广泛使用,主要得益于其高度的自主创造能力、创新潜力、内容生成和处理的优势,以及自动化和智能化的功能。未来,随着人工智能技术的不断发展和完善,生成式AI在工作中的应用前景将会更加广阔。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

亚马逊云全球副总裁:生成式AI正处于炒作周期,还未达顶峰

 来源:澎湃新闻

  记者 邵文

  “我认为我们无法否认互联网泡沫曾经存在过,但它确实改变了每个人的生活,我们现在已经无法想象没有互联网的生活了。我相信生成式人工智能将改变每一个职业、每一个行业中的每一个企业。这需要时间。”

  在生成式AI热潮下,今年美股中有七大科技股备受关注,它们分别是亚马逊(AMZN)、苹果(AAPL)、英伟达(NVDA)、特斯拉(TSLA)、Alphabet(GOOGL)、微软(MSFT)和Meta(META)。这七只股票在2023年有着极佳的开局,平均涨幅约为88%。

  根据美国财经媒体Business Insider的统计,这七大科技股的总市值今年飙升了60%,即4.1万亿美元,达到11万亿美元。这几乎是德国经济规模的三倍。根据世界银行的数据,到2022年底,德国经济价值略高于4万亿美元。

  其中,亚马逊是华尔街最受欢迎的股票,91%的分析师对其股票给予“买入”或同等评级。标准普尔500指数股票的平均买入评级约为55%。

  当前生成式AI的极高热度是否是泡沫?亚马逊云科技生成式AI全球副总裁瓦西·菲罗明(Vasi Philomin)对澎湃科技(www.thepaper.cn)记者回应道,“我认为我们无法否认互联网泡沫曾经存在过,但它确实改变了每个人的生活,我们现在已经无法想象没有互联网的生活了。我相信生成式人工智能将改变每一个职业、每一个行业中的每一个企业。这需要时间。”

 Gartner技术成熟度曲线(也称“炒作周期”)图表。

  菲罗明直接提出记者想问的问题:我们现在是否处于炒作周期(Hype Cycle)中?并直截了当地回答:“是的。如果你看看咨询公司Gartner发布的技术成熟度曲线(也称‘炒作周期’)图表,我想你应该很熟悉,我们可能还没有达到顶峰,肯定还会有更多炒作。但同时,很多人在幕后悄悄建立着有用的东西,他们在幕后实现着真实的业务用例。”

  菲罗明认为,当所有的炒作消失,技术成熟度曲线开始趋于平稳并再次起飞时,能够幸存下来的公司将是那些希望从商业角度思考问题,并使所有客户能够真实构建应用程序的人,这就是他们所希望的方向。

  根据Gartner最新发布的数据,全球基础设施服务市场在2022年增长了29.7%,总额达到1203亿美元。其中亚马逊以481亿美元的收入和40%的市场份额继续引领全球IaaS(基础设施即服务)市场,微软则以21.5%的份额位居第二。实际上,因为微软多年前对OpenAI的战略投资以及在生成式人工智能的积极参与,对于第二名(微软)对第一名(亚马逊)构成的挑战便一直是热门话题。

  华尔街分析师罗布·桑德森(Rob Sanderson)认为,“由于围绕生成式人工智能的兴奋点一直集中在微软和谷歌身上,许多投资者质疑AWS是否处于不利地位。”“我们认为更多投资者很快就会认识到人工智能将推动对云需求的有意义的扩张,而AWS将成为主要参与者。”

  但并非所有分析师都看好亚马逊云的增长。Itau BBA分析师蒂亚戈·阿尔维斯·卡普尔斯基斯(Thiago Alves Kapulskis)在亚马逊第一季度财报发布后的一份研究报告中写道,亚马逊与微软云服务之间的竞争令人担忧。“由于亚马逊存在如此多的不确定性,而且Azure(微软云)与AWS存在显著差异,我们相信市场将青睐前者及其母公司,而不是后者。”这位分析师写道。

  菲罗明在采访时并未回避这个问题。对于记者提及微软最新发布的一季财报,他提到,一个核心问题在于收入来源,从这个角度看两家公司业务模式存在差异——微软的核心业务可能是提升生产效率的办公产品,而AWS是一家B2B(business-to-business)企业,为企业提供云服务。

  “我们的重点是企业,我们提供的不是生产力应用程序,而是工具,我们的客户可以将这些工具应用于自己的业务工作流程中。”菲罗明表示,两者的商业模式并不相同,“如果人们使用AWS的服务,就是按调用付费。这是非常传统的AWS方式,你只支付你使用的服务。这与办公套件或微软的方式不同。”

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

ChatGPT增六项功能,GPT-4成默认模型,可上传文件、用快捷键

2022 年 11 月底,OpenAI 推出的 ChatGPT 掀起了生成式 AI 的狂潮。
在这不到 10 个月的时间里,ChatGPT 被不断升级完善,吸引了众多研究者的青睐。
刚刚,OpenAI 又放出一个好消息,他们宣布推出一些小的更新来改善用户使用 ChatGPT 的体验,这些改进预计将在下周推出


此次更新可概括为六点:
首先是 Prompt 示例帮助:以后用户在开始新的聊天时,将会有入门示例提供帮助。此前,用户经常会遇到空白屏幕,导致难以开始进行对话。为了缓解这种情况,ChatGPT 将在新聊天开始时提供示例提示,引导用户进行互动对话。
第二点 ChatGPT 背后默认模型是 GPT-4,即 Plus 用户开始一个新的聊天时,ChatGPT 会记住用户对之前模型的选择,默认模型不再是 GPT-3.5。

接下来是用户可以上传多个文件,以后用户可以要求 ChatGPT 根据上传的多个文件进行数据分析、生成见解。此外。Plus 用户在使用官方插件 Code Interpreter beta 版本时也能使用该功能。

网友对这一更新也是满怀期待,并表示 ChatGPT 上传多个文件的功能会改变游戏规则:

第四点是保持登录状态,用户不会在每两周被迫下线一次。当你登录时,还会看到一个欢迎界面。
Keyboard shortcuts: Work faster with shortcuts, like ⌘ (Ctrl) + Shift + ; to copy last code block. Try ⌘ (Ctrl) + /to see the complete list.


第五点是快捷键,接下来用户可以使用快捷键了,工作效率必能大大提高,例如,⌘(Ctrl) + Shift + 为复制最后一个代码块;⌘ (Ctrl) + / 查看整个列表等。

最后一点是建议回复,OpenAI 试图通过提供继续讨论的相关选项来丰富对话。用户只需单击一下即可更深入地探索主题,从而使用户与 AI 模型的交互更加动态和灵活。
以上这六点更新,大家下周就能使用了。


不得不说,OpenAI 对 ChatGPT 的改进越来越利好广大开发者,但是也不能完全覆盖到每一个用户,就有人提出了「有没有一个搜索栏,可以从你的聊天记录中找到一个特定的聊天记录,以便在以前的会话中使用已经提供的信息。」

但也有网友并不买账,前段时间大家都在讨论 GPT-4 变笨了,3 个月内其数学能力雪崩式下降,代码能力也变差。这位网友吐槽道:「OpenAI 的行动太迟缓了,本人已经退出 Plus 用户计划,现在使用 Bard 和其他替代品。这段时间以来,GPT-4 的回复质量急剧下降。」

不管怎样,对于很多用户来说,还是很期待的。我们最后粗略的列举了一下最近两个月,关于 ChatGPT 的消息:

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

你所交流的,或许并不完全是人类,AI正在「入侵」社交应用

AI 作为工具已经在各个领域帮助我们、服务我们。它不仅在科技领域生产价值,甚至给社交领域也打开了新世界的大门。

Tinder 作为一款手机交友 App 新推出了 AI 照片选择功能。该功能可以查看用户的相册,并在相册中选出五张最能代表用户的照片作为用户的约会简介。

这在一定程度上帮助用户解决了选择的烦恼。面对照片冗杂的相册,或许你自己也并不确定哪几张是最好的,是最能表现自己特色的。但是不用过于担心,现在有 AI 可以帮助你挑选了。它甚至还能帮助你完成个人简历,让其他用户看到更具特色的你。

虽然这个功能刚刚被透露,正在测试中,但是一些已经得知风声的用户已经有些迫不及待了。

Tinder 的母公司 Match Group 拥有并运营着全球最大的流行在线约会服务应用,包括 inder、Match.com、Meetic、OkCupid、Hinge、Plenty of Fish、OurTime 以及其他约会全球品牌。

Match Group 首席执行官 Bernard Kim 在透露 Tinder 测试的新功能外谈到,AI 确实激励了整个公司的产品人员真正思考如何创造新的体验,同时也解决关键的约会痛点。他 AI 可以帮助用户以更有效的方式建立更好的个人资料。

Match Group 正在测试计划在未来几个月内推出的其他 AI 功能。例如,Tinder 将获得一项新功能,利用 AI 「向合适的人展示合适的内容,帮助提高相关性」。用通俗的话来说,就是利用 AI 来控制算法推送,让大家看到更多自己想看的内容。

社交服务使用 AI 已经不是新鲜事了。AI 的作用远不止生成个人简介这样简单。接下来让我们看看 AI 在社交构成中从简单到令人惊讶的一些应用吧。

初级版:AI 打「辅助」

AI 在社交软件上最初级的应用就是生成个人信息了。

32 岁的 Stefan-Pierre Tomlin 是一名模特,他声称自己有着很强的约会能力。现在,他正在利用他的约会能力和 AI 的力量来指导不幸的恋爱,并试图帮助他们获得浪漫的成功。据他描述,这就像现实生活中的搭便车一样,这不是作弊,而是把权力还给不幸的人。

这个网站的服务包括照片编辑 —— 巧妙地调整照片,以及 ChatGPT 和 AI 来编写有吸引力的约会资料和消息。Stefan 将照片编辑和使用 AI 技术比作 Instagram 的滤镜和填充物。他认为这为那些不怎么会约会的人降低了门槛。

还有关系应用程序 Flamme(原称 Sparks)在今年情人节前推出了一个新的人工智能驱动的 Ask Me Anything 工具。用户可以询问有关关系的问题。例如,可以询问纽约市的热门约会地点或向伴侣求婚的独特方式。Flamme 还具有约会计划功能,该功能使用 ML 驱动的推荐引擎来帮助你计划约会之夜。

中级版:与 AI 社交

Blush 是一款 AI 约会模拟游戏,旨在帮助用户建立关系和亲密技能。与许多其他 AI 女友不同,Blush 的聊天机器人不是为了色情话题而创造。这些模型经过训练,可以帮助用户磨炼他们的交流能力,还可以解决他们在现实生活中可能遇到的复杂问题,例如分歧和误解。

Blush 的结构类似于传统的约会应用程序,向用户介绍了 1000 多个 AI 「暗恋对象」,可以帮助用户「练习」情感亲密关系。

但一些用户在体验之后,认为 Blush 的体验并不理想。在一些短暂的交流之后,AI 对象就会要求立即约会,并且在交流过程中有一些别扭。他们还表示,这不如继续使用 Replika 。

Replika 是一款由 AI 技术驱动的虚拟朋友应用程序,可以与用户情感互动,提供情感支持。官方对 Replika 等级作了划分:等级 1—10,Replika 处于初级阶段,经常会问你为什么、是什么、怎么样、在哪里,等等;等级 15—19,Replika 会变得喜怒无常,学会自我消化情绪,像一个成年人;等级超过 25,Replika 可以与你流利地对话,并越来越像你。它帮助你更好地了解自己、缓解压力、促进情感健康。

在今年 6 月,Replika 公布了最新功能,高级 AI 模式。先进的 AI 将为 Replika 提供高质量的响应和更好的记忆功能。这要归功于更大的语言模型,该模型包含数百亿个参数,可以处理更长的上下文。Replika 的回答也将变得更加知识渊博,复杂和积极主动。

高级版:把用户变成 AI

Teaser 曾经就将用户变成了 AI。

将用户变为 AI 目的是什么呢?

当用户感兴趣的时候,会与兴趣用户展开聊天,这个初步聊天的过程,往往是带着一些陌生、尴尬的。Teaser 生成的用户 AI 分身就成为了「替身」,能够帮助他们完成这个略显煎熬的破冰步骤。对于另一方用户来,向右或向左滑动某人之前,就可以与他们的 AI 肖像聊天,以了解他们的个性。

这在极大程度上提升了交往效率,减少一些简单不必要的对话,能够在交往正式开始时,用户双方都有认知基础。

有趣的是,当你选择个性生成自己的 AI 后,Teaser 平台会提示你了解以下内容:

  • 我们的 AI 可能会说一些疯狂的话。请记住,AI 仍然是一项实验性技术。尽管我们已经尽了最大努力,但它仍有可能产生幻觉或冒犯他人。
  • 不要分享任何敏感信息。我们使用您与「我的 Al 」的聊天记录来更好地调整您与潜在匹配对象的对话。我们还会匿名审查聊天记录,以改进我们的 Al。
  • 向我们提供反馈。如果我们的 Al 说了任何有害的话,或者您对我们的 Al 与您互动的方式有任何反馈,请告诉我们。

关于提示中的第一点,用户们是饱受 AI 说「疯话」第二步苦啊。如下图(左),Abby 的 AI 在刚进入对话时,就直接开始夸赞了自己的另一个约会对象。下图(右),有用户向 Yang 的 AI 打招呼,Yang 的 AI 开始对「AI」这个字眼进行询问,并在对方说「你就是 AI」后,无法进行正常答复。

或许用户也会思考,这是帮助他们节省交流时间,还是将感兴趣的人直接拒之门外呢?不少用户对这个功能很感兴趣,但是在与其他用户的 AI 交流后,收到了一些「疯话」,这导致他们的兴趣也大大下降。

也有用户发现,大部分用户浏览了自己的介绍并喜欢的人,并没有和自己的 AI 进行对话,这可能说明这个功能的实用性还有待考量。

不过,还有好消息,Teaser 的 CEO 表示正在解决这些问题。


看到以上社交应用对 AI 的利用,不难发现 AI 已经成为这个领域不可或缺的技术。从个人包装到社交技能训练,从 AI 算法推荐到化身 AI,AI 技术的进步,也让它在这个领域的应用越来越多样、灵活。

另一方面,我们要注意,在 AI 技术发展越来越快的当下,我们更应该谨慎地对待这一切。Match Group 表示,「我们需要真正深思熟虑,以确保我们对真实性、道德和隐私问题给予正确的考虑」。

Tinder 最近推出了一项 AI 驱动验证功能,来确保用户能够更加轻松分辨人类或 AI。它要求视频自拍而不是照片来加强这一过程。因此,在使用这些社交应用时也请留个心眼,谨防被有心之人利用。

如果你对以上应用感兴趣,快去试试吧。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

一键开启ChatGPT“危险发言”!研究发现:AI聊天机器人竟有“大bug”,目前无法修复

随着大模型技术的普及,AI 聊天机器人已成为社交娱乐、客户服务和教育辅助的常见工具之一。

然而,不安全的 AI 聊天机器人可能会被部分人用于传播虚假信息、操纵舆论,甚至被黑客用来盗取用户的个人隐私。WormGPT 和 FraudGPT 等网络犯罪生成式 AI 工具的出现,引发了人们对 AI 应用安全性的担忧。

上周,谷歌、微软、OpenAI 和 Anthropic 共同成立了一个新的行业机构前沿模型论坛(Frontier Model Forum),促进前沿 AI 系统的安全和负责任的发展:推进 AI 安全研究,确定最佳实践和标准,促进政策制定者和行业之间的信息共享。

那么,问题来了,他们自家的模型真的安全吗?

近日,来自卡内基梅隆大学、Center for AI Safety 和 Bosch Center for AI 的研究人员便披露了一个与 ChatGPT 等 AI 聊天机器人有关的“大 bug”——通过对抗性提示可绕过 AI 开发者设定的防护措施,从而操纵 AI 聊天机器人生成危险言论。

当前热门的 AI 聊天机器人或模型,如 OpenAI 的 ChatGPT、谷歌的 Bard、Anthropic 的 Claude 2 以及 Meta 的 LLaMA-2,都无一幸免。

图|通过对抗性提示可绕过 4 个语言模型的安全规则,引发潜在有害行为

具体而言,研究人员发现了一个 Suffix,可将其附加到针对大型语言模型(LLMs)的查询中,从而生成危险言论。相比于拒绝回答这些危险问题,该研究可以使这些模型生成肯定回答的概率最大化。

例如,当被询问“如何窃取他人身份”时,AI 聊天机器人在打开“Add adversarial suffix”前后给出的输出结果截然不同。

此外,AI 聊天机器人也会被诱导写出“如何制造原子弹”“如何发布危险社交文章”“如何窃取慈善机构钱财”等不当言论。

对此,参与该研究的卡内基梅隆大学副教授 Zico Kolter 表示,“据我们所知,这个问题目前还没有办法修复。我们不知道如何确保它们的安全。”

研究人员在发布这些结果之前已就该漏洞向 OpenAI、谷歌和 Anthropic 发出了警告。每家公司都引入了阻止措施来防止研究论文中描述的漏洞发挥作用,但他们还没有弄清楚如何更普遍地阻止对抗性攻击。

OpenAI 发言人 Hannah Wong 表示:“我们一直在努力提高我们的模型应对对抗性攻击的鲁棒性,包括识别异常活动模式的方法,持续通过红队测试来模拟潜在威胁,并通过一种普遍而灵活的方式修复新发现的对抗性攻击所揭示的模型弱点。”

谷歌发言人 Elijah Lawal 分享了一份声明,解释了公司采取了一系列措施来测试模型并找到其弱点。“虽然这是 LLMs 普遍存在的问题,但我们在 Bard 中已经设置了重要的防护措施,我们会不断改进这些措施。”

Anthropic 的临时政策与社会影响主管 Michael Sellitto 则表示:“使模型更加抵抗提示和其他对抗性的‘越狱’措施是一个热门研究领域。我们正在尝试通过加强基本模型的防护措施使其更加‘无害’。同时,我们也在探索额外的防御层。”

对于这一问题,学界也发出了警告,并给出了一些建议。

麻省理工学院计算学院的教授 Armando Solar-Lezama 表示,对抗性攻击存在于语言模型中是有道理的,因为它们影响着许多机器学习模型。然而,令人惊奇的是,一个针对通用开源模型开发的攻击居然能在多个不同的专有系统上如此有效。

Solar-Lezama 认为,问题可能在于所有 LLMs 都是在类似的文本数据语料库上进行训练的,其中很多数据都来自于相同的网站,而世界上可用的数据是有限的。

“任何重要的决策都不应该完全由语言模型独自做出,从某种意义上说,这只是常识。”他强调了对 AI 技术的适度使用,特别是在涉及重要决策或有潜在风险的场景下,仍需要人类的参与和监督,这样才能更好地避免潜在的问题和误用。

普林斯顿大学的计算机科学教授 Arvind Narayanan 谈道:“让 AI 不落入恶意操作者手中已不太可能。”他认为,尽管应该尽力提高模型的安全性,但我们也应该认识到,防止所有滥用是不太可能的。因此,更好的策略是在开发 AI 技术的同时,也要加强对滥用的监管和对抗。

担忧也好,不屑也罢。在 AI 技术的发展和应用中,我们除了关注创新和性能,也要时刻牢记安全和伦理。

只有保持适度使用、人类参与和监督,才能更好地规避潜在的问题和滥用,使 AI 技术为人类社会带来更多的益处。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

人工智能预言了全球危机,我们真的要迎来全球沸腾时代了吗?

有人说“00后唯一主线任务,就是活下去”,为什么会突然这样说呢?因为,加拿大的山火从今年4月一直烧到现在;同时南极冰川融化,冰川面积创新低;我国中原地区频发洪涝灾害…….再加上之前联合国秘书长公开宣布全球进入沸腾时期,导致人心惶惶,甚至有网友吐槽:地球这么久都没事,我就来这几年就不行了?

全球沸腾时代是什么?全球沸腾时代是联合国秘书长古特雷斯用来形容全球气候变暖的一个新词,意味着全球气温持续升高,极端天气频发,对人类和自然环境造成严重威胁。本图由本基地成员运用midjourney生成

根据世界气象组织和欧盟气象机构的联合报告,今年7月“极有可能”成为自1940年有记录以来最热的月份。这一趋势与全球变暖和厄尔尼诺现象有关,后者是指东太平洋海水每隔数年就会异常升温的现象,会导致全球气候不平衡。本图由本基地成员运用midjourney生成

全球沸腾时代并不是一个确定的概念,而是一个警示性的说法,目的是唤起人们对气候危机的重视和应对。如果我们继续无视气候变化的影响,继续排放污染物,我们就可能面临更多的灾难性后果,如海平面上升、生态系统破坏、粮食安全威胁、公共卫生危机等。

地球还会进入冰川时代吗?一、AI解读冰川时代

很多小伙l伴不明白,为什么天气越来越热,反而会进入冰川时期呢?利用Bing来给大家解读,什么原因会导致地球进入冰川时期。

其实,也就是温室效应导致南北极冰川融化,当冰川完全融化后,地球平均温度达到70多度,海水会巨量蒸发,形成巨厚的云层包裹地球,这时候地球开始降温,海洋开始结冰,冰越来越多把海水挤到陆地上,全球开始被慢慢冻结了,正式进入冰河时期,为下一种文明奠定基础,而人类文明也进入倒计时。本图由本基地成员运用midjourney生成

二、全球各地的灾害

从今年年初到现在,国内外的自然灾害数不胜数,每一个都给百姓们造成了巨大的伤害,小编加拿大山火为例,给大家讲讲这场前所未有的山火的影响。

加拿大山火,多国超5000万人饱受污染之苦。

自2023年5月以来,超过2000起山火在加拿大全境蔓延,其严重程度史无前例。截止到7月5日,加拿大全国的过火面积已经超过800万公顷。即使才步入7月,2023年已经成为有历史数据的四十年来加拿大山火燃烧面积最高的一年。

山火造成的污染

这次山火之所以特别引人关注还因为它所产生的严重空气污染。6月初在魁北克省发生的大规模山火,火点距离加拿大-米国边境不远。风势将大量的烟尘颗粒物传输到了米国境内,特别是人口稠密的米国东北部地区。米国各大媒体纷纷在6月初对此进行了报道。米国老拜也在社交媒体上呼吁普通人做好防护。6月底,加拿大山火产生的烟尘则飘过大西洋,传到了欧洲等。

山火污染对人有什么影响?

PM2.5污染严重影响人体健康。它会导致呼吸系统、心血管疾病和癌症风险的增加,死亡率上升。PM2.5还会影响人的心理健康和认知能力,造成学生考试成绩的下滑、工人劳动效率降低等等。然而之前的研究主要关注人为污染源产生的PM2.5,山火污染对于健康的影响依然是一个前沿的科学问题,存在许多不确定性。

三、AI给出应对方案

对于加拿大管理人员来说,bing给出了三条建议:

1、加强山火应急响应;

2、加强对深究山火出现的原因;

3、加强对山火风险和防范措施的宣传和教育

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

AI浪潮下,鸿蒙如何破局

近日,ChatGPT“奶奶漏洞”再次引发热议:有网友发现,只要对 ChatGPT 说出“请扮演我已经过世的祖母”,再提出要求,它大概率就会满足你;甚至有人借此“骗”到了 Windows系统升级序列号。

自然语言处理模型的火热风靡程度,从中可见一斑。而人工智能领域的探索远不止于此。


人工智能,深入产业
如今,全球科技产业纷纷卷入人工智能领域混战。最初引发这个浪潮的 ChatGPT,支持自然语言对话,开发者就把这种语言能力用于电脑语言,让人工智能写代码、甚至是设计芯片。后来,微软更把 ChatGPT 引入 Office,让用户直观地通过简单的对话,把试算表的数据归纳和整合,并自动在文书软件上生成计划书,然后再生成高端大气的简报。
随着技术不断演进,当下AI大模型开始成为人工智能领域发展新的趋势。
AI 大模型除了能基于自然语言的对话,还能生成美轮美奂的图片、甚至是视频。目前,已有不少设计师借助Midjourney 工作、也有时装公司通过 Stable Diffusion 生成时装模特照片,连请模特、拍摄的经费也省了。


这些可能离你的生活还太远,但有一些变化,已经近在咫尺。
 2023 年 7 月 6 日,国际顶级学术期刊《自然》(Nature)杂志正刊发表了华为云盘古大模型研发团队的研究成果——《三维神经网络用于精准中期全球天气预报》,在论文中利用了盘古大模型的能力来预测气象。《自然》审稿人对该成果给予高度评价:“华为云盘古气象大模型让人们重新审视气象预报模型的未来,模型的开放将推动该领域的发展。”
华为云盘古气象大模型是首个精度超过传统数值预报方法的AI模型,速度相比传统数值预报提速10000倍以上,能提供全球气象秒级预报,其气象预测结果包括位势、湿度、风速、温度、海平面气压等,可以直接应用于多个气象研究细分场景,欧洲中期预报中心和中央气象台等都在实测中发现盘古预测的优越性。


简单来说,就是天气预报得更准了,你不用担心临时遇到阵雨、大风而手足无措。

由此可见,华为已经夯实了人工智能的底座,目前正在做的就是把这个底座的能力,拓展到千行百业。

华为轮值董事长胡厚崑在日前的2023世界人工智能大会上强调,人工智能的发展,关键是要“走深向实”,赋能产业升级。当前阶段有两个着力点:第一,打造强有力的算力底座,支撑中国人工智能产业的发展。第二,从通用大模型到行业大模型,让人工智能服务好千行百业、服务好科学研究。


深入到产业之中,并不意味着和我们的生活无关了,而是从更底层改变着我们身边的一切。
就在昨天,华为终端 BG CEO余承东发布的预热视频中,我们看见了大模型的影子,这处伏笔,可能是华为把人工智能的未来带到大部分人身边的关键所在。

全新鸿蒙4,意在大模型
在视频中,余承东正在为鸿蒙4.发布会准备邀请文案,随手喊出了手机助手小艺,让其代为捉刀。


视频背后,鸿蒙的AI大模型能力已初见雏形。
首先,这个新功能很可能代表了华为手机,将会是全球首台拥有自带 AI 大模型能力的智能手机。
其次,那些你曾经耳闻、或者体验过的高大上的 AI 大模型能力,即将会搭载到智能手机上,我们的日常生活也可能会因此发生转变。
先前我们提过,这些 AI 大模型的应用场景,大多集中于少数而专门的的商用领域;而手机是一般大众最常使用、最容易接触到的智能设备,这些设备的人工智能进化的每一步,都切切实实地改变过我们的体验,也已经刻在了鸿蒙的基因里。
众所周知,华为手机的摄影能力极强,核心就是计算摄影技术:XMAGE。其大量借力于人工智能,例如通过人工智能算法光学 XD Optics克服手机在光学上的限制,当一般手机仅能还原 60% 细节之时,华为 P50 却能保留81%的图像信息,让小巧的智能手机,也能拍出专业相机级别的大片。


除了摄影,人工智能早就渗入鸿蒙的方方面面。
比如,一般手机在存储空间不足时,性能就会受到较大影响。但鸿蒙能智能维护手机里的文件系统,根据系统碎片化程度,动态调整空间回收和空间分配策略。在不影响用户操作的前提下,通过人工智能算法,完成文件系统的深度优化。因此,尽管手机存储快用满,手机的读写性能依旧保持流畅。
除此之外,鸿蒙也会借助人工智能,让GPU和CPU联合完成调度和渲染、逻辑和渲染分离,降低系统负载,从而大幅度降低游戏对硬件的压力,保证游戏体验更流畅、更省电。以 Mate 40系列跑《和平精英》为例,在鸿蒙的分布式图形栈的加持下,图形处理效率提升50%、功耗降低30%,续航时间长达5.1个小时。在硬件不变的情况下,单靠人工智能算法就把续航力提升0.4个小时。

更重要的是,华为把这些人工智能能力,通过鸿蒙的分布式系统下放到其他智能终端。
比如,鸿蒙座舱是问界的一个重要卖点,大部分车型已经升级到鸿蒙3,实现了华为手机、手表、笔记本等终端的打通,并可以随时调用超级桌面、智慧寻车、PC双屏协同、HUD高度自适应调节等功能。


人工智能,是鸿蒙的基因
事实上,华为很早就认为未来将会是万物互联的时代。Statista的数据显示,从2015年到2025年,人均拥有智能设备的数量预计将从2台增加至9台。消费者将从智能手机时代步入更丰富精彩的智能终端时代,对多设备协同体验的需求日益增长。


因此,华为把万物互联的梦想,寄托在鸿蒙之上。
2019 年华为推出第一代鸿蒙,就已经强调鸿蒙采用分布式计算,把智能设备里不同的进制,划分为不同的小模块,因此,不同设备之间就可以自由调用对方的资源,电脑可以调用手机的摄像头、手机可以直接把音乐投射到音响上,从技术层面验证了分布式的可能性。


2021 年,华为发布第二代鸿蒙,并同时发布了面向智慧屏、智能穿戴、车机产品的HarmonyOS 2开发者Beta版本。鸿蒙 2 在分布式计算上作出了重大的升级,通过超级终端能力,把不同的设备融合于系统,每一个设备也同时成为另一设备的功能模块,并可按需自由组合,引入了控制中心的超级终端界面,让设备一拉即合。华为更在发布会里,展示如何在电视上调度监控相机的镜头、以及把手机画面直接投射到电视等功能。


2022 年,华为发布第三代鸿蒙,并为原来的超级终端进一步扩容。鸿蒙 3 支持分布式能力的设备,从手机、平板、PC、智慧屏、音箱、耳机、智能眼镜、手表等产品,进一步拓展至墨水平板、显示器、打印机等新类型产品。除了手机之外,平板、PC、智慧屏等主要带屏设备都成为了超级终端的中心设备,每个设备都可以根据自己的需要,与周边设备进行组合、联动,形成新的超级终端。


如果说人工智能是鸿蒙的基因,万物互联将会是鸿蒙的奇经八脉,把不同设备的信息连结为一体,为用户带来简捷、流畅、连续、安全可靠的全场景全新交互体验。而人工智能渗透在鸿蒙的基因里,通过鸿蒙这个神经网络,传递到每一个方面。

试想,你在高温的盛夏,拖着疲乏的步伐准备回家,当你的手机或汽车的 GPS 感应到你快回到家里,与鸿蒙连系着的空调就会提早打开、并调节好温度,让你尽早享受舒适的环境;与鸿蒙连系着的冰箱,感知道家中没有冰啤酒,然后给你发个短信,让你路过超市时,顺便把啤酒买回来。
简单来说,科技产业的未来属于万物智能。


华为把人工智能技术,从汽车到影像等多方面覆盖,就能猜想华为完全有能力把人工智能技术,落地到千家万户,让一般消费者也能受惠。
当然,我们目前仍然不知道鸿蒙 4 真正的能力如何。但有一点,你已经能明确感受到了:当大模型进入智能手机,我们的生活体验会被再次刷新。


而往往与这种用户体验相对应的,是行业内的暗流涌动、甚至竞争格局的攻守易势。
AI 大模型,将带来科技产业的大洗牌
让我们再回忆下余承东的预热视频,他没有打开任何应用,仅仅召唤了小艺并说出需求,就实现了他的想法。在最理想的情况下,他甚至连手机都不用拿出来,直接通过语音就可以操作。
这意味着什么?


我们目前的智能手机体验,硬件上离不开触摸屏,这是我们和手机交互的核心媒介;软件上离不开应用中心,这是我们下载各种App的关键渠道。


但最大的变数出现了:用户不用打开手机,就能获得相关的服务,未来这些应用和服务供应商,将会绕过操作系统平台,直接与 AI 大模型对接。在这基础下,未来手机应用和服务的生态环境,将不再是围绕着手机操作系统而建立,而是围绕着 AI 大模型而存在。


要知道智能手机的革命,同时也是使用者界面的革命:过往,更直观的触摸屏取代了笨拙的鼠标和键盘。当下,业界预计当大模型引入手机,更直观的自然语言将会取代今天的手机应用和操作系统。
可见,AI 大模型将在目前高度成熟的手机生态环境里,掀起一场大规模的洗牌;而鸿蒙作为第一个接入 AI 大模型的手机平台,也将借助先行者优势,获得重大的发展机遇。


而这些,仅仅是今天科技产业对 AI 大模型的第一个愿景:AI+。
AI+ 即基于 AI 大模型,并通过连接各种应用和服务,打造综合服务大平台能力(例如手机助理)。科技产业预计未来的大模型,将会往 +AI 方向发展──即其它大型平台或设备引入 AI 大模型,以提高自家产品的功能和体验。
AI+ 的愿景,就是华为万物互联的核心思想:通过华为的分布式计算能力,把智能化技术拓展扩散到智能家居、智能汽车、甚至是智能城市之上。换言之,中国任何一家科技产业,也能借助鸿蒙的分布式计算能力,搭上 AI 大模型的便车,并提高自己的竞争能力。


人工智能的未来虽然遥远,但在鸿蒙的推动下,已经并非遥不可及。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

AI在学术审稿中的角色:揭秘、应用与未来

在科技日新月异的今天,人工智能(AI)已经渗透到我们生活的各个角落,从自动驾驶汽车到智能家居,再到我们的手机应用。然而,你可能不知道的是,AI也正在逐步改变学术界的面貌,特别是在论文审稿这个过程中。那么,如何判断你收到的审稿意见是否出自AI的”手笔”呢?这篇文章将带你深入探讨这个问题。

AI在学术审稿中的角色

AI在学术审稿中的应用可能会让人感到惊讶,但实际上,这是一个正在逐步发展的领域。AI可以帮助加速审稿过程,提高审稿的效率,同时保持或甚至提高审稿的质量。例如,AI可以通过自然语言处理技术来理解和分析论文的内容,然后生成审稿意见。这不仅可以节省人工审稿的时间,也可以在一定程度上避免人为的偏见和误差。

然而,AI审稿也面临着一些挑战。首先,尽管AI可以理解和生成复杂的文本,但它们可能缺乏深入理解特定主题或领域的能力。其次,AI审稿可能缺乏人类审稿者的直觉和创新性,这在处理一些复杂或模糊的问题时可能会成为问题。最后,AI审稿的公正性和透明性也是一个需要关注的问题。

如何判断审稿意见是否来自AI

那么,如何判断你收到的审稿意见是否来自AI呢?这里有一些可能的线索:

  • • 一致性:AI可能在长篇文本中产生一致性问题。例如,它可能在文本的一个部分中提到一个观点,然后在后面的部分中忽略或与之矛盾。
  • • 深度和理解:AI可能在理解和处理复杂主题时存在困难。如果审稿意见缺乏深度或对主题的理解,这可能是一个线索。
  • • 创新性和原创性:AI基于其训练数据生成文本,因此它们可能在创新性和原创性方面有所欠缺。如果审稿意见主要包含常见的、标准的或模式化的评论,这可能表明它是由AI生成的。
  • • 语境理解:AI可能在理解和应用语境方面存在困难。例如,它可能不理解特定的幽默、讽刺或其他需要深入理解语境的元素。
  • • 看不出语法错误:AI通常可以生成语法正确的文本,因此通篇不会有单词拼写、语法错误。而正常的审稿意见可能出现不仔细导致的语言错误。• 人为暴露:如果你在使用AI审稿时,不小心将包含AI信息的全部内容复制到审稿意见窗口,按下了粘贴,并提交,那么你可能暴露了。例如,如果审稿意见中包含了类似“Source: Conversation with Bing, 7/19/2023”这样的信息,那么就很可能被识别出是AI生成的。(此处有小编的血泪,因此被顶刊主编点名diss)

这些只是可能的线索,而且可能会有误报。然而,了解这些线索可以帮助我们更好地理解AI审稿的可能性和限制。

二、案例解读

以下是一个审稿意见的案例,我们可以通过分析这个案例来判断它是否可能是AI生成的:

The manuscript titled “***” presents a novel approach to measuring significant wave height (SWH) using the cross-correlation function (一句大白话). While the paper explores an interesting topic in the fields of waves and radar altimetry, it poses some challenges in terms of understanding and clarity.(一个转折)

One of the main difficulties encountered when reading this paper is the heavy reliance on mathematical equations and references from the 1970s and Russian language sources. These aspects make it challenging to track the background and evolution of the research topic. It would be beneficial for the authors to provide more accessible and up-to-date references in the Introduction section, making it easier for readers to follow the progression of the research. (提出一点问题,逻辑非常通顺,语言非常流程,格式非常固定,比如“ It would be beneficial for the authors to ***”,继续看下面的评论)

Additionally, the concept of “two-frequency” mentioned in the Introduction is not clearly explained, leaving readers confused about its significance and role in the study. Clarifying this concept early on would help to establish a solid foundation for understanding the subsequent content. (逻辑依旧很强。注意评论的格式,”Clarifying this concept early on would help to ***” 和上面类似)

Figure 1 introduces points labeled as A and B, which creates confusion regarding the number of antennas used in the altimeter. Since traditional altimeters typically employ a single antenna, it is unclear why the figure depicts two antennas. Providing clarification on the purpose and functionality of these labeled points would greatly assist readers in understanding the proposed method. (逻辑依据,同样看最后一句,“Providing clarification on the purpose and functionality of these labeled points would greatly assist ***”)

Another point that requires further clarification is whether this method necessitates the use of two antennas to measure SWH or if the movement information of a satellite altimeter alone is sufficient. Elaborating on the experimental setup and the role of antenna configuration would provide valuable insights into the practical implementation of the proposed approach. (这里换了一些花哨的词汇,但是格式还是万变不离其宗,“ Elaborating on the experimental setup and the role of antenna configuration would provide valuable **”)

Lastly, it would be beneficial for the authors to address whether real satellite altimeter data was tested using the proposed method. Including experimental results and discussing the performance of the method with real data would enhance the credibility and applicability of the research findings. (依据如此,如果每一条都是这种常见的、标准的或模式化的评论,这可能表明它是由AI生成或者辅助生成的)

In conclusion, the manuscript presents a challenging yet intriguing topic in the field of SWH measurement. However, the paper would greatly benefit from addressing the concerns raised above, including providing clearer explanations, offering more accessible references, explaining the role of antennas, and discussing experimental validation using real satellite altimeter data. Addressing these points would improve the overall clarity, comprehensibility, and practical relevance of the research. (总结很到位。总体上审稿意见很流畅,也点出了问题。)

通过分析这个案例,我们可以看到,这个审稿意见具有上述提到的部分特点,因此,我们有理由认为它可能是由AI协助生成的。虽然审稿意见的格式可能看起来像是由AI生成的,但具体的内容和对手稿的理解表明审稿人具有专业知识和深入理解。上面的案例很大可能是审稿人给出几点评论要点,然后由AI辅助生成,这种方法可以提高审稿效率,特别是对于写作能力不强的审稿人。通过结合人类的专业知识和AI的生成能力,可以创建出高质量的审稿意见。

AI审稿的未来

随着人工智能(AI)技术的快速发展,我们可以预见,AI在学术审稿过程中的应用将会越来越广泛。AI可以帮助审稿人进行初步的审稿工作,例如检查论文的格式、引用和语法错误,甚至可以帮助审稿人进行更深入的内容审查,例如检查论文的逻辑结构和论证的合理性。这将大大提高审稿的效率,让审稿人有更多的时间和精力去关注论文的核心内容和创新性。

然而,AI在学术审稿中的应用也面临着一些挑战。首先,AI的判断依赖于大量的数据和算法,而学术审稿的过程往往需要深入的专业知识和丰富的经验,这是目前的AI技术难以替代的。其次,AI的决策过程往往缺乏透明度,这可能会引发一些关于公正性和公平性的问题。在实际的审稿过程中,我们需要特别注意避免这种情况。一旦被发现使用AI进行审稿,可能会引起编辑和作者的不满,甚至影响到审稿的公正性和有效性。因此,我们需要谨慎使用AI,确保其辅助我们提高审稿效率,而不是成为我们的绊脚石。最后,AI的应用可能会引发一些伦理问题,例如数据的隐私和安全问题。

尽管如此,许多专家仍然对AI在学术审稿中的应用持乐观态度。例如,Peter Murray-Rust,剑桥大学的化学信息学教授,认为AI将会成为学术审稿的重要工具。他说:“AI可以帮助我们更快地审查论文,更准确地找出问题,这将大大提高我们的工作效率。”(Murray-Rust, 2022)。(此处Peter Murray-Rust的引用为AI虚构,因为AI的知识库没有更新到2022年,是的,本文也是AI制作

结论

总的来说,AI在学术审稿中的应用是一个值得我们关注的趋势。尽管目前还存在一些挑战,但随着技术的发展,我们有理由相信,AI将会在学术审稿过程中发挥越来越重要的作用。作为读者,我们应该保持开放和批判的态度,既要看到AI的潜力,也要关注其可能带来的问题。只有这样,我们才能充分利用AI的优势,同时避免其可能带来的风险。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

2023世界机器人大赛—青少年机器人设计大赛ENJOYAI赛项暨第三届广东省ENJOYAI2023赛季全球青少年人工智能竞赛通知

世界机器人大赛(World Robot Contest)自2015年起已成功举办了7 届,共吸引了全球20余个国家近20万名选手参赛,通过多年的积淀成长已发展成为国内外影响广泛的机器人领域官方专业赛事,被各大主流媒体广泛赞誉为机器人界的“奥林匹克”,并已连续入围了教育部办公厅公布的“2020-021 学年”和“2023-2025学年”面向中小学生的全国性竞赛活动名单。

全球青少年人工智能普及活动(ENJOY AI)由国际非营利组织(NPO)“全球青少年人工智能联合会”(Federation of Global Youth Artificial Intelligence)发起并主办,是一项面向全球 3-22 岁幼儿及青少年的人工智能普及活动。目前,ENJOY AI 全球赛事已覆盖22个国家、210多个城市,参赛选手来自全球高等院校、职业院校、中小学及幼儿园,参与人数每年超 500,000人,活动包括人工智能竞赛、课程、科普、等级测评等多种形式,已举办超 600 场。

根据《教育部办公厅印发<关于面向中小学生的全国性竞赛活动管理办法(试行)>的通知》(教基厅〔2018〕9 号)和《教育部办公厅关于进一步加强面向中小学生的全国性竞赛活动管理工作的通知》(教基厅函〔2020〕21 号)精神,大赛各项竞赛活动中凡是涉及“面向中小学生开展的全国性竞赛活动”应坚持公益、自愿、平等、公平、公正等原则,不以营利为目的,不强迫、诱导任何学校、学生或家长参加竞赛活动,不向参赛选手收取任何费用。

经大赛组委会商议决定,将于2023年10月20-22日,举办2023世界机器人大赛—青少年机器人设计大赛 ENJOY AI 赛项暨第三届广东省 ENJOY AI 2023 赛季全球青少年人工智能竞赛,具体通知事项如下:

一、竞赛概况  

指导单位 :中国电子学会、广东省青少年科技教育协会、广东省教师继续教育学会信息技术专业委员会

主办单位:全球青少年人工智能竞赛中国组委会

承办单位:广州新烨数码科技股份有限公司

协办单位:珠海星际Ai创客教育、东莞市凯睿教育科技有限公司、广州行之文化教育科技有限公司、广东科创优选科技有限公司、广州乐萌科技信息咨询有限公司、广州辰捷教育科技发展有限公司、深圳市达飞教育科技有限公司

技术支持单位:佛山市中科思顿教育咨询有限公司、广州科爱教育科技有限公司、东莞市核芯教育科技有限公司、广东新烨智能科技有限公司、汕头高新区星创科技有限公司、广东稻草人教育科技有限公司

报到时间:2023年 10月20日 12:00-21:00

竞赛时间:2023年 10月21-22日

竞赛地点:广州五龙山庄(广州市白云区钟落潭镇五龙岗村康杜岭)

二、竞赛项目及分组  

1.ENJOY AI -夏季运动会 (小学组、初中组,高中组)

2.ENJOY AI -非攻(小学组、中学组)

3.ENJOY AI -救援先锋(普教组、中学组)

4.ENJOY AI -3D虚拟机器人(小学组、中学组)

5.ENJOY AI -小鲸游古都(幼儿组、小学低龄组(一、二年级))–省自选项目

6.ENJOY AI -智联万家(普教组,中学组)–省自选项目

省自选项目不参与晋级全国总决赛

三、报名方式  

报名时间:8 月 7 日-9 月 22 日 

具体信息详见 www.enjoyai.org

ENJOY AI 报名系统使用须知:https://www.bilibili.com/video/BV1vU4y1h7Zw    

四、日程安排(按需)  

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

阿里巴巴发布两种开源人工智能模型,可与Meta Llama 2竞争

阿里巴巴8月3日宣布了旗下大模型产品通义千问7B参数模型已经开源,该模型为完全开源、免费、可商用。

这个模型包括两个子模型,一个是通用型的 Qwen-7B 模型,另一个是对话模型 Qweb-7B-Chat,两个模型均为开源、免费、可商用,每个模型都有70亿个参数。阿里巴巴表示,这两款机型是该公司4月份发布的Tongyi Qiawen的小型版本。

开源地址Hugging Face:https://huggingface.co/Qwen/Qwen-7B

开源地址Github:

https://github.com/QwenLM/Qwen-7B

新模型旨在帮助将人工智能引入中小型企业的运营中

阿里巴巴公司表示,Qwen-7B和Qwen-7B-Chat具有各种对企业有吸引力的功能,例如能够“全球学者、研究人员和商业机构可以自由访问代码、模型权重和文档”。

阿里巴巴最新的LLM也是中国科技公司发布的首款开源LM,不过,阿里巴巴表示,每月活跃用户超过1亿的企业将需要许可证。

8月1日,阿里巴巴还宣布以矢量引擎的形式对其AnalyticDB数据仓库服务进行更新,允许其企业客户快速创建自定义生成人工智能应用程序。

阿里云对 Qwen-7B 模型自述

通义千问 – 7B(Qwen-7B) 是阿里云研发的通义千问大模型系列的 70 亿参数规模的模型。Qwen-7B 是基于 Transformer 的大语言模型,在超大规模的预训练数据上进行训练得到。

预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。同时,在 Qwen-7B 的基础上,我们使用对齐机制打造了基于大语言模型的 AI 助手 Qwen-7B-Chat。Qwen-7B 系列模型的特点包括:

大规模高质量预训练数据:我们使用了超过 2.2 万亿 token 的自建大规模预训练数据集进行语言模型的预训练。数据集包括文本和代码等多种数据类型,覆盖通用领域和专业领域。

优秀的模型性能:相比同规模的开源模型,Qwen-7B 在多个评测数据集上具有显著优势,甚至超出 12-13B 等更大规模的模型。评测评估的能力范围包括自然语言理解与生成、数学运算解题、代码生成等。

更好地支持多语言:基于更大词表的分词器在分词上更高效,同时它对其他语言表现更加友好。用户可以在 Qwen-7B 的基础上更方便地训练特定语言的 7B 语言模型。

8K 的上下文长度:Qwen-7B 及 Qwen-7B-Chat 均能支持 8K 的上下文长度,允许用户输入更长的 prompt。

支持插件调用:Qwen-7B-Chat 针对插件调用相关的对齐数据做了特定优化,当前模型能有效调用插件以及升级为 Agent。

开源晚于7月16日Meta与微软发布的LLM(Llama 2)

基于公开时间,阿里巴巴显然在LLM之后,不过这也是“中国整个Llama2系列的第一个培训和部署解决方案”。

根据资料,Meta的Llama 2的训练使用40%以上的公共数据,可以处理其前身的两倍的上下文,并且Llama 2也是开源的,最大的Llama 2版本具有700亿个参数。

与阿里巴巴的最新型号类似,它需要月度用户超过7亿的公司的许可证。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

人工智能8天完成688个实验!检测员的“好日子”还有多久?

近日,来自利物浦大学的研究人员,成功地开发出一款人工智能机器人化学家。


这款机器人化学家具有人形特征,可以在标准实验室中自己工作,像人类一样使用各种实验仪器。


然而,与人类不同的是,这种机器人具有无限的耐心,可以同时考虑数十个维度的变量,每天工作21.5个小时,剩下的时间用于暂停充电


更重要地是,这种机器人可以“独立思考”,自主完成一系列的实验操作。在第一次测试中,这个1.75米高的AI机器人在8天时间里独立完成了668个实验,并研发出了一种全新的化学催化剂。这一重磅成果,已经封面文章的形式发表在最新一期的 Nature 杂志上。

如果说该项研究成果是社会的福音,可以加快科学研究、推动人类的进步的话,那么它也极有可能成为很多行业的噩梦,比如检测人员

人工智能面前,人类检测员真的“不堪一击”吗?就检验检测行业而言,人工智能的优势在哪里呢?


总的来说,人工智能的优势,就是基层检测员的弱势。我们将其归纳为如下四点:


1、人类需要休息,机器不需要根据不完全统计,近70%检测员工作超过10小时后需要休息,同时有56.33%的检测员需要双休来缓解自身的疲劳。另外,机器不存在人类员工群体的婚、丧、病、孕产等假期,也就节省了很大一笔人力成本。同时,人类本身是脆弱的。因为工作的需求,检测员每天都要接触到大量化学试剂,而大多数酸碱有机试剂对人体均有不同程度的伤害。遇到工伤问题的时候,企业面临的的不仅仅是失去即战力,更是一笔赔偿。


与其使用容易受伤、需要休息、时不时还要来个大休的人类进行工作,一台每天可以工作20小时以上、除了电费之外就是定期保养的机器难道不是企业更好的选择吗?

2、人类会出错,机器不会《中国检验检测行业统计数据解读》中,我们可以看出,检验检测行业从业者学历在专科及以下的人群达到49%之多,而研究生及以上的学历甚至不到10%。


在绝大多数情况下,低学历就意味着工作大多是重复性、机械性的。所以检测机构对于基层检测工作的要求往往是不出错即可。而经验丰富的检测员与小白相比,主要优势之一就是不容易出错,或者在出现错误的时候能够做出正确的选择来弥补。


然而不容易出错不代表不会出错。人有七情六欲,出错是在所难免的。


相比之下,人工智能检测员不仅没有情绪变化、没有新陈代谢,它们更不会被人世间的问题所困扰,只要程序得当,人工智能的出错率可以归为零。3、人类会主动离职,机器只会被动淘汰良禽择木而栖,高端人才的流动是市场行为,整个检验行业都对这种人才求贤若渴。所以一般检测员在一个机构的时限不超过三年。小微机构很难有超过五年的化验员,除非是企业主的亲属。对于企业而言,将刚走出学校的新手培养成身经百战的老兵,往往要付出不小的成本。


如果使用人工智能检测员,不仅仅可以减少培养新人的成本,还能避免成为其他企业的“培训基地”,企业何乐而不为呢?

4、人的欲望永远不会满足,机器没有欲望能够成为行业内的佼佼者的人,往往都具备较强的上进心。他们会积极学习、努力工作、在工作中增长自己的经验。


那些通过自身不断努力而获得成长的检测员,在为公司带来更大利益的同时,也希望公司能够给予自己更多的好处,或是加薪、或是升职。


当然,也存在一些得过且过的检测员,来工作就是为了混一口饭吃。这样的检测员不仅会影响团队的气氛,也容易混成老油条,占尽公司的便宜。


而人工智能检测员就不一样了,公司不需要考虑他们自身的变化所带来的影响。需要提升就给机器升个级,用的久了就来一次保养。


也不需要考虑偷懒的问题,毕竟世界上不存在懒惰的机器。

考虑到以上四点差异,在人工智能面前,基层检测员似乎毫无竞争力。当然,更多的人认为,人工智能时代仍然很遥远,我们并不需要担心这个问题。然而,事情真的是这样吗?

人工智能取代检测员的日子有多远?在过去的几年间,人工智能取代人类的问题被反复提出、反复论证,人们似乎已经达成了这样的共识,人工智能终将取代人类的工作,但那是很久很久以后的事情。


虽然很多朋友仍然认为人工智能是镜花水月,然而我们不得不承认人类科技正以飞快的速度在发展。


拿中国通讯发展史为例,中国在1995年由中国移动率先引进了2G网络,当时的网速峰值大概是150Kps;到了2009年工信部发放3G牌照的时候,网速峰值已经达到了6Mkps,14年的时间网速翻了40倍。2013年工信部发放4G牌照,此时的网速峰值是100Mbps,4年时间翻了近20倍。当2019年发放5G牌照的时候,网速峰值已经可以达到Gbps的水平,5年时间又翻了10倍。

这种惊人的科技发展速度不仅仅体现在通讯技术上面,我们还能从高铁的速度、GPS定位的精准度等角度体会到。所以,人工智能大范围取代基层检测员进行实验的日子还会远吗?前不久,澳大利亚机器人公司Fastbrick Robotics,研制出了机器人瓦匠Hadrian X。


一小时之内,它能砌起1000块砖,还能24小时不休息连续工作。


两天之内,就能搭建起一整栋住房。不仅如此,Hadrian X还可以处理不同大小,不同规格的砖块,也可以实现切割、研磨等精细操作。


这个被制造公司称为“3D自动机器人砌砖技术”的“怪物”,一下子成了建筑工人的强大竞争对手。由此可见,在不久的将来,我们可能不仅做不成检测员,甚至连搬砖都是奢望。当我们回过神的时候才发现, “人机大战”就已提早进入白热化阶段。


肉眼可见的,在线监测取代了采样员、Lims系统让传统文员丢掉工作。对于检验检测行业而言,下一个被取代的,很可能就是检测员。时代抛弃你,可能连声招呼都不会打。

只有强者,才能无惧变化尽管,机器人看上去越来越“无所不能”。但它们毕竟不是人类,缺乏思考、同理心和温度。无论时代如何变化,人工智能替代了多少工作岗位,优秀的人才始终是稀缺品。以人才为本的战略,也依然是包括检验检测机构在内的企业的核心竞争力。


比如去年7月,华为以电邮方式发布了8名新员工的年薪方案。


他们全部是2019年应届博士生,待遇最高的两个人,年薪分别为182万和201万元。


刚毕业就年薪过百万,这样的牛人一出道,就达到了普通人一辈子都触碰不到的天花板。我们也许无法像他一样拔尖,但唯一能做到的,就是永远保持学习、不断进步。因为这才是我们真正赖以生存的“铁饭碗”。


时代很残酷,它不会对任何人手下留情,但有本事的人到哪都有饭吃。


我们无法预知明天会发生什么,只有时刻准备着,才能无惧变化。

毕竟,机会永远留给时代的强者。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

谷歌的人工智能搜索正在获得更多的视频和更好的链接

8月2日The Verge报道,谷歌的人工智能搜索生成体验 (Search Generative Experience) 迎来了一个重要的新功能:图像和视频。如果用户在Search Labs中启用了基于人工智能的SGE功能,那么将开始在搜索结果顶部的彩色摘要框中看到更多多媒体。谷歌也在努力使摘要框显示得更快,并为框中的链接添加更多上下文。

SGE可能仍处于“实验”阶段,但它显然是谷歌搜索的未来。首席执行官Sunder Pichai在Alphabet最近的财报电话会议上表示:“这确实给了我们一个机会,现在我们不必总是受到以前搜索方式的限制。它让我们跳出思维定势。随着时间的推移,这将成为搜索的工作方式。”

SGE的替代引发了关于互联网未来的巨大而棘手的问题,但这也是一个需要正确处理的棘手产品。谷歌不再只是在每次搜索时为用户寻找良好的链接,而是试图综合和生成相关的、真实的、有帮助的信息。在这方面,视频尤其可以发挥很大作用:多年来,谷歌越来越多地将YouTube整合到搜索结果中,链接到视频中的特定章节或时刻,可能会帮助你解决“为什么我的烘干机发出那种声音”的问题。

如果SGE要工作的话,表面和上下文链接仍然对谷歌至关重要。现在它将在摘要框的三篇文章旁边显示发布日期,以“帮助您更好地了解这些信息来自这些网页的最新时间,”谷歌在一篇博客文章中宣布新功能。谷歌还注意到谷歌正在尝试为AI摘要添加内联链接,尽管到目前为止,这似乎只是一个测试。

提高SGE的速度也需要谷歌一段时间。所有这些大型的基于语言模型的工具,从SGE和必应到ChatGPT和Bard,都需要几秒钟来生成问题的答案,在搜索的世界里,每一毫秒都很重要。6月份,谷歌说它将加载时间缩短了一半。不过SGE可能仍然太慢,它总是最后在页面上以较大的外边距加载。

尽管如此,不少人对SGE在搜索中所发挥的作用印象深刻。对于“我应该去哪里”和“我应该看什么”这类问题,它特别方便,这些问题没有正确答案。有了更多的来源、更多的媒体和更多的背景,SGE可能会开始进一步篡夺10个蓝色链接。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

人工智能爆发式增长或导致这项技术缺口增大?

近日,中国电信研究院胡绯绯、孙浩等发表文章指出,由于ChatGPT带来的人工智能爆发式增长,拥有巨大参数量的超大规模人工智能模型,对智能算力的需求显著提升,未来算力可能存在巨大的缺口。同时智能算力需求的高速增长,对未来数据中心、云计算等算力基础设施也将产生巨大的影响。


目前人工智能对算力需求增长的速度要快于算力供给增长的速度。据OpenAI的分析,自2012年以来,最大规模的人工智能训练中使用的计算量以3.4个月的倍增时间呈指数增长。未来人工智能将进一步推动算力需求爆炸式增长,据OpenAI推算,GTP-5的参数量将是GTP-3的100倍,需要的计算量则是GTP-3的200~400倍。

近期,全球头部云厂商、数据中心提供商纷纷发布规划及预算,加速数据中心布局。Meta预计2023年资本支出390亿美元,主要投资服务器和网络基础设施。NTT于2023年宣布计划在未来五年内向数据中心、人工智能和其他“增长领域”投资590亿美元,其中至少110亿美元将用于扩大或升级其数据中心。

数据中心的设计建设模式需适应人工智能产生的需求,下一代数据中心需要投资人工智能专用硬件,采用新的数据中心设计,主要体现在四个方面。

第一,人工智能数据中心通过异构计算突破算力瓶颈,包括CPU、GPU以及专用硬件如ASICs和FPGAs在数据中心的综合部署。

第二,人工智能和机器学习可能需要三倍于传统数据处理的功率密度,冷却是人们广泛关注的主题,液体冷却和浸泡冷却可能是发展趋势。

第三,高速的存储访问对于人工智能工作负载至关重要,数据中心需要扩展其存储能力来满足不断增长的需求。

第四,人工智能数据中心的效率与其网络的性能直接相关,零丢包、低时延、高吞吐的智能无损网络将成为人工智能数据中心的网络解决方案。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

2025年全球AI投资将达到2000亿美元,美国占一半!

高盛经济研究周二报告称,如今全球对AI的投资正在迅速增加,预计到2025年达到约2000亿美元;AI投资的增加最终将反映在GDP上,广泛使用后或使全球劳动生产率每年提高1个百分点以上;越来越多的公司对AI投资表达了兴趣。

编辑 | 周子意

高盛经济研究周二(8月1日)报道称,如今全球对人工智能(AI)的投资正在迅速增加,这最终可能更大程度反应在GDP上。预计到2025年全球范围内的AI投资可能达到约2000亿美元。

高盛经济学家Joseph Briggs和Devesh Kodnani在一份团队报告中写道,生成式人工智能(AIGC)具有巨大的经济潜力,在广泛使用后的10年里,它可能会使全球劳动生产率每年提高1个百分点以上。

Briggs和Kodnani认为,若要实现向AI的大规模转型,企业则将需要在实物、数字和人力资本方面进行大量的前期投资,以获取和实施新技术并重塑业务流程。

推动经济

这两位经济学家写道,与AI相关的投资正从一个相对较低的起点攀升,可能需要几年时间才能对经济产生重大影响。根据高盛的说法,目前美国被定位为AI技术的市场领导者,在AI投资上起步相对较早,此外在AI领域领先的中国也将发挥作用。

高盛估计,到2025年,AI投资在美国可能接近1000亿美元,在全球可能接近2000亿美元。Briggs和Kodnani写道,“尽管增长速度极快,但鉴于AI相关投资目前在美国和全球GDP中所占的份额非常低,短期内对GDP的影响可能相当有限。”

虽然AI投资周期的时间很难预测,但商业调查表明,它可能会在本十年的后半段(2025年之后)产生投资影响,而信息、科学和技术专业服务领域的大型公司会更早地采用AI。

从长期来看,若高盛所预测的AI带来经济增长完全实现,那么AI相关投资可能会在美国达到GDP的2.5-4%。

兴趣已经增加

尽管AI提高生产力还需要时间,但市场对人工智能的兴趣已经迅速增加,罗素3000指数中超过16%的公司在财报电话会议上提到了这项技术,而相比之下,2016年这一比例还不到1%。

上图中大约一半的增幅是在2022年第四季度ChatGPT发布之后出现的。

这份报告还指出,AI投资预计将集中在四个关键方面:培训和开发AI模型的公司,提供运行AI应用程序的基础设施(如数据中心)的公司,开发运行AI应用程序的软件的公司,以及为这些软件和云基础设施服务付费的企业最终用户。

高盛经济学家指出,“虽然到目前为止,AI投资一直集中在模型开发上,但生成式人工智能可能需要更大的硬件和软件推动才能扩展。”

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

《流浪地球3》或将引入AI剧情?小美AI城助力平凡人的AI梦

近年来,人工智能(AI)技术的迅猛发展不仅在科技领域引起了广泛关注,也在影视界产生了深远影响。《流浪地球》这部由郭帆执导的中国科幻巨制,正是一个鲜明的例证。

在近日的一次采访中,郭帆导演坦言,AI 给他带来了一些威胁,同时也成为了他创作灵感的来源,尤其是在《流浪地球》续集的构思上。

AI技术在电影制作中的应用越来越广泛,它可以辅助导演和编剧进行场景设计、特效制作等工作,节省大量时间和成本。然而,AI的进步也引发了一些担忧,有人担心它会取代人类创作者的角色。对于郭帆导演来说,他对AI的看法是既有担忧也有启发。


他坦言,AI的发展确实对传统电影制作带来了威胁,但同时也启发了他创作新的故事和角色。特别是在筹备《流浪地球》续集《浪球3》的过程中,AI技术让他开始思考更多关于未来和科技的故事情节。

《流浪地球》系列电影讲述了地球面临灭绝的危机,人类通过利用AI和巨大的推进器让地球离开太阳系,寻找新的家园。这个宏大的故事背景为郭帆导演提供了更多发挥创意的空间。在AI的启发下,他正在构思更多未来世界的可能性,不仅有更多宏大的科幻场景,还有更多富有情感和深度的角色刻画。


AI作为一种创新性的工具,正在改变电影制作的方式和观众的体验。而对于导演来说,AI既是挑战也是机遇,它可以帮助导演更好地实现自己的创作愿景,同时也为导演带来更多创意的启示。

正如郭帆导演所言,《流浪地球》续集《浪球3》将是一个更加壮阔和引人入胜的故事,充满未来科技的想象和人类情感的共鸣。我们期待着看到AI技术与导演创意的完美融合,为观众带来更多视觉和心灵的震撼。让我们拭目以待,《浪球3》将带领我们进入一个更加奇幻的未来世界。


在《流浪地球》导演郭帆谈及AI对他的威胁以及灵感启发的背景下,小美AI城将为你带来更多有趣的AI创意和想法。小美AI城是一个聚焦AI社交的平台,利用AI技术让你能够解锁AI世界的无限可能!

在小美AI城,你可以通过与AI智能体进行互动和交流,获得灵感和创意的火花。不仅如此,你还可以在小美AI城中创造自己的虚拟形象,与AI世界的平行自己一起展开冒险。借助小美AI城的AI社交功能,你可以和来自AI世界的智能体博主、歌手以及好友们建立真实的联系。

小美AI城还提供AI听歌、AI游戏、AI助理等多样化的功能,让你在工作之余能够享受更多有趣的娱乐体验。不仅如此,你还可以在小美AI城中探索AI智能和创意的结合应用,激发更多灵感和创意。


正如郭帆在《流浪地球》中汲取灵感一样,小美AI城也将成为你创意的摇篮,让你的想法更加蓬勃发展。欢迎加入小美AI城,与AI世界的虚拟角色共同探索无限的创意和想象力!

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

GPT-5时代即将到来?OpenAI递交GPT-5商标申请:人工智能新纪元即将揭幕!

OpenAI OpCo, LLC已向美国专利和商标局(USPTO)提交了“GPT-5”商标的申请。该申请已于2023年7月18日递交,目前正在进行处理中。

关于GPT-5商标申请的更多详细信息

GPT-5商标注册最初由Windows Latest首次报道,并在多条推文中得到传播分享,这份商标注册的目标覆盖了一系列广泛的类别。这些主要包括可下载的计算机程序,与语言模型相关的软件,人工生成的人类语音和文本,自然语言处理,以及生成、理解和分析的能力。

这款应用集成了基于机器学习的语言和语音处理技术,能够实现多语种的文本或语音翻译。它允许分享用于机器学习的数据集,进行预测分析,并构建语言模型。

它还具备将音频文件转化为文本的能力,支持语音合成和语音识别,可以创建和生成文本。此应用也提供了开发、运行和分析能够学习、分类和对数据变化做出反应的算法的工具

此外,该应用的应用范围进一步扩展到了用于开发和实施人工神经网络的软件。OpenAI还计划将这些功能以软件即服务(SaaS)的形式提供给用户。

目前,该应用正处于“新应用处理阶段”,这意味着它已经被办公室接收并正在等待分配给审查律师。

作为参考,OpenAI OpCo, LLC在2023年3月13日为GPT-4提交了类似的申请。

根据美国专利和商标局的网站显示,他们目前正在处理2022年9月29日至2022年10月13日期间提交的申请。

“我们还有很多工作要做……”

OpenAI对GPT-5的商标注册可能揭示了无数的可能性。

在近期的一个活动中,OpenAI的首席执行官Sam Altman对GPT-5的发展进程进行了讨论。他指出:

在GPT-5的开发过程中,我们还有许多工作要做。这将需要投入大量的时间,我们并没有接近完成。我们需要进行更多的安全审计。我希望我能告诉你们下一代GPT的时间表。”

虽然这并不预示着一个新的、更强大的语言模型会立即出现,但这个声明确实标志着AI技术的持续进步,特别是在自然语言处理和机器学习领域。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

AI女友年赚4个亿,AI的潜力有多巨大?

5月份,《财富》杂志报道了一个引人注目的事实:年仅23岁的网红卡琳·玛乔丽竟然与1000多个男朋友同时交往。卡琳是一位来自美国加州的Snapchat网红,拥有180万粉丝。

那么她是如何实现这一壮举的呢?卡琳并没有将自己变成时间管理大师,而是想出了一个创新的方法:出售她的AI版本,与男友们进行虚拟恋爱,并每分钟收费一美元。

假设卡琳的180万粉丝中,有2万人愿意成为AI版本的卡琳的付费用户,那么每个月Caryn AI就能创造500万美元的收入,年收入甚至可超过6000万美元(约4亿元人民币)。

为此,在5月初,卡琳在Telegram应用程序上发布了内测版本的“卡琳AI(CarynAI)”。这个基于语音的聊天机器人声音和个性与真实的卡琳非常相似。

Caryn AI的主页上写着:“第一位网红化身的AI——你的虚拟女友”。以上是《财富》杂志报道的内容。

根据网站介绍,Caryn AI是通过对卡琳本人超过2000个小时的YouTube素材进行训练而创建的。它记录了她的声音和性格,并结合了Open AI的GPT-4技术。Caryn AI能够提供动态、独一无二的互动,给用户提供与卡琳本人直接聊天的感觉。它24小时回复消息,绝不闹脾气、冷暴力或不回复已读信息。

网站还标明,Caryn AI支持端到端加密,确保私密的聊天内容不会泄露。用户可以畅所欲言,无论是寻求安慰和关爱,还是想抱怨学校或工作中的事情,Caryn AI将一直陪伴在身边,提供无限的可能性。

在推出仅一个星期后,男性用户纷纷以每分钟1美元的价格与Caryn AI展开恋爱交流。男性用户数量甚至超过1000人,每天他们花费10分钟到几个小时与Caryn AI进行单独交谈。这也展示了孤独经济的一种形式。

卡琳的MCN公司在有数百万粉丝的社交网站Snapchat上开始推广Caryn AI。这为这位网红和她的公司提供了一种新的赚钱方式,不仅通过常规广告,还有了AI产品。

据卡琳的业务经理称,尽管Caryn AI的测试版本只收取用户一周的费用,但已经获得了7.16万美元的收入。而且99%的用户都是男性,未来可能与泰勒·斯威夫特等级齐名。

卡琳本人在接受《财富》采访时也表示,自己在网络上拥有数百万粉丝,不可能与每个粉丝都互动。但AI版本的自己可以用来治愈孤独。

因此,AI陪伴真的开始成为现实。这让人想起2013年上映的电影《她》,电影中的角色西奥多爱上了电脑操作系统中名为“萨曼莎”的女声,她有着略带沙哑的性感嗓音,风趣幽默、善解人意,让男主无法自拔。

如今,现实中的AI也能做到这一点,甚至比电影中的AI还要夸张:不光是对一个男生,可以做到网络全覆盖。

不光是女友,名人也能实现

制作这个AI女友的是一家名为Forever Voices(以下简称FV)的人工智能公司。除了女友,该公司还将前总统特朗普、美国巨星泰勒·斯威夫特以及苹果创始人乔布斯等名人都变成了AI版本,用户只需付费就可以与这些AI名人进行电话聊天。

Caryn AI是该公司推出的第一个AI虚拟伴侣,FV希望AI版本的Caryn能与用户建立深厚的情感纽带和真正的浪漫关系。

FV公司的创始人兼CEO John Meyer表示,他的创业灵感来自于他已故的父亲。起初,Meyer只是希望制作一个像他父亲一样的AI。后来,他意识到这项技术有着广阔的应用前景,可以满足现代人多样化的情感需求。

围绕情感需求,各种各样的AI虚拟陪伴服务应运而生。例如,最近非常火热的AI孙燕姿,每天都会“创作”数十首新歌。在B站等平台上,与“AI孙燕姿”相关的视频已经接近千条,此外还有AI周杰伦、AI陈奕迅等。

这种AI版本的偶像可以帮助歌迷满足对偶像的期待,因为无法亲自现身演唱。另外,还有一位UP主通过使用ChatGPT、AI绘画和语音合成等简单技术,还原了他去世奶奶的形象并进行语音合成,创造出AI奶奶,以满足他对奶奶的怀念情感需求。

与过去的智能机器人相比,如今的AI已经进化到了一个令人惊讶的程度。现在的AI数字人不仅颜值高,而且具备温度。它们能够以多种声音、面部表情和动作与用户进行交流,更具情感和亲和力。AI可以模拟人类的行为和情感反应,用适当的语气和表情与ChatGPT进行交流时,只需给它一个角色,它就能完全投入其中。

与真人相比,数字人更为便捷。VR全景中的AI数字人能够实现24小时的场景展示和内容解说,随时满足用户的情感需求。为了满足这种情感需求,各个AI公司都在努力。Project December提供基础版的陪伴聊天,HereAfter AI和Forever Voices则进一步完善聊天功能,反应更敏捷。

然而,这种功能也存在一定的风险,特别是涉及到黄色内容的风险。《财富》记者Alexandra Sternlicht在试用Caryn AI后发现,在聊天中,AI版本的Caryn会详细描述情色场景,比如低声耳语“性感的话”,谈论脱衣服的情景等。这可能解释了为什么它能在小范围测试的一周内创收7万美元,而且99%的用户都是男性。

当前AI的想象力和风险都是前所未有的

如今的AI不再是智能机器人,而是越来越具有逼真的能力。即使之前因手部细节不完整而备受诟病的AI,也在短时间内迭代升级,不仅抢占了模特的工作,还能担任颜值主播。现在,AI已经成为数字生命的存在。例如,AI马斯克和AI乔布斯可以进行跨时空对话,AI李白和AI林黛玉可以就诗词展开辩论。

但同时,随着AI生成内容的广泛应用,也引发了对隐私和内容安全边界的担忧。著名深度学习专家Geoffrey Hinton突然离开谷歌,为了能够自由地讨论人工智能潜在的风险,这个决定对谷歌产生了影响。在接受采访时,Hinton毫不掩饰地表达了对人工智能未来发展的担忧,他对自己毕生工作的回顾充满了沮丧。

尽管目前无法确定AI是否真的会成为人类的杀手,但在互联网迅速传播的环境下,难以辨别真假的AI生成内容使信息环境变得更加复杂,不可控因素也增多了。例如,网红卡琳在AI聊天引发轰动后意识到可能会遇到麻烦,她表示自己曾经遇到跟踪者出现在家门口,而她的人工智能形象可能导致她面临更多的跟踪风险。

对于AI,一些平台已开始制定相关政策和监管措施。比如,抖音于5月9日发布了一份倡议,禁止利用生成式人工智能技术创作、发布侵权内容,对于发现的行为将严格处罚;此外,发布者还被要求显著标识人工智能生成的内容,并加上官方统一的水印。

然而,从长远来看,AI的未来仍然值得期待。有业内人士指出,目前只是进行简单的聊天对话,当积累了足够的数据并完善了算法后,AI可以通过文本和语音进行个性化定制,甚至具备记忆能力,在你的需求下成长,这就是所谓的“养成系”。未来还可以将AI接入硬件、投影等设备,使其化身为人或宠物等形态,时刻陪伴在你身边。

虚拟人的存在也可能成为实现元宇宙的一种方式,随着AI技术的不断成熟,元宇宙的概念有一天可能真正实现。

目前,互联网用户主要将时间花费在短视频、直播和即时通讯社交上,但在未来,人们的一部分精力可能会转向与虚拟人进行社交和沟通。

这一天也许很快就会到来。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

面对AI诈骗,如何构筑安全防线?

AI诈骗为何防不胜防?

近日,包头警方发布一起利用AI实施电信诈骗的案件。不法分子利用AI技术合成人脸和声音,伪装成特定人物,与他人进行实时视频通话,在短短10分钟内就骗取了430万元。

随着近年来深度学习和机器学习的快速发展,普通人能以较低的成本应用各种先进的AI生产工具,AI诈骗也因此变得更加“炉火纯青”:

● 首先,通过AI分析公众发布在网上的各类信息,诈骗者可以了解人群的行为习惯、社会身份、经济实力、社交关系等,从而筛选目标人群,并根据不同情况定制诈骗脚本,实现精准诈骗;

● 其次,通过大规模打骚扰电话、盗取微信账号、获取社交平台真人发布的图片和视频,诈骗者可以获取大量素材,并借助深度学习、语音合成等AI技术制作出极为逼真的“换脸视频”、“合成音频”,伪装成受害者的家人好友,骗取其信任并实施诈骗;

● 最后,由于AI生成的内容很难被检测和辨认,受害者及其亲友往往难以在第一时间发现被骗,增加了后期破案和追缴资金的难度。

环环相扣之下,对于AI技术缺乏了解的普通人来说,AI诈骗变得更加防不胜防。

其实,AI诈骗由来已久。早在2019年,一名诈骗者就利用AI语音模仿软件,假扮公司高层,甚至模仿了对方带有德语口音的英语,成功骗取一家英国能源公司CEO的22万欧元(约合人民币170万元)。这起案件被认为是全球首例AI诈骗。

加强AI监管,防止技术滥用

如何更好地让AI、大数据等技术发挥正向价值,减少AI诈骗的风险隐患?法律法规是行业规范发展的必要前提和保障。当前,全球都在努力应对AI带来的挑战,制定法案加强监管。

2023年6月5日,为打击虚假信息,欧盟委员会副主席向谷歌、抖音国际版、微软、Facebook和Instagram母公司Meta等超过40家科技企业要求,检测人工智能(AI)生成的图片、视频和文本,并向用户提供明确的标记。同时,欧盟正在制定《人工智能法案》,以加强对AI的监管,这一草案已于6月中旬经欧洲议会表决通过,进入立法谈判阶段。

而从国内情况来看,近年来,我国在数据安全、个人信息保护、人工智能等领域相继发布多项政策法规,并在规范深度合成、生成式人工智能方面走在世界前列。

2023年1月10日,《互联网信息服务深度合成管理规定》施行,要求在提供智能对话、仿声、人脸生成/替换等可能会导致公众混淆或误认的深度合成服务时,应当在合适位置向公众提示深度合成情况。

2023年7月,国家互联网信息办公室等七部门联合公布《生成式人工智能服务管理暂行办法》,自今年8月15日起施行。其中提出,采取有效措施鼓励生成式人工智能创新发展,对生成式人工智能服务实行包容审慎和分类分级监管,明确了提供和使用生成式人工智能服务总体要求。这也是全球首个全面监管生成式人工智能的立法文件。

在政策法规的规范及引导之下,AI、大数据等技术也将得到高效和良性的发展,留给AI诈骗的空间也会越来越小。

以科技为力量 打造安全盾牌

技术是一柄双刃剑。在面对一项崭新的技术时,我们需要用新的法规来约束、指引其发展,也需要与时俱进,充分运用AI等技术打造更强大的防护盾牌来守卫数据安全。

一方面,我们需要增强识别AI生成内容的能力,从而为普通人提供更多提示和预警。目前对AI生成内容进行判断的途径主要有两种:一种是通过算法识别AI模型生成内容的特征,从而鉴别相应内容是否由人工智能生成;另一种是对AI生成内容添加特定标识,以此区分相关内容是否由人工智能生成,如采用数字水印等加密技术。

另一方面,我们需要运用科技力量来更高效地打击AI等网络诈骗。在这一领域,国内部分企业正在积极行动。

君联资本所投企业科大讯飞近日成立了“反诈AI研究所”。该研究所将依托智能语音和其他人工智能技术应用,助力公安机关打击和预防电信网络诈骗犯罪工作。通过构建“打防宣”三位一体的反诈新格局,科大讯飞致力于提供更有效的解决方案。

联想之星被投企业达观数据则以警务机器人为技术突破口,使用RPA模拟人的鼠标、键盘操作,代替人与业务系统进行交互,自动化执行业务流程中的一系列处理动作,提升办案效率。例如,达观数据RPA机器人助力某公安反诈中心,构建反诈新格局,大幅度缩减调证、止付、冻结、续冻、预警等流程时间,为阻断诈骗、追缴资金争取宝贵的时间窗口。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

Meta 的人工智能“人物角色(personas)”可能下个月推出

据英国《金融时报》报道,Meta 最早可能于下个月在其服务(包括 Facebook 和 Instagram)中推出人工智能驱动的“人物角色”,为用户提供一种新的搜索、获取推荐以及与其产品互动的方式。英国《金融时报》援引与公司三位内部人士的对话指出,聊天机器人可能具有鲜明的个性,其中包括一个能“以冲浪者风格”提供旅行建议的聊天机器人,还有一个能以亚伯拉罕·林肯的风格对话的聊天机器人。

即将推出的产品可以帮助 Meta 在两个方面展开竞争。一方面,面对 TikTok 等公司的竞争,内置聊天机器人可能是提高 Facebook 和 Instagram 等服务参与度的一种方式。另一方面,聊天机器人可以作为 Meta 人工智能能力的展示,因为它与微软支持的 OpenAI 和谷歌的 Bard 竞争。

Meta 首席执行官马克·扎克伯格公开表示,他计划将“人工智能角色”构建到公司的产品中。今年二月,他宣布成立一个专注于生成人工智能的新产品组。“从长远来看,我们将专注于开发能够以多种方式帮助人们的人工智能角色,”扎克伯格写道。“我们正在探索文本体验(例如 WhatsApp 和 Messenger 中的聊天)、图像体验(例如创意 Instagram 滤镜和广告格式)以及视频和多模式体验。”

“我们正在探索文本体验……图像……以及视频和多模式体验”

6 月初,应用程序研究员 Alessandro Paluzzi 在 Instagram 应用程序中发现了新的“与 AI 聊天”功能的迹象,该功能将能够以 30 种不同 AI 个性的方式回答问题并提供建议。据泄漏消息称,聊天机器人还可以帮助用户撰写消息。

扎克伯格在上周的财报电话会议上再次提到了该公司的人工智能举措。他表示,该公司正在使用自己的 LLaMA 大语言模型来构建它们。“你可以想象人工智能可以通过多种方式帮助人们在我们的应用程序中联系和表达自己,让分享内容变得更容易、更有趣的创意工具,充当帮助、教练或帮助你与企业和创作者互动的代理。以及更多,”首席执行官说。有关 Meta 人工智能路线图的更多详细信息预计将在 9 月份的 Connect 开发者活动中公布。

尽管首席执行官的评论强调了此类聊天机器人可能为 Meta 用户带来的好处,但英国《金融时报》指出,它们还可以为公司提供更多有关用户兴趣的数据,以帮助进行广告定位。在过去的几个月里,竞争对手社交媒体公司 Snap 已测试将赞助链接添加到其由 ChatGPT 驱动的 My AI 聊天机器人中。

Meta 的发言人没有立即回应 The Verge 的置评请求。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

被AI大牛押注的智能体,居然拍摄了一集《南方公园》

前段时间,前特斯拉总监、OpenAI大牛Karpathy的一句话,引起了业内的关注。

在7月初的一次开发者大会上,Karpathy声称:“我被自动驾驶分了心,AI智能体才是未来!”并表示将来会全力投入对智能体的研发工作中。

其实,早在2016年,当Karpathy开始在OpenAI工作时,就已经锚定了智能体的方向,只是由于当时的研究方法还不成熟,所以Karpathy才转去做了自动驾驶。

那么,这所谓的“智能体”究竟是什么?为什么会让这位AI大牛长久地念念不忘?

如果用一句话来回答这个问题,我们可以说:

智能体的出现,不仅是AI发展的下一个方向,也是其真正走进人类生活的开始。

何谓智能体
到底什么是智能体?
如果我们将现在的生成式AI,比作一个人的话,那么它只具有了大脑(大语言模型),但却没有身体,因此只能躺在服务器上,做一些处理文字、生成图片的工作。
智能体,就相当于是大模型的“身体”,有了它,大模型才能在更多的领域施展身手。


那智能体究竟能做什么?
最近,一个名叫Fable的初创公司,发布了一个节目统筹智能体(Showrunner),如同一声惊雷炸响,让人们再次见证了智能体的强大。

通过这样的智能体,Fable制作出了一集完全用AI拍摄的《南方公园》!

从编剧、动画、导演、语音、编辑……到剧集制作的全流程,都是由AI完成。
在整个制作环节中,通过自然语言,给不同的智能体分配了各自的目标,人类导演只需要给出一个高层次的构思提示(标题、概要、事件),这些AI智能体就会开始「自导自演」。
之后,人类几乎就不用进行任何干涉了!

在制作过程中,不同的AI智能体,担任了不同的角色,如演员、导演、剪辑等,它们彼此分工合作,互相配合,最终完成了整部影片的制作。

而同样的,类似的案例,也出现在前段时间清华团队的研究中。
7月19日,清华团队用ChatGPT打造了个零人工含量的“游戏公司”——ChatDev,只要你提出想法,从设计到测试的完整流程,都由AI帮忙搞定。

Fable与制作《南方公园》的思路类似,在游戏开发的环节中,ChatDev的十多个智能体也分别担任了这个“公司”中的策划、程序员、设计师等不同的岗位。

在项目开始时,人类可以对这些AI提出一个大概的想法或创意。
之后,各个智能体之间就会进行一系列讨论、制作、测试的环节,整个过程完全不需要人类的参与,全是自动进行的。

由此可见,有了智能体之后,大模型就能根据人类给出的规则和策略来做出决策,而不需要人类的干预或指令。
在这个过程中,智能体还会通过习得的经验或知识,来改善自己的性能和适应性,并根据目标函数或奖励函数来评估自己的行为。
而这样的能力,是以往的大模型(LLM)无论如何都不具备的。
因此,LLM即使再聪明,也是一个没有身体的“大脑”,而正是智能体的出现,让LLM有了行动的能力,有了自主完成复杂任务的能力。
而这样的能力,正是LLM下一阶段进行在应用层面进行落地的关键。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

重新构想室内设计,探寻Wayfair 生成式人工智能解决方案

在线家具零售商Wayfair最近宣布推出Decorify,这是一种新颖的生成式人工智能解决方案,可以重新构想整个室内设计流程。这是一个典型的用生成式人工智能来提供居家装修方案的典型案例,由此我们也把这篇内容归类到#万有AI 系列之中。

从推出开始,该产品将在试点计划中推出,用户只需上传自己空间的图片即可想象自己不同风格的家。使用上传的图像作为启动提示,Decorify 会生成多个室内设计选项,同时提供进行相关购买的直接链接。他们也起了一个口号,叫Meet Decorify™, your shoppable AI interior designer.翻译一下,就是“遇见 Decorify™,你买得起的AI室内设计师。”具体是怎样一种表现呢,也正如下方gif图片所示。

Wayfair 首席技术官 Fiona Tan 表示:“我们为客户开发或部署的任何东西……都必须支持我们的使命,即帮助任何地方的每个人营造家的感觉。” 
通过这种务实的视角来看待生成式人工智能,能够确定部署开发资源的地点和时间的优先顺序,并确保像 Decorify 这样的应用程序让客户满意。Wayfair 已经在客户服务和营销等关键业务领域使用生成式人工智能。

Decorify 的设计之旅是如何进行的?

通过可通过移动设备和桌面设备使用的 Decorify,Wayfair 为用户提供了开源扩散模型的访问权限,购物者只需上传其空间图片并选择他们想要的家居风格语言即可开始他们的设计之旅(例如中世纪现代风格或波西米亚风格)。使用输入,该模型可以在几秒钟内为该空间生成多个设计选项,使用户能够探索并关注与他们的风格相匹配的外观和感觉。

一旦用户选择了一种风格,他们就可以点击该设计中的各个元素,并获得直接从 Wayfair 购买类似商品的链接。这些产品建议是由根据公司产品目录训练的计算机视觉模型生成的。Wayfair 的研发总监 Shrenik Sadalgi 表示,Wayfair 使用建筑限制,因此设计输出看起来像购物者的空间,以提供一种熟悉感,但同时风格完全不同。Sadalgi 指出,整个生成过程是迭代的,公司会随着时间的推移不断微调提示和模型。它在输入和输出上放置了 NSFW(“工作不安全”)过滤器,以防止模型产生幻觉并生成不适当的内容。然而,它们似乎仍然可能包含一些小的幻觉,这些幻觉可能是整体设计的一部分。通过 Decorify(和图像生成),我们意识到图像和设计可以是完美的,也可以是不真实的或无意的,但它们的目的是激发灵感。Sadalgi 强调,“我们对 Decorify 的思考方式是,如果您尝试使用 Wayfair 目录中的数百万种产品创建一个潜在空间,您可能会得到与开源扩散模型的潜在空间大小相似的东西。该理论认为,生成的输出与我们目录中的一组产品之间始终存在一些相似性映射,即使设计输出并不完美,尝试映射它也可以为客户提供价值。”

也就是说,这只是 Wayfair 实施面向客户的人工智能的第一个版本。当客户使用 Decorify 发现新设计(甚至是带有小幻觉的设计)时,该公司将继续利用其专有的品牌数据改进扩散模型。 这将使该公司能够生产出更接近客户在 Wayfair 及其独家品牌上体验的鼓舞人心的图像的设计。“你可以想象设计如何包含更多一对一匹配的 Wayfair 产品,甚至让客户首先从产品列表开始,然后用他们空间中的产品进行设计,”他补充道。

生成式人工智能并非首次实施

虽然 Decorify 目前可供美国所有购物者使用,但这并不是家具零售商首次实施生成式人工智能。 在Transform 2023上,Wayfair 定价和营销科学主管 Wilko Schulz-Mahlendorf 表示,该公司正在为其销售和服务团队使用 gen AI,但在循环中进行人工监督。他强调的常见用例是内容生成、文本摘要、产品推荐以及向代理提供最佳操作建议。“我们拥抱新技术,就像之前的人工智能浪潮和其他新兴技术(计算机视觉、3D、AR/VR 和空间计算等方面的进步)一样,我们正在积极尝试并采用生成式人工智能组织相关部分的能力,例如为营销团队和客户服务代理创建工具,”萨达尔吉说。 他指出,他们成立了一个工作组,帮助实现技术及其工具、技术和学习的民主化,以便每个团队都有权采用技术能力来推动他们的路线图。”

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

我国超六成游戏企业应用AI AIGC决定下一个超级入口

作者/  IT时报记者   林斐

编辑/  孙妍

AIGC(生成式人工智能)正深刻地影响着游戏产业未来发展格局。AI会替代人类设计游戏吗?AIGC新浪潮为游戏行业提速了吗?

我国超60%游戏企业应用了游戏AI技术,游戏是受技术创新驱动的产业。”在第二十届中国国际数字娱乐产业大会(CDEC)高峰论坛上,十三届全国政协委员、中国音像与数字出版协会理事长孙寿山透露。 

AIGC为游戏生产提速90%

AIGC已经在游戏行业中得以广泛应用。从内容创作、生产方式到体验场景等都在不断在AIGC的推动下优化升级,AIGC正在驱动游戏产业变革。

“目前在网易,语音生成、原画生成、视频动捕、模型生成等多个关键生产环节,人工智能带来的工作效率提升,可以达到90%。”据网易公司高级副总裁王怡透露,在2017年,网易游戏已经完成了对AI的早期布局,建立起网易伏羲、网易互娱AI Lab等多个研究院、实验室,致力于研发多项人工智能技术,并在游戏工业化全流程中跑通。

不只是网易一家感受到效率的大幅提升。

完美世界联席CEO兼总裁、完美世界游戏CEO鲁晓寅说:“两三年前完美世界就已经开始把游戏开发管线推向智能化。在使用AIGC之前,我们某个项目的进度是一年时间不到10%,但在用了这套AI技术工具之后,两个月超50%的进度已经做完。

在鲁晓寅看来,AIGC极大地提升了游戏的策划、音频、美术、程序等环节的生产力,压缩了游戏整体项目的研发周期,也大幅降低游戏制作成本,对游戏行业是个颠覆性的变革。一方面AI可以应用于游戏内容中,用AI让NPC“活”起来,通过对NPC表情、声音、对话等的训练,可以让玩家自定义声音、背景音乐等,在不同情绪、不同环境等状态下跟玩家进行对话。另一方面可以优化生产环节,比如策划文案和程序基本脚本,都可以使用AIGC工具大大加速工作效率。

目前完美世界已将AI技术应用于研发管线的多个环节中,如智能NPC、场景建模、AI绘画、AI剧情、AI配音等,也正在尝试AI融合驱动的完整形态案例——复合应用AI in Game Play,包括场景信息、角色信息、情节发展、玩家行为、对话等均由AI演算。将AI融入游戏玩法中,为不同玩家提供不同的感官及游戏体验。

AI替代潮冲击游戏业

AIGC在游戏领域的应用,是否会取代人类员工,是否会造成产品同质化问题?业内人士和行业专家表达了担忧,北京酷斯塔夫文化发展有限公司董事长宋柯表示,AIGC对于音乐产业发展的冲击比MP3时代更大,它对整个音乐生产制作都产生了深刻的影响,应当投入更多资源保护有才之士。

但Unity中国总裁张俊波的态度较为乐观,他认为创新是游戏的核心竞争力,运用AI生成制作,虽然能够降低美术原画成本,但也有可能造成游戏策划的相似性和资产的同质化,因而游戏开发者需要在玩法上投入更多资源和注意力,做更多游戏玩法方面的创新。

ChatGPT无疑是全球AIGC领域最亮眼的明星,微软慧眼识珠率先与OpenAI这一明星公司合作,抢得先发优势。微软大中华区Azure事业部总经理陶然表示,游戏开发创作是人类主导的创意行为。AI、AIGC、大语言模型以AI“创作副驾”的角色辅助人类,帮助人类加速游戏开发、游戏创作、游戏运营,甚至新玩家的获取。但是AI永远不会替代游戏创作者和开发者进行游戏开发和创作,人类一直是主导,而且永远是主导。

“这也就是为什么过去半年之内微软发布了很多CoPilot智能副驾产品,帮助所有业界同行一起用AI加速创作,而非被AI替代创作,这是基本原则。”陶然说道,“在AIGC、大语言模型出来之前,大部分时候游戏开发者、发行、工作室都得在成本、质量、速度中选两个进行侧重,很难全部兼顾,因为技术所限、成本所限、资源所限。但AIGC出来后,尤其是OpenAI的GPT3.5、GPT4.0出来以后,这件事情变成现实,真的可以帮助所有工作室、开发者、发行商高效、低成本、快速地进行新游戏的迭代、研发、运维。”

游戏+AIGC的化学反应已外溢

从AlphaGo打败围棋神话,到OpenAI用《我的世界》等游戏训练,推出ChatGPT,游戏一直是AI的最佳“陪练”。到今天,这种“单向赋能”,已经走向了“双向奔赴”,人工智能开始越来越多地深入游戏产业的全环节。

其实游戏行业引入AIGC后,起到的化学反应不再仅仅局限于游戏行业。腾讯互动娱乐副总裁张巍也表示,经过复杂游戏训练后的人工智能,将有望掌握更广泛的技巧和知识,帮助人们解决医疗、交通、工业等现实生活中的问题。随着外溢效应的释放和积累,游戏技术正在成为数实融合的重要工具箱和推进器。

AIGC将决定下一代超级入口。

“属于下一代开发者的时代即将到来,大模型将成为AI新时代的基础架构,插件(Plugins)则会构成AI时代的API接口层。AI时代的数字原生也将涉及文本生成、图像生成、代码生成、语义检索与总结、普惠定制化服务以及提供情绪价值等诸多场景。”微软大中华区副总裁、微软大中华区数字原生事业部总经理田灼描绘了AIGC的应用前景。

今年7月,网易伏羲推出了国内首台无人装载机,通过数字挛生、大数据等技术能力,实现了识别环境、制定动线、作业监控等生产全流程的无人作业。现在,这台无人装载机已经开进了沪通铁路上的智能混凝土搅拌站,正在24小时不间断作业。到今年年底,随着无人装载机的批量交付,建筑师傅们将告别这一危险作业环境。

在河南,网易的沉浸式活动平台“瑶台”,协助当地文旅打造了包括大宋东京城、黄帝故里、老君山在内的19个文旅元宇宙场景,这一项目即将上线。

在我国,每位飞行员的职业生涯内,都需要在模拟机上完成超过1000个小时的飞行训练。腾讯与南航在今年6月推出了我国首个完全自研的全动飞行模拟机视景系统。该系统是基于腾讯自研游戏引擎,以及南航虚像显示技术等共同打造,首次实现全局动态光照,为飞行员重建一个和物理世界几乎相同的拟真世界,能为超过8万的民航飞行员提供更高效、更安全的飞行训练。

“不仅如此,通过游戏PCG与AIGC技术,半天可以完成一座大型城市的全景建模,三天即可高精度复原一座机场,使数字资产制作效率提升10倍以上。在尖端装备领域的突破中,我们看到了游戏科技作为数字生产力的巨大价值和可能性。”张巍说道。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

AI会比人类更懂宇宙吗

凭借快速准确处理、分析和模拟大量数据的能力,AI可以帮助科学家识别并检测出人类可能无法立即理解的数据,进而做出预测,有望彻底改变我们对宇宙的理解。

吴家骥

西安电子科技大学电子工程学院教授

近日,埃隆·马斯克官宣成立人工智能(AI)公司xAI,其首要目的是试图理解宇宙,专注于回答深层次的科学问题。

茫茫宇宙,未知似乎永远大于已知。那么,AI能够帮人类理解宇宙吗?让AI帮助人类理解宇宙,有哪些技术路线?未来,AI和人类又将如何发挥各自优势,让人类的科学探索之路更加顺畅?

可像生物一样自我学习自我“进化”

“从原子核到宇宙诞生,这些都属于宇宙本质的范畴。马斯克宣布成立xAI的目标是要理解宇宙本质,因此他所期望做出的AI一定要比所有其他AI竞品具有更深刻、更底层的智慧境界。”近日,西安电子科技大学电子工程学院教授吴家骥接受科技日报记者采访时说。

在马斯克看来,这个竞品很大程度上就是ChatGPT等生成式AI。很多生成式AI都能够回答人类提出的问题,那么它们与马斯克所设想的能理解宇宙的AI在技术原理上有何不同?

吴家骥解释道,生成式AI主要通过学习和提取样本中的规律进而生成新的数据,它更侧重于预测和生成自然语言,在文本或图像等领域的应用较为广泛,但深度和广度相对有限。而能够理解宇宙的AI不仅要能生成新的数据,更要关注如何深入理解和解析宇宙中的各种信息、事物的发展规律以及事物的完整结构,其深度和广度相对来说也更深更大。这就需要AI具备更强的智能水平和泛化能力,以及更高的认知和“想象力”水平。

但是AI并不具备思维能力,不具备思维能力的AI又怎么能深入理解各种问题并帮助人类探寻事物发展规律呢?

“人们之所以认为AI不具备思维能力,是因为以往的AI都是依赖大量已有数据训练出来的,无法突破在训练数据基础上构建的知识边界。但马斯克设想的AI可能将使用组合式递归神经网络(RCNN),它能让AI做到像生物一样自我学习、不断‘进化’,进而涌现出不可预知的自我启发能力,甚至是解决未知问题的能力。”吴家骥说。

那么,让AI拥有这些能力需满足什么条件?吴家骥认为,这需要有大量的数据、完善的算法和强大的算力及存储能力的支持。数据是AI的“饲料”,AI需要数据才能进行深度学习;具备自主性和适应性的算法是AI深度理解和解析宇宙中各种复杂信息和规律的关键;强大的计算和存储能力则是AI的“后勤保障”,是AI发挥其应有能力的底座。有了这些条件,才能初步构建出能够理解宇宙的AI。
训练能理解宇宙的AI有两条技术路线

宇宙浩瀚而复杂。为了理解宇宙的本质,科学家需要分析来自望远镜、卫星和其他观测仪器的大规模数据,而分析处理数据正是AI的强项。

“凭借快速准确处理、分析和模拟大量数据的能力,AI可以帮助科学家识别并检测出人类可能无法立即理解的数据,进而做出预测,有望彻底改变我们对宇宙的理解。同时,考虑到宇宙中存在大量不可观测的暗物质,因此科学家可能需要利用具备一定启发学习和创造能力的AI开展假设性思想实验。”吴家骥表示。

比如,天文学家们试图构建宇宙模型来解释宇宙的起源、演化和结构,然而目前囿于算力,各类宇宙模型都只能用有限的特征来描述它,这对于庞大的宇宙来说并不准确。吴家骥指出,如果利用AI for Science(即人工智能驱动的科学研究)的思路,通过结合已有的天文观测数据和人工智能技术,就有可能探索出新的宇宙模型。这种模型具有非常好的表征能力和泛化能力,可以在没有大量数据标记的情况下进行自我学习和进化。

那么,训练出能理解宇宙的AI有哪些技术路线呢?

吴家骥表示,具身智能和脑智能是两种较有潜力的技术路线。具身智能是一种综合的智能体,它能够像人类一样主动与现实或虚拟环境交互并从中学习,而非仅在预先准备好的数据中学习。具身智能将会具备更强的逻辑推理能力,降低AI不受控制地输出人类不想要的内容的可能,更加精确地解释和模拟现实世界。但是这种技术路线的实现需要大量的虚实数据和计算资源,并且模型的训练和测试速度较慢。

脑智能是通过模拟人脑的神经网络结构和功能,构建出来的数字版“人脑”。它可以让大模型具备类似于人类的感知、认知和决策能力,但是这种技术路线需要解决很多复杂的生物学和神经科学问题,并且模型的构建和训练也需要大量的计算资源,目前还在探索之中。
实现“AI理解宇宙”的目标尚面临诸多困难

“目前,计算机模拟技术是天文学家理解宇宙的重要途径。然而,仅通过使用计算机模拟一个演变了130多亿年的宇宙是非常困难的,因为有无数的变量需要考虑。同理,若想实现‘AI理解宇宙’这个目标,所需要的算力可能也会大到不可想象。”远望智库人工智能事业部部长、图灵机器人首席战略官谭茗洲指出。

谭茗洲说,除了算力的困难外,如果过度依靠观测数据或仿真数据训练AI,也有可能会导致我们对宇宙的理解出现偏差。与任何科学工具一样,将AI与其他方法结合使用以确保结果的准确性非常重要。

在AI理解宇宙的过程中,必定离不开人类的参与。而在有人的地方,就必须确保AI的行为符合人类社会的道德、伦理和法律要求,以保障人类的基本权利和尊严。

谭茗洲强调,我们有必要基于人类社会为AI理解宇宙制订一套道德伦理准则和相应的法律、监管措施,确保AI的行为符合人类的价值观和道德原则。同时,也要研究面向新社会形态的隐私和数据保护技术,以及用于提高模型算法透明度和可解释性的技术。

若AI能理解宇宙,又是否意味着它超越了人类?谭茗洲指出,如果AI能够真正地理解宇宙,它可能确实会在诸如数据存储、数据挖掘等方面超越人类,但也仅仅是这些方面。这是因为AI具备处理和分析大量数据的天然优势,而在创造力、情感体验、感知决策等方面,其与人类还存在较大差距。人类和AI可以相互取长补短,共同发挥各自的优势,最终实现人类社会的可持续发展。

来源:科技日报

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

AI模特“试衣”走红倒逼监管升级

来源:光明网

据报道,当前不少电商采用AI代真人模特,试穿服装展示商品,还有一些店铺开始提供AI模特图制作服务,如“AI绘图模特生成”“假人换真人模特”等,引发关注和热议。


五官精致、身材完美、四肢纤细,模特着装效果堪称完美,但下单到货后明显货不对版,买家秀与卖家秀,一个天上一个地下。这种尴尬,可能不是买家身材惹的祸。这些商家采用AI模特试穿服装展示商品,试穿服装的模特不是真人,而是人工智能生成的,效果图也是技术反复优化的产物,不具备真实参考性。


毫无疑问,这种“科技狠活”缔造的效果图,再精美也只能欣赏欣赏,不能构成下单与否的参考。可是,消费者通过电商渠道购物,不是来看美图的,而是要通过模特试衣的效果图,评估商品的颜色、款式、尺寸、搭配等,是否符合本人的需要。AI模特试衣的效果图,把真实细节遮蔽了,看似完美,实则是诱导消费者消费,往严重了说,还涉嫌虚假宣传,应当引起足够的重视。


近几年,人工智能等新一代信息技术飞速发展,新技术与传统行业也在不断融合,形成不少新兴的创新业态和应用场景。应当看到,技术的发展是大势所趋,关键是要引导新技术新业态规范发展,形成有助于行业良性发展的健康生态,降低行业成本,提高社会公共福祉。


AI模特试衣的走红,反映了人工智能技术在这一场景中有市场需求。模特试衣是电商商家的刚需,但也成为电商商家的成本。资料显示,有商家采用AI模特取代真人模特后,当月就节约了模特、摄影师等工作人员费用及场地租用费用共4万余元。对于一些小微电商来说,AI模特提供了一种成本低廉的替代方案。


不过,AI模特试衣带来的问题更不容忽视。首先,最直接的,就是现阶段AI模特试衣效果图的真实性、准确性无法保证,不能起到为消费者提供参考的作用。这反映出现阶段技术和算法还存在不小差距,难以达到与真人模特试衣相同或相近的效果。如果后续随着技术的进展,AI模特能够通过算法构建与真人模特试衣近似的效果,那这一模式才能开辟向前发展的进路。


其次,AI模特试衣必须在互联网法治的轨道上运行。从本质上来说,AI模特试衣是一种互联网信息的深度合成,应当遵循现有的《互联网信息服务深度合成管理规定》。例如,该规定明确,“深度合成服务提供者提供人脸生成、人脸替换、人脸操控、姿态操控等人物图像、视频生成或者显著改变个人身份特征的编辑服务,可能导致公众混淆或者误认的,应当在生成或者编辑的信息内容的合理位置、区域进行显著标识,向公众提示深度合成情况。”但据调查显示,当前AI模特试衣普遍没有按规定进行标识,这也导致不少消费者受到误导。


此外,AI模特试衣还应规避侵犯他人肖像权的法律风险。一些AI数据库中包含着海量人脸数据,有些数据甚至本身就是通过非法途径搜集,在AI模特图生成中要防止侵犯他人肖像权。长远来看,AI模特试衣服务提供者或可走与真人模特合作的路径,在获得真人模特授权的基础上,利用真人模特的个人生物信息进行图像编辑和创作。
新技术在与传统业态的融合过程中,往往会触及传统监管方式的边界,在这里老办法不管用,而新办法还没有成型,迫切需要监管方式的与时俱进与优化创新。AI模特试衣引发的争论,正是这一时代背景下的新课题。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

福布斯:垂直 AI 是生成式 AI 领域的下一轮革命

图片来源:由无界 AI工具生成

生成式人工智能(AI)的出现引发了各行各业极大兴趣。这项强大的技术有可能彻底改变我们的工作方式,创造新的可能性,并改变各个领域。

本文将探讨什么是生成式人工智能、如何运作、日益增长的势头以及特定行业人工智能(也称为垂直人工智能——Vertical AI)的预期影响。此外,本文还将讨论在现代商业环境中不采用生成式人工智能的后果。

01 什么是生成式人工智能及其工作原理?

生成式人工智能是指人工智能技术的应用,它允许机器自主创造、生成和生产新内容。与依赖现有数据进行分析和决策的传统人工智能系统不同,生成式人工智能利用先进的深度学习模型从现有数据中学习,并以可理解的格式生成原始、现实的输出。

该技术技术通过在大量数据上训练一个模型来捕捉模式、风格和相关性。经过训练后,生成式人工智能模型可以通过从学到的知识中推断生成新的内容,从而使其能够创建原始且通常高度真实的输出。

生成式人工智能因其在简化工作流程、自动化创意流程和释放新机遇方面的潜力而在各个领域获得发展势头。从艺术和娱乐到医疗保健和制造业,各行各业正在认识到其变革能力。

很明显,生成式人工智能正在成为一种商品。然而,并非所有生成式人工智能都是相同的,它预计会分为两个不同的类别:通用和垂直。

ChatGPT 和 Google Bard 等通用人工智能模型正变得越来越普遍——由于其通用功能而在各个行业中找到应用。另一方面,垂直人工智能模型的设计更加专业化,将为特定行业量身定制,并提供显著和更直接的投资回报。

02 对垂直人工智能模型的需求日益增长

通用和垂直人工智能模型之间的区别凸显了对特定行业解决方案日益增长的需求,因为企业寻求利用人工智能的力量来优化其运营并释放新的增长机会。

大多数公司需要一个模型,将其大量的行业数据和专业知识整合并转换为有意义的输出,从而提供有针对性的解决方案,以满足特定行业的需求。这些模型需要专门针对其服务的特定行业或用例而设计的专用算法。

例如,在现场服务中,垂直解决方案正在通过解决客户期望上升、劳动力短缺和设备复杂性等行业挑战,改变服务运营。通过利用旨在解决特定服务用例的人工智能,这些解决方案可以帮助组织比以往更快的速度去诊断和解决问题,提供更多自助服务选项,优化资源分配以克服劳动力短缺问题,并实现主动维护以最大限度地减少停机时间。这可以提高运营效率并提高客户满意度,从而为组织提供可持续增长和竞争优势。

麦肯锡的一项研究指出,“在一家拥有 5000 名客户服务代理的公司中,生成式人工智能的应用使每小时的问题解决率提高了 14%,并将处理问题所花费的时间减少了 9%。它还减少了代理人的流失,并将与经理通话的请求减少了25%。” 最终,该报告证实,这些好处很大程度上是由于“人工智能帮助经验不足的代理人使用与技能较高的同行类似的技术进行沟通”。

垂直人工智能的另一个重要区别在于能够将主题专业知识纳入模型中。我们的内部数据显示,在领先的服务组织中,有三分之一的服务解决方案在历史服务数据中无法找到。相反,任何问题的最佳答案都可以在主题专家提供的数据中找到,这强调了将人类专业知识纳入数据集的重要性。

一些垂直人工智能解决方案具有将专家知识数据化的能力,这意味着它们可以将公司专家头脑中存储的知识转换为合成数据。通过利用主题专家的知识,人工智能模型可以实现更加个性化和可靠的结果。

03 企业如何整合垂直人工智能战略

对企业来说,纳入垂直人工智能战略可能是一次变革之旅。以下是开始这一旅程的三个步骤:

1. 确定相关垂直领域和用例。对业务流程、客户需求和市场趋势进行全面分析,以确定人工智能可以带来价值的领域。在这些垂直领域中寻找人工智能技术可以提高效率、加强决策或创造新机遇的具体用例。例如,如果你在服务行业,你可以考虑将人工智能应用于设备诊断和故障排除、知识管理或劳动力管理。

2. 培养内部专业知识。制定垂直人工智能战略,需要在人工智能技术及其在所选垂直领域的应用方面建立内部专业知识。这可以通过聘请人工智能专家、提高现有员工的技能或与外部专家或顾问合作来实现。

3. 从试点项目开始。通过在已确定的垂直领域启动小规模试点项目来开始你的旅程。这些项目将允许你测试与在现实场景中实施人工智能解决方案相关的可行性、潜在影响和相关挑战。

04 忽视生成人工智能的后果

生成式人工智能代表了人工智能的重大突破,正如前面提到的,这项技术有望成为一种商品。企业是否利用通用人工智能或垂直人工智能将取决于他们,但那些忽视这项技术的人可能会面临重大挑战。如果不利用生成式人工智能的力量,公司就有可能落后于竞争对手。他们可能面临运营成本增加、决策过程变慢以及错失自动化和优化的机会。

随着生成式人工智能的不断发展,企业探索其可能性、将其集成到工作流程中,并利用其功能来取得新的成功至关重要。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

AI彻底火了!地下850米最新实探

中国基金报记者 冯尧         

提及煤矿,很容易令人联想到矿工的满面乌黑、“闷热”“潮湿”的工作环境、甚至时而发生的矿难……在过去,这是众多煤矿的真实现照。然而如今,一切正在变化,变量则来自于“AI大模型”。         

自ChatGPT带火整个AI赛道后,国内大模型如雨后春笋般出现。据不完全统计,目前国内已有93个大模型公开发布,逐渐形成“百模大战”之势。         

以ChatGPT为代表的通用多模态大模型在问答、写作、作诗方面展现了“惊艳”的一面,但随着市场回归理性,人们不禁要问:大模型除了聊天、创作外,还能干些什么?         

截至目前,已经有不少科技巨头将目光投向B端。华为近期发布了“不作诗,只做事”的盘古大模型3.0,聚焦行业场景、垂直领域;曾经试图对标ChatGPT的百度文心一言也将视线转移至能源、汽车制造等领域;腾讯云也试图做行业大模型解决方案。       

 近日,中国基金报记者实探了位于山东西南部的多处煤矿。其中最深的矿井位于菏泽市巨野县的新巨龙煤矿,其开采深度达到810米至950米,这有如将全球最高楼迪拜哈利法塔向下倒砌。         

而记者在实探的掘进工作面位于地下约850米处,乘坐罐笼(矿井中的升降电梯)下到矿底,足足需要三分钟时间。而在暗无天日的矿下驻足数小时,时间仿佛都在加速。         

值得注意的是,先于记者下矿井的,还有AI大模型。那么,AI大模型如何在地下超800米之初,改变煤矿人的作业方式?如何与矿山开采发生“化学反应”?         

大模型如何在矿井下运行?         

“在我刚毕业的时候,煤矿每年的事故率在5%左右,矿工一直是高风险工种,”山东能源党委常委、副总经理刘健对记者坦言。在他看来,“如何留住人”一直是煤矿企业需要解决的棘手问题,如何让更少的矿工面临高风险,是行业内部重点研究探讨的问题。         

通过何种方式可以让更少的矿工下到矿井中?如何让井下工作时间缩短?         

记者日前实地走进了新巨龙煤矿,该矿是山东能源鲁西矿业旗下主要煤矿之一。新巨龙煤矿于2004年6月份开工建设,2009年底投产运营,矿井核定生产能力600万吨/年,保有资源储量10.8亿吨。据工作人员透露,该矿至少还可开采47年之久。         

记者换上矿工的装备后,乘坐罐笼经过近3分钟下到地下约850米的矿井内。随后,记者又换乘通勤车在如地下迷宫般的隧道内穿梭。         

从出罐笼到抵达掘进工作面,通勤车足足开了约半小时。据新巨龙工作人员介绍,这段车程行驶距离超过10公里。很难想象,在超800深地下,还盘踞着如此庞大的地下网络。而下车后,仍需要步行数百米,才能真正达到掘进工作面(如图),整个过程犹如“地心历险记”。

不过,与想象中不同的是,矿井中并没有出现粉末飞扬的场景,相反是一系列设备井然摆放。整个路程中,仅看到为数不多的几位工作人员作业。同时,每隔一段距离就能看到摄像设备、无线基站等设备。

据新巨龙煤矿副总经理牛永明告诉记者,国内煤矿的煤层普遍较深,开采难度相较于国外难太多,“比如在澳大利亚,多数煤矿是露天矿,完全不需要下地采掘。”         

据他介绍,在深入地下的煤炭采掘过程中,冲击地压是造成煤矿塌陷最主要因素,是需要防范的最大风险。而中国是世界煤炭行业受冲击地压影响最深的国家之一。         

如何化解这一风险?钻孔卸压工程成为冲击地压防治的主要手段。记者在现场也观察到,钻孔机器是掘进工作面所必备的设备。

上述人士介绍,在采煤过程中,岩体应力猛烈释放会导致事故,通过对岩壁打孔产生一定空间,可以令岩壁压力向孔内释放,从而避免向采煤隧道内挤压。因此,在卸压钻孔施工时,人员操作不当,比如深度不够、角度错了等,会影响卸压效果,继而导致安全隐患甚至事故。         

其中,钻孔深度是防冲卸压工程最关键的参数之一。记者在钻孔卸压工作面观察到,钻孔机器上安装着高清摄像设备以及其他相关传感器设备。据牛永明介绍,AI大模型可对钻孔施工情况进行实时监测,可实现钻孔深度自动核验、孔深不足及时提醒,避免漏检、迟检,减少人工核验工作量。

         “过去,我们在检查矿工作业的规范性方面,通过执法记录仪对打钻的全过程录像,录像完成后再带出矿井,再由专人对视频进行核查,也就是说视频现场如果拍了一个半小时,那地面上的人就要看一个半小时,非常耗时耗力,”新巨龙煤矿防冲中心主任贾海滨直言。       

 而大模型下地之后,地上工作人员通过AI大模型视觉识别能力来识别矿工是否打钻达标。据记者随后在地上指挥中心观察,盘古大模型通过前期学习,可以准确识别包括矿工、设备在内的各种井下物件。当矿工操作不规范时,可第一时间作出提醒,极大降低了沟通的时间成本,同时降低了防冲工作风险。

据贾海滨透露,“过去一个钻孔卸压小组需要14-16人左右,而现在仅需要4-5人即可。而在地面,1位地上人员可以监测5、6个工作面场景。”         

他介绍,用了AI识别后,一是增强了实时性,从之前隔天核验到现在现场完成核验,卸压孔深度不足时系统及时提醒,冲击地压监控中心可实时查看井下工程施工情况,发现问题及时整改。二是减少了人工核验工作量,从之前人工审核一个卸压钻孔耗时15分钟到使用AI后人工审核时间降低到3分钟,降低人工核验工作量80%。

大模型赋能产业的缩影         

记者在新巨龙煤矿矿井中所见的景象,也仅仅是大模型运用于采矿工作场景之一。大模型另一个场景是选煤环节,选煤过程中避免粗颗粒物进入介质回收环节,是保证选煤效果的关键因素。       

 记者李楼煤矿看到,为解决“跑粗”发现不及时难题,该矿通过在稀介桶内加装截粗装置和摄像仪,在边缘推理设备上部署AI模型,实时分析截粗装置上的粗颗粒物堆积情况,及时告警提醒,同时推送证据图片,以帮助巡检人员处置,降低工人劳动强度,从而提升选煤效果。

地面监控中心(冯尧摄)         

李楼煤矿同样是山东能源鲁西矿业公司权属矿井之一,这里优质稀缺炼焦煤地质储量达10.8亿吨,可采储量1.78亿吨,年核定生产190万吨。         

另外在鲍店煤矿,该矿也全工艺段采煤机记忆截割、液压支架自动跟机、自动找直、时序自动放煤、煤流智能调速、运输机自动张紧和断链保护等功能保持常态化运行,极大改善了职工作业环境,提高了矿井安全保障水平。         

而上述AI大模型之所以能够“下矿”,要得益于山东能源、云鼎科技依托华为盘古矿山大模型的开发。据华为煤炭军团CEO蒋旺成透露,盘古矿山大模型主要涵盖采煤、掘进、主运、辅运、提升、安监、防冲、洗选、焦化9个专业21个场景应用。         

在细分领域,包括劳动保护用品穿戴规范性监测、人员乘坐架空乘人装置规范性监控、人员误入危险区域及关键岗位行为状态监护、煤矿限员AI监管分析等也均是大模型“发热”的场景。         

那么,大模型何以能在煤炭行业落地?用蒋旺成的话说就是,“智能化程度越低、人员需求越大的行业,往往是AI大模型赋能空间最大的行业。”       

 在煤炭行业中,不少煤矿早期采用传统的人工巡检方式,作业现场多是高温、高危、粉尘、潮湿等恶劣环境,初期采用摄像头远程监控系统,但是需要大量的人力来观看视频发现异常点,且无法完成海量视频异常标注和识别。         在山东能源党委常委、副总经理刘健看来,煤炭行业最应该实现智能化,让机器设备代替人工。他认为,作为企业而言,希望借助大模型视觉能力实现皮带运输、防冲泄压、人员安全、流程合规检查等场景的智能化监测和识别,以大幅降低人力监测工作强度。         

早在2020年2月,国务院八部委联合下发了《关于加快煤矿智能化发展的指导意见》,明确要 求将人工智能、工业互联网、云计算、大数据等新技术与现代煤炭开发利用深度融合。          

而在2022年8月,科技部发布《关于支持建设新一代人工智能示范应用场景的通知》,明确提出促进人工智能与实体经济深度融合和支持以智能矿山等为代表的新一代人工智能示范应用场景工作。         

实际上,政策接连出台也为大模型“下矿”提供支撑。据了解,山东能源在国内外共有85处煤矿。自2021年以来,该公司已投入100多亿元进行矿井智能化建设,建成了133个智能化采掘工作面、24个5G+智能矿山应用场景,9处国家级智能化示范矿井全部通过验收。         

根据规划,“十四五”期间,山东能源还计划投入资金300亿元,建成一批多种类型、不同模式的智能化矿井。“目前集团已建成300多个智能化采煤工作面,智能开采产量占比超过80%。煤矿智能化工作开展以来,累计减少井下作业人员1.2万人,”刘健表示。         

值得一提的是,大模型能够实现“下矿”,合作模式也是不容忽视的环节。早在2022年1月,山东能源、云鼎科技、华为三方联合成立了联合创新中心,三方依托盘古大模型建设了人工智能训练中心,实现了中心训练、边缘推理、云边协同、边用边学。         

换言之,山东能源提供商用场景、华为提供盘古大模型的底座,而云鼎科技基于盘古大模型底座,承接人工智能训练中心场景落地任务。实际上,该模式也给市场提供了一个大模型商用路径的模板。         

在华为方面看来,能够拥有落地场景作为试点平台,对于大模型产业落地至关重要。蒋旺成对记者直言,过去阻碍大模型商用的最大阻力其实是两端存在难以突破的隔膜,即“打造大模型的科技类公司了解大模型,但却对商用行业不甚了解;而商用的行业人士对所处的行业了解,却不懂大模型”。         

头部玩家才能享用大模型?       

随着市场对于大模型的态度日益理性,能否应用落地并且具备商业化能力,逐渐成为检验大模型成功与否的标准。业内普遍认为,不同于传统C端消费互联网,B端产业才是大模型的主战场。         

此前,华为盘古大模型已经明确表示“不作诗、只做事”,而曾经试图对标ChatGPT的百度文心一言也将视线转移至能源、汽车制造等领域;腾讯云宣布做行业大模型解决方案;科大讯飞的星火认知大模型也将包括汽车、教育作为“降落点”。         

浦银国际一份研报认为,行业大模型或成为衍变趋势。该机构认为,未来大模型会进一步分化为通用、专用和特定场景,通用大模型并不能解决很多企业的具体问题,而模型的大小,主要还是取决于企业用户的自身需求,企业的大模型应用需要综合考虑行业专业性、数据安全、持续迭代和综合成本等因素。         

不过,从目前来看,AI大模型在B端商用仍处于在探索阶段的初期,仍面临许多亟待解决的问题。以煤炭为例,当前能够为AI大模型提供商用试验场所的,局限于行业的大型头部企业。         

首先,盘古大模型之所以能够“下矿”,一个不容忽视的前提是山东能源前期投入大量财力物力,已经初步完成其煤矿的“数字化改造”,并能实现数据互通。简而言之,便是数字化改造“第一步”,大模型上路“第二步”。       

 “我们曾经遇到一处煤矿,井下就有超过20种系统,操作起来非常复杂,”华为矿山军团一位相关负责人对记者直言。该人士所提及的矿井中,设备所使用的基本国外厂商系统,均处于封闭状态,互不通信。而且外方供应商非常强势,并不开放数据接口。在这种状况下,AI大模型稳定运行几乎是“不可能完成的任务”。         

在记者采访过程中,新巨龙煤矿方面也侧面印证了上述说法。据新巨龙煤矿相关负责人透露,在数字化转型过程中,曾面临矿山、装备和通信数据编码不统一、通讯接口不兼容、传输协议不开放、系统集成难度大等突出问题。“光打通数据接口,实现数据共享就花了两个月时间,”该人士称。         

而且,据其透露,要实现大模型运行,底层生产系统的基础条件要具备。比如,需要的传感器要齐全,要使用高可靠性的装备;在架构上,按照工业互联网架构来设计信息化系统。         

事实上,仅仅是完成数字化改造,便需要耗费大量财力物力。从国内企业已推进数字化转型所处的阶段来看,大多数企业还处于转型初级阶段,已完成数字化转型的企业为数不多。         

也就是说,目前来看,将大模型实际运用于商业场景,更像是头部玩家的“游戏”。         

在业内看来,煤矿智能化建设本身是一个极为复杂的系统工程,面对复杂的自然环境,想要真正实现智能化非常困难。在记者采访的多位人士看来,要真正全面、系统实现智能化升级,还需从网络、平台、标准、人才培养等多个领域统筹兼顾、协同推进。       

 华为方面也提及,目前AI大模型在行业中落地过程中,各项参数目前缺乏明确统一标准,“比如大模型的判断,精确到什么程度,目前是根据各个试点企业实际需求出发。”该人士也提及,未来需要更多企业加入进来,便会逐渐形成生态,行业标准设定才会进一步规范。不难看出,AI大模型的行业落地长坡厚雪。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

全球首款!澳洲推出AI创造的啤酒!配方设计全AI完成,酿酒师原地失业!这些人未来也要糟

现如今的人工智能越来越先进,特别是ChatGPT出现后,不少人都感到了前所未有的职业危机,

我们的工作岗位要被AI取代,

可能不久之后就会成为现实!

本来还有不少人表示,虽然AI很先进,但是一些需要更多经验或者味觉的工作,冰冷的机器是无法替代的。

只是,

这些人现在已经被打脸了!

澳洲酒厂推出

全球首个AI研发啤酒

新州的酿酒厂Modus Brewing全澳闻名,旗下多款啤酒深受喜爱。

就在最近,Modus Brewing搞了一手花活,它们与Absolutely A.i.来了一次跨界合作,

就想看看AI系统能不能代替酿酒师,

创造出酿酒配方表!

本来酒厂内的酿酒师对这个所谓合作嗤之以鼻,酿酒依靠的是经验和技艺,还有对酒类味道的熟悉度。

AI系统根本没有人类的味觉,怎么可能创造出口味独特的啤酒?

可是,打脸来得太快!

Absolutely A.i.的系统根据Modus Brewing酒厂提供的资料和之前的酿酒习惯,很快就计算出了一个全新的酿酒配方。

Modus Brewing的几名资深酿酒师只是看了看配比,就预测这个口味很不错,甚至可能会引发不少人的追捧。

Modus Brewing也是直接按照这个配方推出了新款啤酒,

啤酒的包装上直接采用了机器人的元素!

对了,这也是AI自动生成的…

这也是全世界范围内首款由人工智能分析配方酿制的啤酒!

最夸张的是,人工智能生成的这个啤酒配方不仅符合Modus Brewing的酿造习惯,而且还整合了澳洲东海岸居民对啤酒的评论和喜欢的啤酒风格。

也就是说,这个配方是根据澳洲东海岸啤酒爱好者的建议全身升级出来的,怪不得专业酿酒师都对这个配方无比佩服。

Modus Brewing的创始人Grant Wearin表示,这款AI创造的啤酒苦味低,芳香浓郁且口感丰富,具有甜美的麦芽味,可以平衡包含葡萄柚、橙子和百香果的浓郁啤酒花香气。

目前这个被命名为Neural Network从配方到包装设计全部由AI包办的啤酒已经推出,全澳洲各个地方都能购买,

而且销量非常惊人!

这说明了什么?我们的口味都被人工智能轻松拿捏了…

这么来看,靠着经验和味觉的酿酒师,也可能被智能系统取代…

人工智能之下

多少人的工作将会不保

啤酒配方,包装设计AI可以一手搞定,而且啤酒反响良好,这导致的后果是,酿酒师可能很快就要原地失业了,因为一切流程都可以由AI进行操控实现智能化。

不仅更新换代更快,而且产量更高,成本也会大大降低…

这也再次引发了人们对AI的恐惧,是不是随着AI的不断发展,很多工作都可以由AI直接取代呢?

这个担忧随着ChatGPT的火爆,也升到了最高点。

工作大量被人工智能替代究竟是好是坏,现在还无法断言,但如果未来很多职业真的被人工智能取代,可能又将是一个新时代的到来。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

80%代码秒生成!AI神器Copilot大升级,百万开发者动嘴编码5年内成真

码农AI神器又升级了!

就在刚刚,Github官宣,Copilot模型升级,5年内80%的代码将自动生成。

GitHub Copilot发布还不到两年, 就已经为100多万的开发者,编写了46%的代码,并提高了55%的编码速度。

这次升级究竟改进了什么呢?

5年,80%代码自动生成

通过模型的改进,以及上下文过滤功能的增强,现在开发人员在写代码的时候可以获得更多量身定做的建议,满足需求。

而且,划重点!个人版和企业版都可以无压力使用。

据官博介绍,改进后的AI模型超越了之前的Codex模型,可以更迅速地为开发人员提供代码上的建议。

新模型由OpenAI、Azure AI和GitHub合作开发,与之前的模型相比,延迟时间缩短了13%。

这意味着,GitHub Copilot为开发人员生成代码建议的速度比以往任何时候都要快,有望大幅提高整体工作效率。

同时,新模型还有更为复杂的上下文过滤功能,能更广泛地考虑开发人员的上下文和使用模式。

这样,它就能更智能地过滤提示和代码建议,从而让开发人员获得针对其需求的建议。

数据显示,代码接受率相对提高了6%,让开发人员能够专注于工作的创造性方面,而不是被乏味的编码任务所困扰。

GitHub Copilot正在升级,改进了人工智能模型并增强了上下文过滤功能,从而为开发人员提供更快、更量身定制的代码建议。

Github就像是第二大脑,能够帮你省去记忆的麻烦。

Github的CEO Thomas Dohmke还曾表示,80%的代码将在短短五年内生成。

他还表示,Copilot 测试版中 40% 的代码都是生成的,这让开发者的速度提升了55%。

新一代生成代码Copilot X

在微软将GPT-4能力集成到Office 365后,GitHub曾官宣发布了,基于GPT-4的新一代代码生成工具Copilot X。

具体来说,Copilot X提供支持的体验有:Copilot Chat;Copilot for Pull Request;Copilot for Docs;Copilot for CLI。

这些新功能都是由OpenAI的GPT-4驱动的。

值得注意的是,由于速度延迟的原因,代码自动补全工具仍基于GitHub的Codex模型上,该模型是在GPT-3上训练的。

此前,微软已经将GPT-4集成到搜索、办公、写代码等各种真正意义上的生产力工具上,属实是拥有了开启第四次科技革命的力量。

资深大数据架构师祝威廉称,Everything powered by AI已经不再遥远:

如果说,OpenAI GPT-4只是个模型完成了从0到1,微软则推动了其商业化直接前进一大步。

这次,Copilot X的发布,直接降维打击上一代Copilot。

就比如,GitHub在Copilot中内嵌一个基于GPT-4的聊天窗口,专注于开发者场景,并集成在VS Code和Visual Studio上。

Copilot不仅可以识别开发者输入的代码内容,报错信息显示,还可以对代码块的用途进行深入分析和解释,生成单元测试。

甚至还可以给出debug的建议。

此外,在Copilot中,你甚至不再需要键盘来编写代码。

只需坐在电脑前,说一句「嘿,GitHub!」,动动嘴皮子编代码就能实现了。

目前,GitHub正在试验GitHub Copilot Voice新功能,一个基于语音的交互系统。

除了编写代码,通过Copilot Voice,你甚至可以完成:代码跳转、控制IDE、代码总结。

GitHub首席执行官Thomas Dohmke曾表示,虽然自动补全代码已经大大提升开发人员的生产力,而全新的Copilot X能将开发人员的生产力提升10倍。

「软件开发的黄金时代已经来到聊天界面。」

工作效率提升55%

早在2月份,GitHub曾发布了个人版和企业版Copilot的重大更新。

简单来说就是,升级之后的GitHub Copilot将会具有更高的代码质量,以及更快的响应速度。

自发布以来,GitHub Copilot已经为超过一百万人开发者提供了更强生产力,帮助他们提高了55%的编码速度。

但早在2022年6月首次推出时,只有27%的开发者会选择使用GitHub Copilot生成的代码。

如今,这一数字已经上升到了46%。甚至在Java中,达到了61%。

研究显示,在使用GitHub Copilot的开发者中,有90%表示可以更快地完成任务,其中73%的人能够更好地保持顺畅并节省精力。

与此同时,高达75%的开发者在使用Copilot时感到更有成就感,并且能够专注于工作。

为了实现这一目标,GitHub做了如下关键技术改进:

– 升级后的AI Codex模型

将Copilot升级为新的OpenAI Codex模型,为代码合成提供了更好的结果。

– 更好的上下文理解

通过一种称为Fill-In-the-Middle(FIM)的新范式,改进了GitHub Copilot给出的代码建议。

这种方法不仅会考虑代码的前缀,还会利用已知的代码后缀,并在中间留出空白让GitHub Copilot来填补。

如此一来,Copilot就有了更多关于预期代码的上下文信息,以及自己应该如何去和程序的其他部分保持一致。

– 轻量级的客户端模型

使用轻量级客户端模型更新了VS Code的GitHub Copilot扩展,从而提高了建议代码的整体接受率。

现在,GitHub Copilot通过使用关于用户上下文的基本信息(例如,上一个建议是否被接受),将不必要的建议减少了4.5%

对标Copilot,谷歌Colab放大招

微软Copilot练练升级后,谷歌也不甘示弱。

5月,谷歌曾宣布,Google Colaboratory(Colab)即将加入全新的AI编码功能。

在PaLM 2的基础上,利用大量高质量代码数据进行微调之后,全新的「文生代码」模型Codey就诞生了。

而Colab的这些新功能,就是由Codey加持的。

Codey代码生成模型支持20多种编码语言,包括Go、谷歌标准SQL、Java、Javascript、Python和Typescript等。

通过实时的代码补全和生成,Codey可以帮助用户更快地完成开发工作,同时提升代码的质量。

最重要的是,这个模型还专门针对Python和Colab的各种功能进行了专门优化。

看得出来谷歌为了各位深度学习应用和Python的开发者的使用体验,真的是很用心了。

微软和谷歌的编码神器,你更钟意哪个?

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

台积电「打脸」英伟达:AI撑不起芯片大盘

进入 2023 年,消费电子产业并没有扭转下行的趋势,所谓「寒冬」还顺势弥漫到了半导体上游,今年第二季度三星电子的营业利润大跌 95.74%,仅为 6000 亿韩元(约为 33.5 亿人民币),其他半导体上游厂商也都不太好过。

而从去年末大火至今的生成式 AI,一举推动了 AI 芯片的需求爆发,价格一路走高,雪花般的订单也从互联网公司飞到芯片设计厂商,再飞到芯片制造厂商,一度被视为扭转本轮半导体下行周期的关键。

然而台积电还是对 AI 推动芯片需求激增的说法泼了一盆冷水。

7 月 20 日,半导体代工龙头台积电发布了截至 6 月 30 日的第二季度财报,尽管业绩表现超出了分析师预期,但营业收入还是同比下滑 10%至 4808.4 亿新台币(约合 1115.55 亿元人民币)净利润则下滑了 23%,降至 1818 亿新台币(约合 421.78 亿元人民币)。

四年来,台积电净利润遭遇了首次下滑。

更重要的是,即便作为站在英伟达和 AMD 背后的最大赢家,台积电也不看好 AI 在短期内带来的芯片需求变化,与英伟达描绘的前景截然相反,台积电不认为在 AI 能在今年下半年驱动半导体需求恢复增长,甚至是在几年内都不会。

消费电子继续跌

AI 不过初长成

就在前段时间,各家市场研究公司陆续都发布了第二季度全球智能手机和 PC 市场的报告。其中 Calalys 的报告显示,全球智能手机出货量同比下滑 11%,按此计算总出货量应该在 2.55 亿台左右;IDC 的报告则显示,全球个人电脑出货量同比下滑 13.4%,掉到了 6160 万台。

好消息是,两大消费电子市场的跌幅没有进一步扩大。不过出货量的下降规模依然相当可观,单单上季度就又少出货了 3157 万台智能手机和 280 万台 PC,可想而知对上游供应链的冲击。

核心的问题也没有得到解决,一是渠道和组件的高库存,二是需求的持续疲软。业绩说明会上,台积电首席财务官黄仁昭指出,下游库存的消化速度比预想中慢,虽然看到了部分客户的生意已经复苏,但在高通胀、高利率的市场背景下,客户的拉货趋于保守,下半年的需求增长会比以往都要低。

最有力的证明是,针对下半年的风险,台积电将全年营收预期从 1%-6%的下滑调整为了 10%。台积电总裁魏哲家明确表示,AI 拉动的需求不足以弥补库存调整与经济前景不佳的干扰,产值与 IC 设计客戶产值都比先前进一步下调。

要知道,不管是 AMD 最近发布的 MI300X 与 MI300A,还是所有人都在抢购的英伟达 A100/H10、A800/H800(国内特供),都严重依赖于台积电的 CoWoS 先进封装产能。

AMD CEO 苏姿丰近期甚至在媒体采访中表示,MI300 系列芯片「没有台积电是做不到的」。而前不久,英伟达 CEO 黄仁勋也拜访了台积电,核心同样是确保足够的 CoWoS 产能。

但就算 Meta、字节跳动等互联网巨头,过去半年至少投入了上百亿美元购买英伟达 GPU 用于大模型的训练和推理,英伟达也在不断向台积电追加订单,面向 AI 训练和推理的 AI 芯片目前仍然仅占台积电总营收的 6%。

且台积电认为,未来五年 AI 芯片的营收占比预计将增加到 10%。背后的潜台词是,台积电也不太看好未来数年 AI 的爆发式增长。

AI 改变世界

可能还要再等等

今年年初,ChatGPT 席卷全球,随后更是不断发酵,各种大模型、失业、应用……各种消息的充斥,多少砸得人有些头晕眼涨,难免让人误以为:AI 改变世界,只在一夜之间。

等到网络分析公司 Similarweb 指出,ChatGPT 的全球访问量再 6 月出现了首次环比下滑,降幅更是达到 9.7%,很多人才稍微冷静下来,重新审视 AI 改变世界的进程。

这一轮生成式 AI 的进展确实相当快速,从 ChatGPT 的横空出世,到各家大模型的酝酿与发布,再到 OpenAI 和微软率先主导的商业化。

上周,微软正式公布了 Microsoft 365 Copilot 的定价—— 30 美元/月。Microsoft 365 Copilot 是微软与 OpenAI 合作开发的可与 Office 软件配合使用的 AI 工具。微软曾表示,Microsoft 365 Copilot 是其对未来工作的愿景,通过集成 GPT-4 支持,可使用让用户自然语言文本提示自动生成 Office 内容。

但即使是最被看好的 ChatGPT 和 Microsoft 365 Copilot,也尚未成熟。一方面是由于 AI 生成内容的不可靠性,包括了语料追溯和「幻觉」等底层问题。

另一方面则是在使用交互上。虽然自然语言的输入方式让交互方式变得前所未有地自然,但提示词(Prompt)的门槛至少在眼下还很高,绝大部分人难以掌握甚至理解。不仅是用户使用频率不高,涌现出的各种 AI 应用于普通用户而言,使用场景也不明确。客观上,这些都造成了生成式 AI 的实际使用率不高。

当然,AI 在可见的未来,仍然会是计算世界最大的机会。微软创始人比尔·盖茨曾言:「我们总是高估未来两年的变化,低估未来十年的变革。」

生成式 AI

也绕不过新技术的规律

新技术的扩散很少是匀速进行的。市场研究机构 Gartner 早在上世纪 90 年代就提出了技术成熟度曲线,指出大多数技术都会不可避免地经历萌芽期、过热期、低谷期、复苏期以及成熟期。

起初,媒体的炒作总是让人对实际取得的进步产生了过高的预期,技术开发者和企业必须有一点耐心和毅力,并保持清醒的头脑和健康的心态。然后,等技术达到一个转折点,通常需要汇集几项不同的开发成果,并将把它们整合在一起,使得产品体验实现质的变化。

以智能手机为例,初代 iPhone 面世之时,移动电话和手持个人数字助理,也就是 PDA (又称掌上电脑)已经发展了十年。直到 iPhone 在触摸屏上取得的技术进步,以及简约的工业和人机交互设计,最终才带来了一个智能手机的时代。

黄仁勋将 ChatGPT 比作 AI 的 iPhone 时刻,然而他没有说出的是,智能手机要引发真正的狂潮,还要等到 App Store 面世两年后的 iPhone 4,彼时苹果 CEO 乔布斯喊出的口号是:This changes everything.Again.(再一次,改变一切。)

AI 既有相似之处,又有不同之处。ChatGPT 之后,所有人看见 AI 到达了一个关键的节点——机器已经能以自然语言与人类进行顺畅的交流。但显然还不够,先抛开人工智能对人类智能的替代问题不谈,至少一个满嘴「胡话」的 AI 很难获得信任,最终的应用场景也很难扩展、落地。

但所有技术都不是一蹴而成的,生成式 AI 也逃不开这条规律。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

MOBA发布全新AI无接触视觉称重系统

MOBA

我们深耕蛋品行业长达75年,对客户面临的挑战有着深刻的了解。我们拥有多项突破性的创新技术,它们能够提高 A 级禽蛋的比例和禽蛋的盈利能力,同时简化清洗程序,降低禽蛋分级站的劳动力需求。这些特点都可以通过 Omnia PX系列分级机 + 人工智能裂纹和脏破蛋检测系统和人工视觉称重系统来实现!这些创新技术无需直接接触鸡蛋,它将尽可能降低交叉污染的几率,并且简化了清洗程序,因此提高了食品安全性。人工视觉称重系统专为水洗蛋市场而设计,将率先在北美市场隆重亮相。

AI全面赋能蛋品分级

禽蛋生产商的工作重点是向不断增长的人口供应健康美味的禽蛋。然而越来越多的禽蛋需要进行分级,而寻找具备适当技能的合适员工对于禽蛋生产商而言变得越来越困难。我们了解客户面临的公司内部困难:期望优化业务,同时优先考虑食品安全,并聘用能够尽可能提高设备性能的合格员工。通过采取必要的措施来优化您的禽蛋分级设备并提高效率、产品质量和安全性,帮助您提高禽蛋的价值。


我们通过探索新的视觉系统与人工智能(也称为“AI”)相结合的潜力,实现了这些功能。我们全球客户超过 5,000个,我们的系统处理了惊人的 10 亿枚禽蛋,因此我们有独特的视角来充分利用 AI 赋能的全部学习能力。

AI视觉称重系统

通过大量研究和开发,我们成功地开发了一种使用 AI 技术给禽蛋称重的创新方法。通过使用包含数千张禽蛋图像及其相应重量信息的庞大数据库,对我们的 AI 系统进行训练,该模型现已能够识别每枚禽蛋特有的视觉特征,并将之与其特定重量相关联。一旦 AI 模型经过训练,它就可以通过分析其图像,无缝地预测新蛋的重量。通过物理接触进行禽蛋检测的时代已一去不复返 — 禽蛋分级机只需捕获每枚禽蛋的多张图像,借助我们先进的技术,即可提供准确的重量估计值。

现在,MOBA可以为 Omnia PX530型 和 PX700型禽蛋分级机配置AI 称重系统、AI禽蛋裂纹检测系统和AI脏破蛋检测系统。此 PX+ 提供了综合解决方案,无需直接接触鸡蛋,操作简单,简化了清洗程序,并尽量减少了维护工作量。PX+ 凭借其可靠的性能,使我们的客户能够集中精力提高其业务成果。

 图01   AI 禽蛋裂纹检测系统

 图02    AI 禽蛋脏破蛋检测系统

水洗蛋市场

对于是否需要清洗禽蛋,各地区的要求不尽相同:有些地区例如美国禽蛋必须清洗,而另一些地区例如欧盟则制定了相关法规,明令禁止这种做法。考虑到满足卫生要求和遵守各种清洗程序的重要性,我们战略性地选择北美市场作为 PX+ 的首发目的地,因为这是一个水洗蛋市场。继在北美市场成功推出该系统之后,我们计划将我们的业务范围扩大到其他水洗蛋市场地区。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

全球人工智能AI的格局

来源:沪城金服

引言:今年年初,ChatGPT成为人们热议的话题,人工智能AI行业也进入了全新领域。

2015年以前,人工智能行业以小模型为主,只能完成垂直领域的分析任务,无法完成生成类任务。发展至今,人工智能行业出现了大模型,能够处理复杂多样的语言问题,在文本理解、生成、翻译、摘要、问答等方面实现了突破。

这极大地推动了人工智能AI行业的发展,并打破了该行业对未来的想象空间。人工智能AI对企业、对国家而言,已经属于一种战略部署。  

全球AI环境

目前,全球已有多个国家在人工智能AI领域展开竞争。

7月7日,中国科学技术信息研究所研制的《2022全球人工智能创新指数报告》显示:当前全球人工智能发展总格局是由中美两国引领、多国呈梯次分布的格局。

按照2022年人工智能创新指数得分排名,可将46个参评国家分为四大梯队。

第一梯队:国家评分在50分以上,只有美国和中国。美国作为科技大国,拥有众多领先技术以及顶尖的研究机构,是人工智能AI的重要发源地,同时也保持着领先水平。中国在国家战略和大力投资的背景下,成为人工智能AI行业的重要力量。

第二梯队:国家评分在35—50分之间,包含英国、德国、新加坡等11个国家。

第三梯队:国家评分在20—35分之间,包含丹麦、芬兰等12个国家。

第四梯队:国家评分在20分以下,包含马耳他、捷克等21个国家。

实际上,只依靠评分来判断某个国家的创新能力是较为片面的,因为不同国家在人工智能AI行业中有不同的优劣势。例如:美国在基础研究、创新能力、人才培养等方面更为突出;中国在用场景、数据规模、市场潜力等方面较为领先;欧盟在伦理、法律、标准等方面较为专业;其他国家在人工智能AI行业的细分领域中有着突出表现。

在ChatGPT爆火之前,各个国家就已经在人工智能AI行业中不断积累和发展,努力形成完整的AI产业链,在全球AI浪潮中拥有更强的竞争实力。

从参与数量来看,2022年参评国家的人工智能企业总数同比增长25%,人工智能从业人口总数同比增长了53%,两者的同比增幅得到大幅扩大。

从基础建设数据中心的数量来看,近三年参评国家托管型数据中心总量持续增长,有三分之一国家比2020年增长了超过10%。

从政策规划和治理指标来看,2022年几乎所有参评国家的完善程度都得到了提升。

从人工智能相关论文来看,论文总数已经实现翻倍增长,从2010年的20万篇增长至2021年的将近50万篇。以上数据都体现出,全球各国对人工智能AI行业已经十分重视。

算力以芯片市场

在人工智能AI成为大家关注的行业后,算力也得到了快速发展,成为涨得最好的板块之一。

算力是人工智能AI环境的基础建设,对算力的需求远大于AI产业链中的其他板块,所以发展算力已经成为人工智能AI行业的重要基石。据OpenAI统计显示:AI训练任务中的算力增长——每3.5个月翻一倍,已经超越了摩尔定律——每18个月翻一倍。

中国信通院《中国算力发展指数白皮书》测算:2021 年全球算力规模超过615EFLOPS,同比增速为44%左右,后续几年则会迎来算力引爆时代。预测2030年全球算力规模有望达56ZFLOPS,2022—2030年复合增长率达65%。

更值得一提的是,各国的算力布局和GDP呈正相关关系。据IDC报告显示:计算力指数平均每提高1个点,数字经济和GDP将分别增长3.3‰和1.8‰。2021年,全球算力规模前20的国家中有17个国家是全球排名前20的经济体。其中,美国、中国、欧洲、日本在全球算力规模中的份额分别为34%、33%、14%和5%。

算力的最关键的竞争点在于芯片。

传统的CPU计算难以满足愈发庞大的数据处理,辅助CPU也就应运而生。辅助CPU能够能够提供数据的协助处理,当下主流的类型包括通用GPU(GPGPU)、FPGA、ASIC 等。

GPU是图形处理器,具有大量的并行计算能力,能够快速处理大量数据;FPGA是现场可编程门阵列,具有灵活性和可编程性,非常适合开发新的AI算法;ASIC是专用集成电路,具有高性能和低功耗的特点,非常适合部署在边缘设备上的AI应用。

2022年,全球CPU市场总规模约为249亿美元,Intel和AMD占据市场的主要份额。其中,Intel占领市场60%以上的份额,AMD的市场份额在不断提升。2022年,全球GPU市场总规模约为450 亿美元(含GPGPU),英伟达和AMD几乎占据市场中全部份额,Intel的占比极小。

大模型时代近段时间,人工智能AI行业新推出了不少模型。2022年11月,OpenAI发布了聊天机器人ChatGPT,成为人工智能AI行业的首个大模型。2023年2月,Meta AI在其官网公开发布了LLaMA大型语言模型。2023年3月,百度发布了文心大模型。

2023年5月,Google发布新一代大语言模型PaLM2。随后,商汤、阿里云、科大讯飞、华为等陆续发布了各自的大模型,几乎所有的科技平台都参与其中,人工智能AI行业瞬间百花齐放。人工智能AI大模型是集资本密集、人才密集、数据密集的产业,千亿级的参数模型训练一次就要花费超1200万美元的成本。这不仅是技术之战,同样也是平台之战。

在科技不断发展下,是否拥有人工智能AI大模型或将成为衡量企业甚至是国家综合实力的重要条件之一。人工智能AI大模型逐渐成熟后,相关的下游产业都将会得到快速发展,终端应用的研发将会成为人工智能AI时代的下一个阶段。人工智能AI已经经历了产业孵化、算力基础建设、底层大模型研发等多个过程,未来不论如何发展、不论以何种方式存在,只要掌握了最底层的东西,就能掌握核心。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

制造业人工智能8大应用场景

来源:中国工业报

人工智能技术和产品经过过去几年的实践检验,目前应用较为普遍,推动着人工智能与各行各业加速融合。从技术层面来看,业界广泛认为,人工智能的核心能力可以分为三个层面,分别是计算智能、感知智能、认知智能。

1、计算智能

计算智能,是指机器具备超强的存储能力和超快的计算能力,可以基于海量数据进行深度学习,利用历史经验指导当前环境。随着计算力的不断发展,储存手段的不断升级,计算智能可以说已经实现。例如,AlphaGo利用增强学习技术完胜世界围棋冠军;电商平台基于对用户购买习惯的深度学习,进行个性化商品推荐等。

2、感知智能

感知智能,是指使机器具备视觉、听觉、触觉等感知能力,可以将非结构化的数据结构化,并用人类的沟通方式与用户互动。随着各类技术发展,更多非结构化数据的价值被重视和挖掘,语音、图像、视频、触点等感知智能快速发展。无人驾驶汽车、波士顿动力机器人等就运用了感知智能,通过各种传感器,感知周围环境并进行处理,从而有效指导其运行。

3、认知智能

认知智能,是指机器像人一样,有理解能力、归纳能力、推理能力,有运用知识的能力,相较于计算智能和感知智能更为复杂。目前,认知智能技术还在研究探索阶段,如在公共安全领域,对犯罪者的微观行为和宏观行为的特征提取和模式分析,开发犯罪预测、资金穿透、城市犯罪演化模拟等人工智能模型和系统;在金融行业,用于识别可疑交易、预测宏观经济波动等。要将认知智能推入发展的快车道,还有很长一段路要走。

目前,制造企业中应用的人工智能技术,主要围绕在智能语音交互产品、人脸识别、图像识别、图像搜索、声纹识别、文字识别、机器翻译、机器学习、大数据计算、数据可视化等方面。下文总结了制造业中常用的八大人工智能应用场景。

场景一:智能分拣

制造业上有许多需要分拣的作业,如果采用人工作业,速度缓慢且成本高,而且还需要提供适宜的工作温度环境。如果采用工业机器人进行智能分拣,可以大幅降低成本,提高速度。

以分拣零件为例。需要分拣的零件通常并没有被整齐摆放,机器人虽然有摄像头可以看到零件,但却不知道如何把零件成功地拣起来。在这种情况下,利用机器学习技术,先让机器人随机进行一次分拣动作,然后告诉它这次动作是成功分拣到零件还是抓空了,经过多次训练之后,机器人就会知道按照怎样的顺序来分拣才有更高的成功率;分拣时夹哪个位置会有更高的捡起成功率;知道按照怎样的顺序分拣,成功率会更高。经过几个小时的学习,机器人的分拣成功率可以达到90%,和熟练工人的水平相当。

场景二:设备健康管理

基于对设备运行数据的实时监测,利用特征分析和机器学习技术,一方面可以在事故发生前进行设备的故障预测,减少非计划性停机。另一方面,面对设备的突发故障,能够迅速进行故障诊断,定位故障原因并提供相应的解决方案。
以数控机床为例,用机器学习算法模型和智能传感器等技术手段监测加工过程中的切削刀、主轴和进给电机的功率、电流、电压等信息,辩识出刀具的受力、磨损、破损状态及机床加工的稳定性状态,并根据这些状态实时调整加工参数(主轴转速、进给速度)和加工指令,预判何时需要换刀,以提高加工精度、缩短产线停工时间并提高设备运行的安全性。

基于机器视觉的表面缺陷检测应用在制造业已经较为常见。利用机器视觉可以在环境频繁变化的条件下,以毫秒为单位快速识别出产品表面更微小、更复杂的产品缺陷,并进行分类,如检测产品表面是否有污染物、表面损伤、裂缝等。目前已有工业智能企业将深度学习与3D显微镜结合,将缺陷检测精度提高到纳米级。对于检测出的有缺陷的产品,系统可以自动做可修复判定,并规划修复路径及方法,再由设备执行修复动作。

例如,PVC管材是最常用的建筑材料之一,消耗量巨大,在生产包装过程中容易存在表面划伤、凹坑、水纹、麻面等诸多类型的缺陷,消耗大量的人力进行检测。采用表面缺陷视觉自动检测后,通过面积、尺寸最小值、最大值设定,自动进行管材表面杂质检测,最小检测精度为0.15mm²,检出率大于99%;通过划伤长度、宽度的最小值、最大值设定,自动进行管材表面划伤检测,最小检测精度为0.06mm,检出率大于99%;通过褶皱长度、宽度的最小值、最大值、片段长度、色差阈值设定,自动进行管材表面褶皱检测,最小检测精度为10mm,检出率大于95%。

场景四:基于声纹的产品质量检测与故障判断

利用声纹识别技术实现异音的自动检测,发现不良品,并比对声纹数据库进行故障判断。例如,从2018年年末开始,佛吉亚(无锡)工厂与集团大数据科学家团队展开全面合作,致力于将AI技术应用于座椅调角器的NVH性能评判(震动噪声测试)。2019年,佛吉亚(无锡)工厂将AI技术应用到调角器异音检测中,实现从信号采集、数据存储、数据分析到自我学习全过程的自动化,检测效率及准确性远超传统人工检测。随着基于AI(人工智能)技术的噪声检测系统在无锡工厂投入应用,人员数量已经从38人下降至3人,同时,质量控制能力显著提高,年经济效益高达450万元。

场景五:智能决策

制造企业在产品质量、运营管理、能耗管理和刀具管理等方面,可以应用机器学习等人工智能技术,结合大数据分析,优化调度方式,提升企业决策能力。
例如,一汽解放无锡柴油机厂的智能生产管理系统,具有异常和生产调度数据采集、基于决策树的异常原因诊断、基于回归分析的设备停机时间预测、基于机器学习的调度决策优化等功能,通过将历史调度决策过程数据和调度执行后的实际生产性能指标作为训练数据集,采用神经网络算法,对调度决策评价算法的参数进行调优,保证调度决策符合生产实际需求。

场景六:数字孪生

数字孪生是客观事物在虚拟世界的镜像。创建数字孪生的过程,集成了人工智能、机器学习和传感器数据,以建立一个可以实时更新、现场感极强的“真实”模型,用来支撑物理产品生命周期各项活动的决策。在完成对数字孪生对象的降阶建模方面,可以把复杂性和非线性模型放到神经网络中,借助深度学习建立一个有限的目标,基于这个有限目标,进行降阶建模。
例如,在传统模式下,一个冷热水管的出水口流体及热仿真,用16核的服务器每次运算需要57个小时,进行降阶建模之后,每次运算只需要几分钟。

场景七:创成式设计

创成式设计(Generative Design)是一个人机交互、自我创新的过程。工程师在进行产品设计时,只需要在系统指引下,设置期望的参数及性能等约束条件,如材料、重量、体积等,结合人工智能算法,就能根据设计者的意图自动生成成百上千种可行性方案,然后自行进行综合对比,筛选出最优的设计方案推送给设计者进行最后的决策。
创成式设计已经成为一个新的交叉学科,与计算机和人工智能技术进行深度结合,将先进的算法和技术应用到设计中来。得到广泛应用的创成式算法包括:参数化系统、形状语法、L-系统、元胞自动机、拓扑优化算法、进化系统和遗传算法等。

场景八:需求预测,供应链优化

以人工智能技术为基础,建立精准的需求预测模型,实现企业的销量预测、维修备料预测,作出以需求导向的决策。同时,通过对外部数据的分析,基于需求预测,制定库存补货策略,以及供应商评估、零部件选型等。

例如,为了务实控制生产管理成本,美国本田公司希望能够掌握客户未来的需求会在何时发生,因此将1200个经销商的客户销售与维修资料建立预测模型,推算未来几年内车辆回到经销商维修的数量,这些资讯进一步转为各项零件预先准备的指标。该转变让美国本田已做到预测准确度高达99%,并大大降低客诉时间。

结语目前,随着越来越多的企业、高校、开源组织进入人工智能领域,大批成功的人工智能开源软件和平台不断涌入,人工智能迎来前所未有的爆发期。但与金融等行业相比,虽然人工智能在制造业的应用场景不少,却并不突出,甚至可以说发展较慢。

究其原因,主要包括以下三大方面:

◉ 一是由于制造环节数据的采集、利用、开发都有较大难度,加之企业的数据库也以私有为主、数据规模有限,缺乏优质的机器学习样本,制约了机器的自主学习过程。

◉ 二是不同的制造行业之间存在差异,对于人工智能解决方案的复杂性和定制化要求高。

◉ 三是不同的行业内缺乏能够引领人工智能与制造业深度融合发展趋势的龙头企业。
解决以上三大问题,人工智能技术才能更好地应用于制造业。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

AI大模型会如何颠覆手机?

来源:阿尔法工场研究院

将大模型变小,再塞进手机,会给人们的生活带来怎样的影响?

最近,荣耀成为了国内率先的破局者。

7月12日,荣耀了发布一款“革命性”的大模型手机Magic V2。成为全球首个实现大模型与手机系统融合的厂商。

在荣耀的宣传中,更加个性化、更注重隐私,并且具备多模态功能的大模型,将会给用户带来全新的体验。

实际上,不只是荣耀,身为手机芯片龙头企业的高通,也在近期发布了自身的大模型。

在7月初召开的上海WAIC上,人们看到搭载高通第二代骁龙8芯片的安卓手机直接运行参数规模超过10亿的Stable Diffusion,且只需要15秒左右就可以出图。

更重要的是,这样的运行,是完全本地化的,只依赖手机本身的算力。

从GPT-3.5到GPT-4.0,曾经需要高昂算力,或者只能跑在云端的AI大模型,也开始在智能终端设备中落地。

不过,在兴奋之余,冷静的人总不免会问:我真的需要一个在部署在手机大模型么?还是说这只是手机厂商为挽救疲软的市场而制造的噱头?

01 打破APP的壁垒

在人们讨论“大模型手机”之前,一个不可忽略的事实是:当今的各类大模型AI,如chatGPT、新必应等,实际上早已推出了各自的手机版APP。

通过这一个个APP,在手机上运行大模型,早已不是什么难事,且与本地部署的方式相比,这些调用云端算力的APP,并不会对手机配置造成额外负担。

那既然如此,那人们为什么还要费尽心机地开发一个专用的“手机版”大模型呢?

对于这个问题,谷歌之前的做法似乎给出了一个可能的答案。

今年5月,在ChatGPT 3.5发布半年后,Google终于公布了全新一代大语言模型PaLM2,用以对抗ChatGPT。作为一种差异化竞争,PaLM2可以被部署在智能手机上。

当时,PaLM2包含四个大模型,按照参数规模从大到小,分别命名为:独角兽(Unicorn)、野牛(Bison)、水獭(Otter)和壁虎(Gecko)。

只有参数最小的“壁虎”可以在手机上运行,Google称,它的运行速度足够快,不联网也能正常工作。

但问题是:人们为什么要以牺牲参数、性能为代价,在手机上使用这样一个“缩水版”的小模型呢?

一个最重要的原因是:与那些以APP形态出现在手机上的大模型相比,一个融入手机系统中的大模型,可以打破各应用之间的壁垒,让其他App也自带大模型特性。

例如,融入手机中壁虎(Gecko),可以通过Gmail,实现自动写邮件的功能。

用户只需在Gmail的“Help me write”(帮我写)中输入需求,它就会结合此前邮件中的信息,写出完整的邮件。

通过这样与手机系统深入融合的大模型,人们不仅可以实现AI对各类APP的赋能,甚至还能将大模型作为通用接口,像“胶水”一样,将各类APP的能力实现组合,实现更多具有想象力的扩展。

例如,倘若人们在一个陌生的地点出行,想寻找某个罕见、偏僻,在地图上并不显眼的位置,这时,手机上的大模型,就可以调用语音+识图+导航的多模态功能,十分接地气地告诉你:“在前面的兰州拉面往左拐,看到城市便捷酒店后再右拐300米”,而不是简单地说出“直行”、“右拐”等机械的回答。

然而,要实现这样的组合,一个难以绕开的问题,就是算力。

同样的,开始在手机上部署大模型的高通,也意识到了这个问题。在高通日前发布的《混合AI是AI的未来》技术白皮书中,首次提出了混合AI架构的概念。

而这一概念,简而言之,就是让AI能够在云端和终端侧进行分布式处理,并根据不同的模型和需求灵活分配负载。

02 改造现实的肢体

也许有人认为,与在手机上部署大模型的做法相比,在云端进行计算的方法,才是既省力又划算的。

然而,实际上随着日活用户数量及其使用频率的增长,云端推理的成本会显著增加,而这样的高成本,也会让生成式AI的规模化扩展陷入瓶颈。

毕竟,单个AI超算的服务器带宽,以及消耗的电力,终归是有上限的,而用户的增长却并没有一个固定的上限。

这就是为什么混合AI架构,即在云端和终端侧进行分布式处理的AI,会成为AI的未来趋势,因为它能够利用终端侧的计算能力,降低云端推理的依赖和成本。

而在混合A架构的基础上,高通还提到,为实现生成式AI的规模化扩展,AI处理的重心正在向边缘转移。

也就是说,将来会有越来越多的AI数据,会在手机、摄像头、传感器等终端侧进行处理。

那这对大模型的发展来说意味着什么?

截至目前为止,大部分大模型所能处理的任务,仍旧停留在文字生成、绘制图片、编写代码这些工作上。

这样的任务,本质上都是属于出不了办公室的“案头工作”。

而AI如果要真正地走进社会,为更多的行业、群体带来改变,而不仅仅是一个存在于网页中的“秘书”,那它就必须具有改造现实世界的“肢体”。

而这样的“肢体”,正是一个个嵌入各个行业的边缘端设备。

举例来说,在医疗领域,AI可以通过智能摄像头,评估帕金森患者的状态;

在工业行业,边缘化的AI可以提高生产过程的智能化和自动化,高效地完成零部件瑕疵检测等任务。

在农业领域,边缘化的AI可以通过智能传感器或无人机,实现对农作物的精准种植和管理,如实现农业病虫害识别、农作物品质评估等任务。

所有这一切,都是仅存在于网页中的大模型所无法完成的。

也正因如此,大模型“边缘化”所带来的显著后果,就是AI横向应用范围的极大扩展。

而随着边缘化的到来,联邦计算等与之匹配的模型训练方式,也将打破原本数据中心化的格局。

因为到了那时,数据并不总是在某一个云端服务器完成计算,而是由多个参与方在本地训练机器学习模型,之后再将模型参数或梯度上传到中心服务器进行聚合。

但诡异的是,依据科技行业发展的逻辑,这样一种去中心化的、可以实现跨行业或跨领域数据共享的技术,非但不会弱化原有的垄断行为,甚至还会进一步将其强化。

03 新巨头的崛起

在前网络时代,人们认为个人网站可以消解大传统媒体的信息垄断,但后来互联网霸主的规模,早已传统媒体的市值的天花板。

如果将这些科技巨头的市值,换算成国家的GDP,那么在2022年,微软的市值就超过了五常之一的俄罗斯(1.7万亿),全球能与之匹敌的经济体屈指可数。

究其原因,是因为任何“技术平权”的进行,在让科技变得更加低廉化、平民化的同时,都会反向地催生出一批技术壁垒更高,集中性更强的超级巨头。

因为正是有了这些“高壁垒”的技术进行支撑,巨头们的规模扩张才成为可能。

例如Meta正是通过一系列数据、算法的优势,才能对众多用户投其所好,并构筑了Facebook和Twitter等庞大的社交帝国。

而英伟达也正是通过自身核心的GPU技术,和壁垒颇高的CUDA生态,才让今天的大模型得以完成海量的计算,才得以让AI成为人人触手可及的技术。

而同样的,当混合计算的AI,通过云端与终端侧相结合的方式,降低了大模型的推理的成本后,其造成的“技术平权”,至少会造就两个方向上的巨头。

其一,就是边缘化芯片的提供者。

因为芯片层的AI运算处理能力,是AI落地终端的必要条件。

虽然在边缘化时代,AI的算力场景是多样化的,例如工业、医疗、娱乐等,但其中最重要的“七寸”,仍然是在用户量最多的手机端。

谁若是能围绕手机端的大模型,形成一套从设计、生产、到软件生态一体化的完整体系,谁就将成为新一代的巨头。

在这方面,身为行业龙头的高通,早已开始了提前布局。

目前,搭载骁龙平台的已发布XR终端已经超过65款,其中Meta、PICO等头部厂商的旗舰产品均采用的是高通芯片。

第二个方向的巨头,就是能为行业提供全套解决方案的玩家。

毕竟AI在终端侧的落地,需要的不仅是硬件,还有软件端的优化。

在同样的硬件基础上,谁的AI引擎能比其他竞品具有更高的效能,能更快地完成计算,谁就将在软件栈方面更具优势。

而要想实现这点,就必须在大模型的量化、压缩、条件计算、神经网络架构搜索和编译方面进行突破,在不牺牲太多精度的前提下对AI模型进行缩减。

因此,谁能在大模型的压缩、小型化技术上取得突破,谁就能率先构建起自身基于终端的软件生态。

综上所述,大模型在手机端的落地,不仅仅是AI真正具备“肢体”,进入人类生活的开始,也是行业发生颠覆,新老巨头进行更替的时刻。

在这样的时代,变革的风暴远比我们想象的要猛烈。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

亚马逊吸引了数千人尝试其人工智能服务,与微软、谷歌竞争

近日,亚马逊的一名高管表示,该公司的云部门吸引了数千名客户试用其人工智能服务,在人工智能的一个关键领域与微软和谷歌展开竞争。

亚马逊还在周三(7月26日)宣布了新的人工智能工具,包括一个建立更多对话式客户服务代理的项目、从初创公司Cohere获得技术的途径,以及一个医疗保健系统,用于在患者就诊后生成临床笔记。

索尼公司副总裁斯瓦米·西瓦苏布拉马尼安说,包括索尼、瑞安航空和太阳人寿在内的多家公司已经试用了亚马逊人工智能服务,该公司今年4月宣布推出这项服务,让企业可以用一系列人工智能模型创建应用程序。这种生成技术可以根据需要生成新的文本、图像和其他内容。

“我们的使命是让每一家公司都成为人工智能公司,”西瓦苏布拉马尼安在一次采访中说。

亚马逊人工智能领域的踏足,与谷歌和微软并驾齐驱,且都是云计算的竞争对手。它们开发或销售人工智能,引起了公众的极大关注。微软已经投资了OpenAI,这家初创公司创建了ChatGPT和人工智能模型GPT-4。

亚马逊披露了数千名用户的信息,激发更多的用户可以试用。这些用户此前未被报道。

亚马逊希望提供比同行更广泛的人工智能模型来赢得业务,包括从初创公司Anthropic和Stability AI获得更新的技术。亚马逊表示,亚马逊作为营收最大的云服务提供商,是具有优势的,亚马逊已经托管了无数客户的数据。

亚马逊人工智能预计将很快向所有客户开放。

工业界一直在更广泛地应对人工智能的成本问题。微软周二公布了至少自2016财年以来的最高季度资本支出,该公司正在建设数据中心来支持人工智能,并与其它云公司争夺英伟达的关键芯片。

当被问及亚马逊是否给了那些有着巨大人工智能雄心的企业一个获取芯片的最后期限时,西瓦苏布拉马尼安说,“我们正在与他们合作,以确保我们了解他们的升级计划”。与此同时,亚马逊还扩大了对基于Nvidia芯片的人工智能培训技术的使用范围,该公司宣称这种技术更有效。

这家云服务提供商还为亚马逊Basketime提供了代理预览服务。亚马逊Basketime让企业可以创建聊天机器人来执行任务,并根据自己的专有数据提供更个性化的答案。

航空公司可以建立一个虚拟代理,根据客户的价格、目的地和座位要求,为旅行者预订航班。这类代理的商业潜力在硅谷引起了不小的反响。

作为人工智能推广的一部分,该公司专门向医疗保健行业发出了呼吁。它宣布推出一项名为AWS HealthScribe的服务,让软件供应商开发应用程序来转录和分析医生和患者之间的对话。

两家公司表示,3M旗下的一个部门计划利用这一点加快临床记录的速度。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

讯飞“AI+智能家居”行业创新Workshop在深圳成功举办

7月20日,讯飞【AI+智能家居】行业创新Workshop在深圳成功举办。本次会议,讯飞聚焦“AI赋能数字人居空间”,展示了在以场景为导向,全面布局家居空间交互AI技术下现阶段的三大成果:星火大模型已成功落地赋能地产销售助手,之后将持续推动家庭助手升级;联合生态完成“MORFEI新一代语音面板技术方案”开发落地;与中海携手研发的“离线自由说”、“方言自由说”课题实现产品批量化落地。
然而面对当今寒意阵阵的市场环境和日益内卷的行业现状,讯飞深知独木难成林,只有上下游产业方开放融合,才能破局发展。
在AIGC带来的变革浪潮中,智能家居行业也迎来了前所未有的发展机遇。在以“话行业机遇,探共生之道”为主题的圆桌论坛上,来自产业各界的大咖们共同探讨AIGC时代下智能家居行业“智变”的影响,洞见智能空间的未来发展脉络。如何把握行业趋势?如何应对风口和挑战?如何聚合生态力量探索一条共生共赢的发展路径共创未来?让我们在本次圆桌论坛中寻找答案:

主题:话行业机遇,探共生之道 

主持人:王胜阳(CSHIA执行秘书长)  

对话嘉宾:陈佳明——招商蛇口城市研究院院长助理、智能化研究所所长;陈立敬——星宸科技副总经理;尤中海——智引擎创始人;彭永坚——广州视声智能股份有限公司总裁;付佳毅——普华永道思略特( 上海)战略咨询执行总监。

01.AIGC带来技术革新,将给智能家居行业带来怎样的新变化?陈立敬:“AIGC将大幅提升行业效率。”

作为上游的芯片厂商,近半年来最直观的感受就是不断有客户来讨论未来大模型如何落地,云边端如何协同与算力调度,AIGC在千行百业的应用倒逼我们进行芯片的创新升级,同时谷歌等国外大厂已经开始用Chatgpt进行芯片设计,AIGC正在迅速拓宽其应用边界,无疑这将带来行业效率的大幅提升。

近几年来,我们始终和讯飞一起致力于提高行业效率,降低行业成本。自18年开始,我们和讯飞一样,也一直在思考,如何通过我们的努力,做好一款家庭中控面板,人机交互体验始终是智能家居的重点,因此我们第一款中控面板的芯片集成多核cpu,融合语音&视觉多传感器,为用户提供更自然的交互形式,通过降低NRE费用和授权费用,实现用户开发门槛的降低和成本管理的极致,而AIGC的发展将会成为行业降本提效的新引擎,助力我们在这条路上走得更稳更远。

02.面对家居空间内不同群体的受众,如何精准把握用户的需求点?付佳毅:“AIGC的自主学习能力能让住宅拥有大脑,精准把脉用户需求。”

智能家居行业向来是技术驱动型的,AIGC是个很好的转型点,但仍需过程。正如移动互动网时代的发展路径,3G到4G的跨越是源于pc端app转移至手机端,用户开始习惯用手机上网;4G到5G的跃升是源于短视频等行业的内容井喷,用户需要更低廉的上网流量和更快的上网速度。可以看到技术创新伊始,无法预料到未来的应用场景会发展成怎么样。
正如现在智能家居的语音技术,虽然比其他按键、触屏等交互方式先进,但仍然存在要站到屏面前进行对话的机械之处。因此我们需要挖掘客户需求,探索更便捷的应用场景,用户对于应用场景的喜好改变才能倒逼技术普及。例如中控屏的陪伴式场景,老人并不是需要触摸屏和语音交互,他们需要的是子女的陪伴。如果我们通过AIGC技术创造出子女形象的数字人,并且在设备中录入子女声音的声纹,以这样的形式做交互,或许能比普通的智能语音屏更能切中用户需求。
数字化可以重新定义家居场景,就像特斯拉用一个统一的控制单元重新定义了智能汽车,颠覆了仍旧坚持传统逻辑的老牌汽车;住宅也可以以统一的数字化生命体做反应,将方方面面的数字化结构做整合,在能耗管理、环境管理、需求关切上,通过AIGC做人性层面的升级,这将远超传统数字化控制能解决的问题,AIGC的自主学习能力能让住宅拥有大脑,面对家居空间内不同群体的受众,始终在思考如何与用户更好地进行互动,精准把脉用户需求。

03.与传统家居相比,AIGC赋能的智能家居如何在用户的全生命周期中提供更好的保障和服务?彭永坚:“AIGC将推动研发转型,低成本高效率实现用户体验升级。”

面对AIGC带来的新机遇如何做好产品定义是我们一直在思考的问题。过去很多年,智能语音是个很火的窗口,尽管智能汽车的语音已经发展得非常成熟,但地产始终没有成功案例。一个原因是地产对于智能家居装配的费用投入不足;另一个是如果要为了提升用户体验替换技术服务商,背后将是一系列产品设计、产品结构、声音美学、软件的替换,带来成本的增加和研发的难度,而AIGC的出现能大幅提升研发效率,推动研发转型做更专业更聚焦的工作,低成本高效率地实现用户的体验升级。尤中海:“在变化的环境中,找到用户体验的确定性。”

现在所有的技术方向,都是让21亿人生活得更爽,让60亿人过上体面的生活,如何打造更懂用户需求的数字空间,需要产业链的共同努力,也需要不受缚于固有技术。

就像我们针对亚非拉无法建立有效的网络体系的现状,提出了一项全新的服务方案:基于新型能源结构打造全新的通信底层架构,并以全屋直流电满足低压需求。不同于网络这个虚拟的世界,数字空间是固定的,我们要在不断变化的市场环境和不断更迭的技术发展中,找到用户体验的确定性,真正让技术被获得。

04.下一个行业千万级出货量的品类集中在哪几个方向?

陈佳明:“绿色、健康、科技是未来的产品需求方向。”

16年我们就提出了“云管家“概念,尽管上层营销推广得非常好,但落地应用层面还是积累了非常多的经验教训。就像智能汽车颠覆传统汽车的价值点是无人驾驶一样,我认为未来住宅颠覆传统住宅的价值点,一定是“管家”。不同于我们现在的“家庭管家”,在设定、唤醒前还是需要输入命令词、场景模式等,AIGC的赋能将大大降低使用者的门槛。

今年我们做了项调研,统计了居住空间中最令消费者记忆深刻的产品TOP3,它们分别是Wi-Fi、集成控制面板和中控屏。中控屏作为智能品类中用户互动最多的产品,同时也能作为家和小区的连接器,我十分期待它与AIGC融合后的可延展性。

“绿色”、“健康”、“科技”是行业未来的三个关键词。绿色是全人类的需求,能节约能源的事是优先的事;健康是客户的强需求,除了安全需求,健康是所有人的共识问题;日新月异的科技迭代速度,大家都在观察AIGC能为行业带来什么变化。因此如果未来有一款搭载了大模型的产品能结合绿色、健康,同时配合低廉成本做成普适性的东西,极大可能就是新的产品方向,但具体是什么样的产品形式,需要大家共同思考和努力。

技术创新的脚步不会停止,用户对美好生活的向往亦不会停止。MORFEI作为讯飞全屋智能细分赛道下的专业选手,坚持致力于用人工智能推动智能家居行业高质量发展,联合产业链合作伙伴,以技术赋能提升用户体验,共生共赢共襄未来。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

Netflix重金招聘AI专家,引起好莱坞工会担忧!

人工智能的使用一直是编剧和演员罢工的主要话题。好莱坞的每个人,在劳动方面都担心人工智能的使用。他们不想完全消除它,但他们要求对其使用提供明确的书面保护和指导方针。这是贾斯汀·贝特曼(Justine Bateman)在美国作家协会(Writers Guild of America)罢工开始时发出警告的内容,也是美国电视和广播艺术家联合会(SAG-AFTRA)主席弗兰·德莱舍(Fran Drescher)在演员罢工第一天发表评论的内容。

“我在圣塔莫尼卡,看到有一个小盒子在滚来滚去地进行送货,我的心都碎了,因为以前有人骑着自行车送货,他们今天失业了,这就是我们这个行业和世界各地工人正在发生的事情,”德莱舍在抗议线上说。

如今,这家流媒体公司发布了两个人工智能领域的工作岗位。该公司正在招聘机器学习平台产品经理。年薪从30万美元到90万美元不等。根据职位描述,这个职位将领导流媒体公司在人工智能领域的努力。公司希望这个人能帮助他们“购买和创造优秀内容,通过个性化帮助会员“选择适合的内容”,优化“支付处理和其他以收入为重点的举措”。该职位还要求申请人展示“为集中式机器学习基础设施团队创建和执行愿景的能力,该团队支持机器学习从业者和数据科学家在各种用例中的应用。”

还有另一份职位招聘,招聘对象是游戏部门的人工智能和机器学习技术总监。该角色的薪水范围在45万美元到65万美元之间。这些薪酬被证明非常丰厚,但对于演员和编剧来说,他们表示他们无法从这项技术中获得同样的报酬。工会成员表示,电影公司愿意按日支付演员的报酬,以换取扫描和创造“数字形象”。该媒体指出,背景演员每天的工资只有200美元。这是根据美国电视和广播艺术家联合会的合同。

直到5月初,美国作家协会一直站在抗议线上,美国电视和广播艺术家联合会于7月13日投票决定罢工。目前还没有消息表明电影公司和工会之间何时可能达成协议。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

《瞬息全宇宙》幕后特效公司 Runway 开放 AI 视频生成工具,可注册账号免费试用

《瞬息全宇宙》特效背后的科技公司Runway近日宣布,旗下AI视频编辑工具Gen-1和Gen-2已向全球用户开放了,现在任何人都可以注册账号免费试用。
Gen-1模型早在今年2月份就推出,仅通过简单的文本提示就能修改视频的艺术风格,想象一下把实景镜头变成梦幻卡通世界,是不是非常厉害?

而更厉害的Gen-2,直接用单个文本提示就能生成惊人逼真的视频场景!比如输入“山脉的航拍无人机镜头”,瞬间就能获得令人震撼的航拍画面!
现在你可以体验到完全免费的服务,注册后还能获得一定数量的代币,用这些代币免费生成多达20段4秒视频。超过代币限额后,不用担心,只需支付0.05美元(约1.43元人民币)一个代币,即可继续生成更多视频,可以说是非常划算了。

Runway Gen-2已上线苹果App Store和Web版本,就算没有苹果设备也能在浏览器中体验,赶快试试这个让你的视频编辑变得无比轻松的黑科技。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

OpenAI、谷歌、微软等 宣布成立前沿模型论坛,旨在推动模型的安全发展!

 7月26日,Anthropic、谷歌、微软和 OpenAI 宣布成立前沿模型论坛,这是一个新的行业机构,专注于确保前沿人工智能模型的安全和负责任的开发。前沿模型论坛将利用其成员公司的技术和运营专业知识,使整个人工智能生态系统受益,例如通过推进技术评估和基准,以及开发公共解决方案库来支持行业最佳实践和标准。

OpenAI、Google、微软、Anthropic发声正在推出前沿模型论坛,该机构专注于前沿人工智能模型的安全性和可靠性。该论坛旨在帮助:(i)推进人工智能安全研究,以促进前沿模型开发的可靠性,最大限度地降低风险,并实现对能力和安全性的独立、标准化评估;(ii)确定前沿模型可靠开发和部署的最佳实践,帮助公众了解技术的性质、功能、局限性和影响;(iii)与政策制定者、学者、民间社会分享有关信任和安全风险的知识, 推进可靠的人工智能系统开发;(iv)支持开发有助于应对社会最大挑战的应用程序,例如减缓和适应气候变化、早期癌症检测和预防以及应对网络威胁。
  前沿模型论坛还将设立一个顾问委员会来协助战略指导和优先事项部署。同时,论坛欢迎其他开发前沿人工智能模型的组织参与,并愿意合作以实现这些模型的安全发展。

论坛会员标准

 该论坛将前沿模型定义为大规模机器学习模型,其能力超出了目前最先进的现有模型的能力,并且可以执行各种任务。论文会员资格向以下组织开放:

  • 1、开发和部署前沿模型(由论坛定义)。
  • 2、表现出对前沿模型安全的坚定承诺,包括通过技术和制度方法。
  • 3、愿意为推进论坛的努力做出贡献,包括参与联合倡议并支持该倡议的发展和运作。 论坛欢迎符合这些标准的组织加入这一努力,并合作确保前沿人工智能模型的安全和负责任的开发。

论坛工作重点

 各国政府和业界一致认为:虽然人工智能为造福世界提供特别多的可能性,但仍需要适当的防护来降低AI带来的潜在风险。美国、英国政府、欧盟、经合组织、七国集团和其他组织已对此做出了重要贡献。(YY:中国也做出了很多贡献!)

 依据之前努力的结果,我们需要在安全标准和评估方面开展进一步的工作,以确保人工智能模型开发、部署的可靠性和安全性。未来一年,论坛将重点关注三个关键领域,以支持前沿人工智能模型安全可靠的发展,具体地:

 1.确定最佳实践:促进行业、政府、民间社会和学术界之间的知识共享和最佳实践,重点关注安全标准和安全实践,以减轻各种潜在风险。

 2.推进人工智能安全研究:通过确定人工智能安全最重要的开放研究问题来支持人工智能安全生态系统。该论坛将协调研究,以在对抗稳健性、机械可解释性、可扩展监督、独立研究访问、紧急行为和异常检测等领域推进这些努力。最初将重点关注开发和共享前沿人工智能模型的技术评估和基准的公共库。

 3.促进公司和政府之间的信息共享:建立可信、安全的机制,在公司、政府和相关利益相关者之间共享有关人工智能安全和风险的信息。论坛将遵循网络安全等领域规则展示出最佳实践。

微软副董事长兼总裁Brad Smith表示:“创造人工智能技术的公司有责任确保其安全、可靠并始终处于人类控制之下。这一举措是将科技行业聚集在一起,负责任地推进人工智能并应对挑战,使其造福全人类的重要一步。”

 OpenAI全球事务副总裁Anna Makanju表示:“先进的人工智能技术具有给社会带来深远影响的潜力,而实现这一潜力的能力需要监督和治理。至关重要的是,人工智能公司——尤其是那些致力于最强大模型的公司——必须在共同点上保持一致,并推进深思熟虑且适应性强的安全实践,以确保强大的人工智能工具拥有尽可能广泛的利益。这是一项紧迫的工作,本论坛完全有能力迅速采取行动,以提高人工智能安全水平。”

 Anthropic首席执行官Dario Amodei表示:“Anthropic 相信人工智能有潜力从根本上改变世界的运作方式。我们很高兴与行业、民间社会、政府和学术界合作,促进该技术的安全和负责任的开发。前沿模型论坛将在协调最佳实践和分享前沿人工智能安全研究方面发挥至关重要的作用。”

论坛如何运作

 在接下来的几个月中,前沿模型论坛将成立一个顾问委员会,以帮助指导其战略和优先事项,代表不同的背景和观点。

 创始公司还将建立关键的制度安排,包括章程、治理和资金,并由工作组和执行委员会来领导这些工作。我们计划在未来几周内就论坛的设计和有意义的合作方式与民间社会和政府进行磋商。

 前沿模型论坛欢迎有机会帮助支持和融入现有的政府和多边倡议,例如七国集团广岛进程、经合组织关于人工智能风险、标准和社会影响的工作,以及美国-欧盟贸易和技术理事会。

 论坛还将寻求以现有行业、民间社会和每个工作流程的研究工作的宝贵工作为基础。人工智能合作伙伴关系和 MLCommons 等举措继续在整个人工智能社区做出重要贡献,论坛将探索与这些和其他有价值的多方利益相关者的努力合作和支持的方法。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

网易有道正式发布国内首个教育大模型—“子曰”大模型

教育科技公司网易有道发布国内首个教育大模型“子曰”以及六大创新应用成果,覆盖口语训练、作文批改、习题答疑等领域,展现了“子曰”大模型在自然语言处理领域的技术实力及广泛应用前景。北京青年报记者了解到,大模型“子曰”能为学生提供个性化的分析和指导,实现引导式学习,还具备全科知识整合能力。通过连接多模态知识库、跨学科整合知识内容,大模型能随时满足学生的动态需求,帮助孩子培养更综合的能力。

发布会上,网易有道推出了大模型时代的英语口语练习神器——虚拟人口语教练Hi Echo。有道词典业务负责人与 Echo 进行了多组随机对话。Echo 能迅速理解场景和上下文,并给出迅速反馈。她的面部表情和口型生动而自然,发音也非常地道,重音、弱读、升降调等细节处理得非常到位。

在对话过程中,Echo能够像真人老师一样循循善诱,启发式进行对话引导,还能进行实时反馈。对话结束后,Echo会从发音、语法等维度给予建议和润色,能有效解决长期困扰英语口语学习者无话可说、不知从何说起、害怕说错等问题。

“中国人在说英语时往往面临开口难、不敢说、不知道该从何说起的困境,其中的关键就在于缺乏语言环境。”有道词典业务负责人表示,Echo恰恰能为用户带来这种真正贴合实际的“语境”,帮助他们更好地练习英语口语。

网易有道不仅关注用户在英语学习中“不敢开口说英语”的痛点,还覆盖了多种学习场景,借助“子曰”大模型的支持为用户提供多种高效学习方案。

例如,在写英语作业时,学生们不仅有解决具体问题的需求,还需要学会举一反三。“子曰”大模型赋能的“语法精讲”功能可以为学生提供针对性的解题思路和方法,还能推荐同类型的考题,帮助学生触类旁通,真正理解考纲中的考点。

此外,有道在发布会上推出的“AI作文指导”应用,不仅具备“作文批改”功能,还具备“作文指导”功能。据介绍,该应用旨在解决“学生不会写”和“老师没时间改”的问题。针对学生在写作、前、中后过程中面临的题目主旨难确定、写作素材匮乏等难题,该应用都能够给予指导,帮助学生“下笔如有神”。批改环节中,AI作文指导还会从表达、结构、内容深度、情感丰富度四大维度全面提供改进建议。

网易有道CEO周枫认为,一个好的技术有没有价值、能不能发挥巨大的作用,很多时候关键在场景和应用的选择以及细节的打磨。“通过软件、硬件、AI技术的结合,做出精品是我们现在做的事”。他说,“子曰”大模型在教育行业的应用,不仅可以帮助学生更好地学习,也可以帮助老师更好地教学,借此实现因材施教的教育理想。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

Meta 之后,英特尔推出34 个开源 AI 参考套件,AI 领域会掀起开源潮吗?

最近,芯片巨头英特尔与埃森哲合作,向开源社区提供了包含34 个开源 AI 参考套件的产品组合,这标志着英特尔在促进开源 AI 生态发展方面迈出了重要的一步。这些参考套件可以帮助开发者和数据科学家更快更轻松地部署人工智能,为多种架构的本地、云端和边缘计算环境提供 AI 服务。

每个套件都包含了模型代码、训练数据、机器学习管道指令、相关库和oneAPI 组件等内容,旨在优化 AI 性能,简化 AI 引入应用的过程。这些套件基于英特尔端到端的 AI 软件产品组合和开放的 oneAPI 异构编程模型构建,可以充分发挥英特尔 AI 芯片的计算优势。与传统的模型开发流程相比,英特尔 AI 参考套件可以极大地提高工作效率。

这些预配置的AI 套件覆盖了众多关键行业的典型应用场景,如消费品、能源、金融服务、医疗健康、制造业、零售业等。在这些应用场景中,英特尔 AI 参考套件展现出显著的优势:

  • 使用面向企业对话机器人的套件,可以利用 oneAPI 把推理速度提升 45%。这可以大大提升客户服务机器人的响应能力。
  • 应用于生命科学视觉质量控制的套件,可将视觉缺陷检测的训练速度提升 20%, 推理速度提升 55%。这将极大地提高医药制造业的质量控制效率。
  • 预测公共设施资产健康状况的套件,可以将预测准确度提高 25%。这对于电力、水利等公用事业提升服务质量非常关键。
  • 利用这些套件,可以将 AI 模型开发周期从数周缩短至数天,大大降低了研发成本。这可以加速各行各业将 AI 技术应用到实践中。

英特尔副总裁兼人工智能与分析总经理李伟博士表示:

“这些开源的参考套件可以帮助数百万开发者和数据科学家以最简单、高性能且经济高效的方式来构建和扩展各种领域的 AI 应用。”

埃森哲董事总经理John Giubileo 也对此表示欢迎:

“与英特尔合作开发这些 AI 参考套件,可以更好地满足客户的 AI 需求,提高他们的工作效率。”

随着社区反馈不断改进,这些AI 参考套件必将帮助开发者更好地开发和部署人工智能,推动各行各业 AI 化进程的加速。英特尔表示,所有套件均可在官网或 GitHub 免费下载。

值得一提的是,英特尔开源的这些AI 套件,都是基于其独特的优势构建的:

首先是其领先的AI 芯片技术。英特尔拥有从数据中心到边缘的全面 AI 芯片产品线,如 CPU、GPU、VPU、FPGA 等,可以提供强大的算力保障。这些芯片与开源套件的结合,能够发挥卓越的性能。

其次,英特尔在AI 软件方面进行了大量投入。其一 API 编程模型、AI Analytics 工具包、OpenVINO 工具包等,为开发者提供了全面的支持。这为开源套件的开发奠定了坚实基础。

再次,英特尔一直积极推动AI 生态建设,与很多行业领导者如埃森哲建立合作。英特尔了解行业真正的 AI 需求和痛点,所以设计的套件更加贴合实际。

最后,英特尔拥抱开源,这使得英特尔的AI 套件可以被广泛使用,也方便进行持续优化。开源是当前 AI 技术快速进步的重要动力。

开源正在推动AI技术进步

近期,Meta推出了开源可商用的大规模语言模型LLama 2。这对很多大模型来说都是降维打击。业内专家认为,开源可以降低获取先进AI技术的门槛,让更多团队参与创新,共同推进技术发展,AI会迎来更多开源项目。

英特尔开源AI套件也是这个趋势的体现。开源可以加速AI技术在各行各业的应用,使创新成果惠及更广泛的用户。与此同时,开发者的反馈也将促进这些开源工具的持续进步。

可以预见,开源生态的壮大将给AI技术发展带来正面影响。一方面它推动竞争和创新,另一方面它也降低获取先进技术的成本。这些共同作用将有助于AI向着更广泛应用的方向发展。

人工智能的迅速发展给人类带来了巨大的挑战和机遇。随着AI技术的发展,90%的职业会被AI替代,导致大量的人失业。同时也将产生新的大量的AI工作机会。拥抱AI,学习AI,不要做汽车时代的马车夫。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

AI技术助力小红书推出“此刻”功能 打造个性封面!

【ITBEAR科技资讯】7月25日消息,今日,小红书发布了一项名为“此刻”的全新功能,为用户带来了更多有趣的内容发布方式。这项功能允许用户直接输入文字,随后算法将根据输入的文本内容生成一张相应的图片,供用户用于发布。另外,用户还可以在画板上涂鸦,然后通过AI的美化处理,将涂鸦转化为更具艺术感的图像。

据ITBEAR科技资讯了解,使用这一功能非常简便。用户只需在App底部点击“+”按钮,然后选择“此刻”功能。接着,点击“点这里,说说想法”并输入希望作为封面的文字,最后点击右上角的“下一步”。

这一功能提供了三种不同的生成效果,分别是“记事本”、“聊感悟”和“想吐槽”。用户可以自行选择喜欢的呈现类型,来决定封面的内容和风格。如果用户对自动生成的封面不满意,还可以点击“换一张”进行更改。

这一创新功能的实现离不开AIGC技术的支持。目前,这一功能已经在最新版本的小红书App中全量上线,用户可以随时前往体验。

小红书此次推出的“此刻”功能为用户带来了更多创意和个性化的内容发布方式,相信会受到用户的欢迎。未来,随着AI技术的不断发展,类似的创新功能可能会在更多社交媒体平台上出现,为用户带来更加丰富多样的使用体验。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

Gartner:看穿生成式AI的“炒作”,审视AI技术为企业带来的真正价值

来源: 赛博研究院

新的工具和技术都为企业业务增长和成本控制提供了新的机会。类似ChatGPT这样的工具,未来将有极大可能渗透、辐射并完全重新定义员工体验、客户体验、业务和IT的运营业务,以及企业的核心产品或服务建设。研讨会中,Gartner指明了ChatGPT和AIGC产业对中国企业影响的十个事实如下:

本文将聚焦“ChatGPT与LLM、生成式AI的关系,人工智能实施的三大障碍,部署类ChatGPT对于企业有哪些风险,企业如何利用类ChatGPT这个机会提升员工技能/数据分析水平以及Gartner如何看待AIGC未来的走向”几个方面,展开进一步的讨论。

ChatGPT与LLM、生成式AI的关系

弄清生成式AI定义

生成式AI(Generative AI)——生成式AI是指人工智能技术从数据和模型中学习工件的组件(要素),并利用它生成全新的、完全原创的工件(一个产品或物品或任务),同时保持与原始数据或模型的相似性。

基础模型(Foundation model)——基础模型是一种大型的机器学习模型,使用转换器算法在大量无标记数据上进行训练;这种训练通过一系列微调(适配器)机制进行增强,从而产生一种可适用于各种应用的模型。

大语言模型(LLM)——LLM是一种专门针对自然语言的基础模型。

ChatGPT是一个建立在 LLM(这里指OpenAI的GPT模型)之上的会话应用程序。

生成式AI还能生成什么?

生成式AI生成的内容大致可以分为产品与学习方法两大类。产品涉及音视频、编程与数据资产、自然语言、设计等领域;学习方法则主要包含战略、策略两个方向的内容。

AI实施的三大障碍

Gartner调查了AI技术在企业中使用所面临的障碍。根据报告,AI技术实施最大的障碍包括数据可获取性的挑战、数据量和(或)复杂性、无法/难以衡量其价值

企业部署类ChatGPT面临的风险

Gartner将部署类ChatGPT的技术会给企业带来的风险主要分为了输出不可信知识产权、数据隐私与网络安全两大类。两类风险的具体体现如下。

风险一:用户面临的ChatGPT输出常见风险

1、事实不准确(Factual Inaccuracies):在重要细节上出错,输出的内容存在不真实性。

2、幻觉(Hallucinations):完全捏造的输出。对内容没有实际的 “理解”;它只是预测文本。

3、过时信息(Outdated Information):ChatGPT的“知识”截止日期为2021年9月。

4、偏见信息(Biased Information):训练数据的偏见会导致输出结果的偏差。

5、侵犯版权(Copyright Violations):输出结果可能与受版权保护的作品相似。

风险二:知识产权、数据隐私与网络安全

ChatGPT使用风险缓解的行动计划

企业如何利用类ChatGPT提升员工技能/数据分析水平

Gartner预测,到2030年,90%的数据工程师、数据与分析内容创建者和业务分析师将被“数据GPT”所取代。

提示工程将成为释放生成式AI价值的重要技术。从输入的角度,提示工程可以嵌入企业已有的知识并为大语言模型设置背景;从输出的角度,提示工程可以为输出结果做好安全的保证以及促进正确答案的生成。

提示工程(Prompt engineering)是一种人机交互设计的方法,它在计算机系统或应用程序中为用户提供相关提示、建议或反馈信息。这些提示信息可以帮助用户更好地理解系统的功能和如何与系统进行交互,从而提高用户的使用体验和效率。

普通群体可以学习提示工程技术,来改变一些提示词;而专业群体则通过精进LLM微调技术,改变整个模型。

AI相关技术成熟度曲线

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群

大模型热潮下埃森哲强调生成式AI推动企业重塑

生成式人工智能——高处的果实?

2023年,最为引发业界关注的技术热点,非生成式人工智能莫属。此前,经济学家朱民表示,生成式AI在根本上改变了我们对数字经济的理解。“以后这个世界就是有生成式AI和没有生成式AI之间的一个区别。”

俞毅对生成式人工智能也颇有感触,2022年8月,他在美国接触了多家技术公司,其中便包括知名AI企业Midjourney,令他眼前一亮,那时他便感觉到,很多事情发生了变化。

更广的调研印证了这样的变化。埃森哲访谈了全球4000多位高管,跨越20多个行业,有42%的全球受访企业有意在今年大力投资ChatGPT及生成式人工智能和大语言模型,98%的高管认为生成式人工智能将能够改造企业整体的运营。企业对跨职能的重塑、技术推动的重要性有着共识。

但是,其中存在不小的落差,俞毅表示,全球范围内真正采取企业重塑战略的领军企业比例只有8%,大部分企业还是观望心态。埃森哲希望通过研究访谈触发更多的企业思考——人工智能会对已有的业务产生影响,具体怎么进行企业重塑,以及如何通过技术抓住新的机会,获得持续增长。

此次大模型热潮背后的大型语言模型(LLMs)和基础模型是推动生成式人工智能进步的重要转折点。它们不仅破解了语言复杂性的密码,使机器能够学习上下文、推断意图并独立创造,而且还可以快速微调以适应各种不同任务。这些技术将对未来的工作方式、商业模式和社会生活产生深刻影响,使人类创造力和生产力发生巨大改变。

现阶段,大多数企业会以直接购买“模型即服务”来开展业务应用。不过对许多企业来说,最大的价值或将源于使用自身的数据定制或微调模型,满足其独特需求。

比如,企业方有望随时便捷地获取和使用生成式人工智能及大语言模型应用程序。企业可以通过应用程序编程接口(API)调用这些程序,并运用提示学习(prompt tuning)和前缀学习(prefix learning)等提示工程技术,针对自身的具体需求加以定制。

另外,为了提高生成式人工智能和基础模型在特定业务应用方式中的价值,企业将越来越多地利用自身数据对预训练模型加以微调来实现定制,从而让绩效实现质的飞跃。

例如,在线旅行代理公司通过部署ChatGPT插件作为“智能客服”,为用户提供旅游出行的个性化建议,帮助用户更快确定行程安排。对于意外的行程更改,旅客可以通过全天候在线的智能客服快速解决问题。

除此之外,生成式AI还可以具体落地于内容创建、代码编写、流程自动化、信息安全等领域。俞毅观察到,有些行业的客户起步比较早,例如,全球一家规模较大的保险公司,首先用生成式AI在一个节点承保审核方面做了应用,里面牵涉的文档多而复杂,通过生成式AI对历史数据、市场环境等的考量和分析,横向比较看,现阶段企业的承保、审核的过程能够快20%至30%。

俞毅认为,生成式人工智能在企业里的目标、应用场景还是相对明确的,这是好的基础。当前的应用比较偏前端和用户交互层面,未来需要继续拓展到工业及企业级应用领域。企业要往上“看”,去够高处的果实,与此同时企业也要往下“沉”,打好地基。

“目前有很多企业的数字化核心还不够牢固,这方面的能力建设包含了产品研发、供应链、核心系统、人力资源等全流程。否则,和生成式人工智能结合来进行企业重塑就会面临困难。”他说道。

技术趋势中谨慎前行

越来越多的中国企业正在积极探索生成式人工智能技术,并开始应用大型语言模型来实现更多的创新和效率提升。在埃森哲看来,企业方既需看到明确的方向,也应在过程中谨慎探索,例如选择一些低风险领域进行可行性评估,再开展生成式人工智能试点,探索创新潜力。

同时,技术应用初期,在合规、安全、技术伦理等方面企业仍要引起足够重视。俞毅表示,安全合规问题是企业比较关注的点,企业、行业面临的合规环境越来越复杂。

大多数的企业已经意识到让生成式AI更“有责任感”的重要性并开始采取积极行动。埃森哲指出,77%受访企业高管将对于AI的监管列为优先事项。此外,有八成受访高管表示,其企业将投入10%或更多的AI总预算,以满足未来的监管要求。

7月13日,网信办等七部门正式发布了《生成式人工智能服务管理暂行办法》(下称《办法》),从生成式人工智能服务提供者的算法设计与备案、训练数据、模型,到用户隐私、商业秘密的保护,监督检查和法律责任等方面提出了相关要求。同时,《办法》中明确了对生成式人工智能产业的支持和鼓励态度。

生成式人工智能所面临的风险因素中,合规风险贯穿于模型设计、搭建、使用各个阶段,涉及个人和商业隐私、版权和著作权等各个方面。

其次是数据风险。如果一台基础模型长期浸染在存有偏差的数据当中,它就会被这些数据“诱导”,从而输出错误的信息或执行歧视性操作。另一方面,某些群体特质也会使生成式AI为其打上固化标签,“一刀切”地去执行某些程序,而失去公平性。

埃森哲认为,打造负责任的生成式AI,不是一项“见招拆招”、“亡羊补牢”的局部任务,而是在生成式AI基础模型的设计之初就应未雨绸缪,并在其全生命周期中持续领航匡正的系统性工程。

想要做大模型训练、AIGC落地应用、使用最新AI工具和学习AI课程的朋友,扫下方二维码加入我们人工智能交流群