有趣的是,创始人姓氏的首字母恰好组成了「L.L.M.」。这不仅是姓名首字母简写,也恰好是团队正在开发的大语言模型(Large Language Model)的缩写。这场人工智能竞赛中,OpenAI、微软、谷歌等科技公司早已成为行业的佼佼者,并在LLM研发上上斥资数千亿美元。凭借充足的互联网数据养料,使得大模型能自主生成文本,从而回答问题、创作诗歌甚至写代码,让全球所有公司看到了这项技术的巨大潜力。因此OpenAI、谷歌在发布新AI系统前,都将花费数月时间,做好LLM的安全措施,防止这项技术散播虚假信息、仇恨言论及其他有害内容。Mistral AI的首席执行官Mensch表示,团队为LLM设计了一种更高效、更具成本效益的训练方法。而且模型的运行成本不到他们的一半。有人粗略估计,每月大约300万美元的Mistral 7B可以满足全球免费ChatGPT用户100%的使用量。
去年12月,曾在OpenAI和DeepMind担任研究科学家创立了Perplexity AI,在最近完成了一轮7000万美元的融资,公司估值达到了5亿美元。风险投资公司a16z的合伙人Anjney Midha对新一轮Mistral的投资表示:我们坚信 AI 应该是开放源代码的。推动现代计算的许多主要技术都是开源的,包括计算机操作系统、编程语言和数据库。广泛分享人工智能底层代码是最安全的途径,因为这样可以有更多人参与审查这项技术,发现并解决潜在的缺陷。没有任何一个工程团队能够发现所有问题。大型社区在构建更便宜、更快、更优、更安全的软件方面更有优势。
这项工作被公布在 arXiv 论文预发表网站的一篇文章中,也让我们得以一睹虚拟人如人类般顺畅理解并响应语言命令的未来景观。例如,把椅子拉近桌子来创造一个工作空间,调整落地灯以投射出完美的光芒,或者整齐地存放手提箱。每一项任务都需要人、物体和周围环境之间的精确协调。语言是表达和传达这些意图的有力工具,在语言和场景背景的指导下,合成逼真的人类和物体运动是构建先进的人工智能系统的基石,该系统可以在不同的 3D 环境中模拟连续的人类行为。
对于 AI 来说,这种同时处理语言和视觉信息以引导任务执行的能力,也使其距离充分理解情境和环境上下文又更进了一步。而且在此之前,这种能力一直是人类的优势和专利。在 CHOIS 的支持下,未来的 AI 系统有望在更多复杂任务中发挥更大的作用,不仅能够消化人类指令的“内容”、更能理解人类指令的操作“方式”,以前所未有的灵活性适应新的挑战。
03元宇宙简史成果令人惊艳,前景值得期待
CHOIS 代表了人工智能领域的重大飞跃,特别是在计算机视觉和人机交互领域。通过综合 3D 人与物体交互,CHOIS 可以生成逼真的动画和场景,这对于创建沉浸式虚拟体验至关重要。
季燕江:平台化确实可能是一个解决思路。我们提到过的AI for Sicence也是讲要推动基础设施的平台化,能够使整个社会更具有创新性,并且使我们的公共空间变得更大。可能公的扩大也许是创造一个新人文、新价值观的一个基础。
邱泽奇:我再补充两句,今年7月份有一位华裔的科学家领头的14家机构67位科学家共同写了一篇200多页的文章,就讲AI for Science。AI for Science在垂直领域里面已经有了广泛的应用,对于社会科学而言,目前还没有一个AI for Social Science,AI for Humanity。为什么没有出现,我发现一个非常重要的能力缺陷或者叫能力断层,就在于人文和社会科学家还陷在他的关于传统邻居的想象之中。突破这样一个想象,需要的就是刚刚讲的,提供公共的科学空间或者叫公共空间,这个公共空间不只是有算力空间,还有我们的应用空间,而这个空间是一个多项参与的建构过程,其中平台公司在这里大有机会。
第二,技术本身一旦和生产、生活、学习、工作关联,势必会改变生活的方式、工作的方式,这种改变也就意味着会创造大量的不确定。比如说你现在如果不会用人工智能或者大语言模型,因为它具有all in one的能力,会用大语言模型的人就会取代你,在某些任务上会比你干得更加出色。技术本身创造了一些新的技术手段,使得我们每个人具有不确定性。
– AI Agent:11月6日,OpenAI在DevDay上发布了Assistants API,通过该API可以简单创建具备完整的短期记忆、长期记忆(补充私有知识)、工具使用、自主规划能力的AI Agent/Assistant;12月1日,昆仑万维发布 AI Agent开发平台天工SkyAgents,用户可以通过自然语言构建自己的单个或多个“私人助理”。
商业模式关乎整体生态能否实现从价值创造到价值实现的完整闭环,目前AGI生态的商业模式主要以AIGC相关的商业模式为代表,主要体现为MaaS(Model as a Service,模型即服务)模式。该模式核心价值可归纳为:降低算法需求侧的开发技术和使用成本门槛,使AI模型和应用成为简单易用、触手可得的工具。
Liquid AI 是一家基于所谓的液体神经网络设计开发人工智能模型的初创公司,旨在构建一种全新类型的人工智能,被称为液态神经网络。这一创新性的技术基于液态神经网络架构,相较传统模型更小巧、可解释,且具有动态适应性。今天宣布已筹集 3760 万美元的种子资金。本轮融资由 OSS Capital 和 PagsGroup 领投,估值达 3.03 亿美元。该公司由 MIT 计算机科学与人工智能实验室主任 Daniela Rus 联合创立,致力于将其对液体神经网络的研究商业化,这是一种新型人工智能,可以比传统模型更可靠地执行某些任务,并且功耗显著降低。
值得注意的是,此次成立人工智能联盟,并没有包含OpenAI、英伟达,以及中国的企业和研究机构等 AI 行业关键的参与方。
官网显示,AI 联盟是一个由技术创造者、开发者和采用者组成的社区,合作推进植根于开放创新的安全、负责任的AI。AI 联盟以行动为导向,具有明显的国际性,致力于在 AI 技术领域加速和传播开放式创新,以提高 AI 的基础能力、安全性和信任度,并负责任地为世界各地的人民和社会带来最大利益。该联盟汇集了大量的计算、数据、工具和人才,以加速 AI 的开放创新。
具体来说,AI 联盟重点领域包括四部分:一是开发和部署基准和评估标准、工具和其他资源,以便在全球范围内负责任、可扩展地开发和使用 AI 系统等;二是开放基础模型,启用具有多种模式的开放基础模型生态系统;三是培育充满活力的 AI 加速硬件生态系统;四是支持全球 AI 技能建设、教育和探索性研究。
数据显示,截至目前,AI 联盟所有成员的年度研发经费总额超过800亿元,员工人员总数超过100万人。同时,学术机构资助的学生和 AI 从业者超过40万人。
针对 AI 联盟的成立,IBM 董事长兼首席执行官 Arvind Krishna表示:“我们在人工智能领域不断见证的进步证明了创作者、科学家、学者和商界领袖社区之间的开放式创新与协作。这是定义人工智能未来的关键时刻。IBM很荣幸能够通过 Ai 联盟与志同道合的组织合作,确保这个开放的生态系统推动以安全、问责和科学严谨为基础的创新 AI 进程。”
AMD 首席执行官兼董事长苏姿丰 (Lisa Su)则表示:“在 AMD,我们致力于通过合作推动技术进步。我们行业的历史凸显了开放的、基于标准的开发如何利用整个行业的能力来加速创新并确保技术进步产生最大的积极影响。通过在快速发展的 AI 生态系统的各个方面采用开放标准和透明度,我们可以帮助确保负责任的 AI的变革效益得到广泛利用。”
苏姿丰强调,AMD很荣幸能与其他行业领导者一起成为 AI 联盟的创始成员,并期待共同努力,确保 AI 的快速发展成为积极变革的力量。
1、流程自动化:AI Ag ents 可以自动执行以前需要手动完成的任务,从而简化和加速工作流程,提高效率。
2、任务优先级确定:通过机器学习算法, AI Ag ents 可以分析和评估任务,确定其优先级,使得工作可以更有组织性和高效性。
3、自然语言处理:AI Ag ents 利用自然语言处理技术,能够理解和解释用户的意图和需求,从而更好地与人进行交互和沟通。
4、减少人为错误:AI Ag ents 可以通过自动化和智能决策减少人为错误的发生,提高工作的准确性和可靠性。
5、数据处理能力:AI Ag ents 可以轻松处理大量数据,并从中提取有用的信息和洞察,以支持决策制定和问题解决。
尽管 AI Agents 具有众多优势,但同时也带来了一系列值得关注的挑战。一些主要问题包括道德考虑、数据隐私问题和潜在的滥用。具体如下:
1、 道德考虑:A I Agents 在做出决策和执行任务时,可能面临道德困境。例如,在自动驾驶汽车中,当发生不可避免的事故时, AI Agents 需要做出选择,这引发了道德优先级和生命价值的问题。
2、数据隐私问题:A I Agents 需要大量数据来进行学习和推断,这可能涉及个人隐私的问题。收集、存储和处理大量个人数据可能导致隐私泄露和滥用的风险,需要制定合适的隐私保护措施和法规。
3、潜在的滥用:A I Agents 的潜在滥用是一个重要的问题。例如,人工智能可以被用于制造假新闻、进行网络欺诈或进行个人监控。防止人工智能技术被恶意利用需要加强监管、教育和技术安全措施。除了上述的核心问题之外,所面临的其他挑战包括安全风险、法规、任务复杂度、数据可用性和质量、定义成功标准以及其他层面等等。
如何更好地提高 AI Agents 性能?
为了提高 AI Agents 的性能,可以采用多种技术和策略,其中包括机器学习、搜索算法和优化等。这些技术在增强各个领域的 AI Agents 性能方面具有广泛的应用,并且不断发展和演进。
1、机器学习技术
AI A gents 通过学习过去的经验、适应新情况并接收反馈,可以持续改进并提高其性能。为此,使用各种流行的机器学习技术是至关重要的。这些技术包括监督学习、无监督学习、回归、分类、聚类和异常检测等。
Google MusicLMGoogle MusicLM 是一个由 Google AI 开发的人工智能音乐生成工具。它使用一种名为“Transformer”的深度学习模型,该模型可以学习大量音乐数据中的模式和规律。然后,该模型可以使用这些知识生成新的音乐。Google MusicLM 目前仍在开发中,但已经用于生成各种目的的音乐,包括:
根据mistral.ai官网,在2023年9月27日,Mistral AI 团队发布Mistral 7B。
Mistral 7B 是一个 7.3B 参数模型:
在所有基准测试中优于 Llama 2 13B
在许多基准测试中优于 Llama 1 34B
接近 CodeLlama 7B 的代码性能,同时在代码之外在英语任务上表现良好
使用分组查询注意力 (GQA) 加快推理速度
使用滑动窗口注意力 (SWA) 以更低的成本处理更长的序列
Mistral 7B 易于对任何任务进行微调。作为演示,Mistral AI 团队提供了一个针对聊天进行微调的模型,其性能优于 Llama 2 13B 聊天。
Mistral AI 团队将Mistral 7B 与 Llama 2 系列进行了比较,对于所有模型的所有指标,都使用Mistral AI 团队的评估流程进行了重新评估,以便进行准确比较。Mistral 7B 在所有指标上都明显优于 Llama 2 13B,与 Llama 34B 相当(由于 Llama 2 34B 未发布,Mistral AI 团队报告了 Llama 34B 的结果)。它在代码和推理基准方面也非常出色。
基准测试按其主题分类:常识推理:Hellaswag、Winogrande、PIQA、SIQA、OpenbookQA、ARC-Easy、ARC-Challenge和CommonsenseQA的0-shot。世界知识:NaturalQuestions和TriviaQA的5-shot。阅读理解:BoolQ和QuAC的0-shot。数学:8-shot GSM8K with maj@8和4-shot MATH with maj@4代码:Humaneval的0-shot和3-shot MBPP热门汇总结果:5-shot MMLU,3-shot BBH以及3-5-shot AGI Eval(仅包含英语多项选择问题)
论文中对prompt的每一条为啥要这样写都给出了理由,比如AI助手agent的prompt中有一条是“Always end your solution with: Next request”,这个是和AI用户agent要新一轮的指令,这样可以确保对话自动聊下去,这才是是非常关键的一点!!!是整个机制能自动run起来的关键。
Pika Labs是一家成立仅6个月、总融资额达5500万美元、估值达到2亿美元的初创公司。他们开发了一款名为Pika 1.0的AI视频生成工具,可以轻松生成和编辑3D动画、动漫、卡通和电影等各种类型的视频。这项创新技术迅速在硅谷引起轰动,吸引了大量投资者的追捧。
Pika 1.0不仅可以根据已有素材扩展视频,生成不同高宽比的内容,还可以实时精确编辑视频内容。你只需简单地用鼠标框选、输入关键词,就能在视频中添加所需的素材,例如给视频中的狒狒带上一个帅气的太阳镜。此外,你还可以通过框选人物范围并输入文字实现换装效果。根据用户提供的视频素材和提示词,Pika 1.0能够制作出各种不同风格的动画,涵盖了现有电影和动画的大部分风格。
对此,AI Agent的作者表示,「很高兴与大家分享一项不朽的成就,我们的 Web AI 代理刚刚通过在线加州驾驶考试创造了历史,成为第一个在加州获得驾驶执照的虚拟 AI!」「这标志着一个开创性的时刻:人工智能首次完全自主地完成现实世界的人类知识任务,这是人工智能的一小步,也是人类的一大步。」虽然多少有点夸张,但不得不说,还是挺神奇的。
AI Agent完全靠自己审题、作答、并点击下一道题。对于这样成功的表现,Jim Fan也是表达了祝贺:从去年开始,一些加州居民可以在网上参加驾驶考试的笔试部分,免去了他们需要花时间去考试机构所在地的麻烦。
The Information的报道指出,OpenAI即将设立一个由9人组成的董事会,其中新董事会的三位初始成员——主席Bret Taylor、前财政部长Larry Summers和Quora CEO Adam D’Angelo——预计将于本周得到正式确认。目前来看,D’Angelo将是唯一从解雇Altman的六人旧董事会中保留下来的成员。在关于OpenAI董事会的问题上,微软发言人表示“我们将等待董事会正式宣布”。截至目前,OpenAI、Thrive和Khosla尚未回应置评请求。