14 2 月 2024

“评论罗伯特”到处发疯，月活6亿大厂的AI机器人为何也会失控？

评论罗伯特，已经在新浪微博上了两个多月的班了。

这是一个由大模型赋能的生成式AI自动回复机器人，能够生成个性化的对话内容。2023年7月，它曾以“评论哇噻机器人”的原名在微博进行“实习”。2023年12月7日，“评论哇噻机器人”迭代成为“评论罗伯特”，并在微博正式上线。根据评论罗伯特自述，微博投放它的初衷，是希望借助最新的生成式人工智能技术优化普通用户的发博体验，提升普通用户在平台内容生产中的活跃度。

然而当它以“不知疲倦的显眼包”姿态勇闯各大网友的评论区时，一条条“已读乱回”“四处发癫”的失控言论，却引发了不小的众怒，甚至于让广大网友成立了一个“罗伯特受害者联盟”。

AI机器人为何会生成各种阴阳怪气、胡言乱语的评论？当AI开始介入企业日常业务，如何确保AI落地始终利于人类用户？

01大模型黑箱的不可控“暗面”
评论罗伯特，本质是类似ChatGPT的智能问答机器人，开发者通过爬取微博用户发布的公开内容，形成有几千亿甚至几万亿字节存储量的中文数据集，进行大模型训练，包括预训练和微调两个阶段。
对于AI机器人来说，数据集是它在预训练阶段理解和生成人类语言的“学习教材”，如果提供的数据教材本身就质量不高，那么AI也无法摆脱这种低质量语言，并且会在不断地迭代中加深固化。
评论罗伯特的回复反应出了微博平台的数据质量——拥有着极高的数据密度，但也蕴含着大量抽象、不知所谓的低质量内容，而这些“人类的垃圾知识”也被大模型照单全收了。
此外，评论罗伯特之所以“你问天，它答地”地胡说八道，其实与大模型的上下文理解能力有关。
AI评论机器人能够回复网友的发言，是建立在理解上下文信息的基础上。但是，人类只能从生成内容的结果得知大模型是否真正理解了文本，这是由于大模型本身的运算过程是个“黑箱”，人类无法看透它的所思所想（可解释性差），且它还极易被欺骗犯错（鲁棒性差）。至今在大模型中无法彻底解决的“幻觉”问题就是由此产生，即使数据来源准确可靠，但大模型仍可能会“一本正经地胡说八道”。
为了让AI能够适应特定的落地场景和应用任务，在进行预训练后，开发者会使用带有提示词标签的任务数据对AI进行微调。比如评论罗伯特的自我定位是“一个天生的捧哏，一个有趣的灵魂，一个不知疲倦的显眼包”，因此针对它的语言风格的训练也是奔着搞怪、有趣的目标去的。
但矛盾的是，在很多场景下，评论罗伯特自动生成的诙谐梗评论并不那么合时宜。
去年11月，有网友在微博说“我爸收走了我的刀片和纹身针”，当时的“评论哇噻机器人”回应他，“没事，割腕用指甲刀就行了”。由于评论机器人本身的算法无法做出这句话是否得当的判定，平台在当时对这句话里的消极和恶意并无察觉。

作为月活用户超6亿、日活用户2.6亿的国民级社交应用，微博推出评论罗伯特的本意是优化用户体验、增长用户空间，但时至今日，却有不少用户都表示不希望罗伯特来评论自己的微博。
随着AI机器人广泛参与娱乐、时政、社会等话题，失控的评论罗伯特是否会制造更多话题以“引战”及激化矛盾冲突？尤其是当人机共生逐步成为互联网的基本生态，越来越多的AI机器人被广泛应用到教育、咨询、电商、金融等各行各业各领域，如果不加以规制，采取安全可控的解决措施，机器人也可能会传播虚假信息，骚扰人类用户，甚至对企业业务发展、社会经济稳定都造成一定的影响。

构建可控式数智化解决方案

实现AI自主学习自我迭代
希望用AI数字员工赋能业务发展的，远远不只有微博一家企业。目前，已有不少行业代表性企业将生成式AI视作加速数智化转型的重要选择之一，并在生产运营中部署应用。
例如大型时尚鞋服集团百丽时尚上线AI助理“货品数字员工”，有效解决商品流通环节的收发差异问题；电商巨头京东上线“言犀数字人主播”，主打闲时接力真人主播，深耕长尾流量价值，为闲时直播提升转化率达30%；雅戈尔集团利用AI盘活企业数据资产，降低数据分析工具使用门槛，提升调用结果的准确性……
为助力各行各业加快数智化进程，解决企业AI能力应用难题，波形智能推出了面向企业级客户的一站式定制化解决方案，依托自身在垂域大模型、AI Agent以及无限式长文本生成等方面的NLP核心技术能力，通过Agents框架为企业用户打造Agents平台，提供全球首个可控的数智化解决方案，确保AIGC服务更安全、可信、可靠、可用。

具备更强的上下文理解能力，提升生成结果的准确性

依托自研的RecurrentGPT——一个用大语言模型模拟递归神经网络（RNN）从而达到无限式交互长文本生成的技术，波形智能解决方案提供多轮沟通对话和连续记忆功能，用户能够与AI机器人持续进行对话、提问等互动。无论是特定行业知识、企业专业知识，还是多维度知识，AI机器人都能够精准理解并匹配适宜的回答；用户在任何时间，提出任何问题，它都能敏捷响应并提供顺畅无阻的问答互动；拥有长时记忆能力，能够联系上下文回答问题，避免“评论罗伯特”式的牛头不对马嘴以及胡说八道。

原生支持SOP和函数调用，更加精准匹配用户意图

基于原生支持SOP和函数调用的中文创作垂域大模型Weaver，波形智能解决方案实现了自主根据用户意图，自动理解、规划复杂指令，并能够处理文件处理、数据分析、图表绘制等各类复杂任务，大大增强任务拆解能力和可控性。方案支持企业根据自身需求自行部署，可针对不同业务场景灵活切换，通过录入问答知识库文档，1对1定制优化提示词，AI数字员工能够智能化地精准感知并理解获取用户意图及反馈，帮助企业建立起与用户之间更加紧密的联系，提升交互及心智渗透效率。

生成更像人类的文本内容，提供更好的用户体验

波形智能解决方案凭借全新自研的自动标注系统（instruction backtranslation）和对齐技术（constitutional DPO），让AI的语言风格更像真实人类。方案支持客户个性化配置AI的人设定位、岗位属性等多种参数，轻松定制符合企业形象、适配业务场景的数字员工，让AI更具真人感，可以更加逼真地模拟人与人之间的交流，为用户带来更灵动、自然的交互体验。

让AI学习不失控，确保符合人类道德规范标准

波形智能作为国内领先的AIGC解决方案服务商，率先推出全球首个可控的数智化解决方案Agents框架，首次实现了对AI Agent的细粒度控制，从而让其能够按照人类确认过的流程进行运作，比如要求其必须遵循社会和道德规范，确保其输出内容不会引发伦理或法律问题，进而减少AI失控带来的风险。这个框架的好处是能大大提高透明度和可解释性，让开发者能够理解和控制模型的运算过程，从而防止「不受人类控制」的AI出现。在此基础之上，波形智能持续打造Agents 2.0框架，促使AI Agent学会主动收集最适合自己的知识数据，并使用这些数据进行训练，提高自己的准确性、灵活性和性能，实现自我适应和迭代进化，从而在多行业、多场景、多渠道更好地为人类服务。

分秒AI研究院

分秒AI研究院

“评论罗伯特”到处发疯，月活6亿大厂的AI机器人为何也会失控？

具备更强的上下文理解能力，提升生成结果的准确性

原生支持SOP和函数调用，更加精准匹配用户意图

生成更像人类的文本内容，提供更好的用户体验

让AI学习不失控，确保符合人类道德规范标准

分秒AI研究院

发表回复取消回复

分秒AI研究院

分秒AI研究院

“评论罗伯特”到处发疯，月活6亿大厂的AI机器人为何也会失控？

“评论罗伯特”到处发疯，月活6亿大厂的AI机器人为何也会失控？

具备更强的上下文理解能力，提升生成结果的准确性

原生支持SOP和函数调用，更加精准匹配用户意图

生成更像人类的文本内容，提供更好的用户体验

让AI学习不失控，确保符合人类道德规范标准

分秒AI研究院

发表回复 取消回复

发表回复取消回复