“评论罗伯特”到处发疯,月活6亿大厂的AI机器人为何也会失控?

评论罗伯特,已经在新浪微博上了两个多月的班了。

这是一个由大模型赋能的生成式AI自动回复机器人,能够生成个性化的对话内容。2023年7月,它曾以“评论哇噻机器人”的原名在微博进行“实习”。2023年12月7日,“评论哇噻机器人”迭代成为“评论罗伯特”,并在微博正式上线。 根据评论罗伯特自述,微博投放它的初衷,是希望借助最新的生成式人工智能技术优化普通用户的发博体验,提升普通用户在平台内容生产中的活跃度


然而当它以“不知疲倦的显眼包”姿态勇闯各大网友的评论区时,一条条“已读乱回”“四处发癫”的失控言论,却引发了不小的众怒,甚至于让广大网友成立了一个“罗伯特受害者联盟”。

AI机器人为何会生成各种阴阳怪气、胡言乱语的评论?当AI开始介入企业日常业务,如何确保AI落地始终利于人类用户?

01大模型黑箱的不可控“暗面”
评论罗伯特,本质是类似ChatGPT的智能问答机器人,开发者通过爬取微博用户发布的公开内容,形成有几千亿甚至几万亿字节存储量的中文数据集,进行大模型训练,包括预训练和微调两个阶段。
对于AI机器人来说,数据集是它在预训练阶段理解和生成人类语言的“学习教材”,如果提供的数据教材本身就质量不高,那么AI也无法摆脱这种低质量语言,并且会在不断地迭代中加深固化。 
评论罗伯特的回复反应出了微博平台的数据质量——拥有着极高的数据密度,但也蕴含着大量抽象、不知所谓的低质量内容,而这些“人类的垃圾知识”也被大模型照单全收了。
此外,评论罗伯特之所以“你问天,它答地”地胡说八道,其实与大模型的上下文理解能力有关。
AI评论机器人能够回复网友的发言,是建立在理解上下文信息的基础上。但是,人类只能从生成内容的结果得知大模型是否真正理解了文本,这是由于大模型本身的运算过程是个“黑箱”,人类无法看透它的所思所想(可解释性差),且它还极易被欺骗犯错(鲁棒性差)。至今在大模型中无法彻底解决的“幻觉”问题就是由此产生,即使数据来源准确可靠,但大模型仍可能会“一本正经地胡说八道”。
为了让AI能够适应特定的落地场景和应用任务,在进行预训练后,开发者会使用带有提示词标签的任务数据对AI进行微调。比如评论罗伯特的自我定位是“一个天生的捧哏,一个有趣的灵魂,一个不知疲倦的显眼包”,因此针对它的语言风格的训练也是奔着搞怪、有趣的目标去的。
但矛盾的是,在很多场景下,评论罗伯特自动生成的诙谐梗评论并不那么合时宜。
去年11月,有网友在微博说“我爸收走了我的刀片和纹身针”,当时的“评论哇噻机器人”回应他,“没事,割腕用指甲刀就行了”。由于评论机器人本身的算法无法做出这句话是否得当的判定,平台在当时对这句话里的消极和恶意并无察觉。

作为月活用户超6亿、日活用户2.6亿的国民级社交应用,微博推出评论罗伯特的本意是优化用户体验、增长用户空间,但时至今日,却有不少用户都表示不希望罗伯特来评论自己的微博。
随着AI机器人广泛参与娱乐、时政、社会等话题,失控的评论罗伯特是否会制造更多话题以“引战”及激化矛盾冲突?尤其是当人机共生逐步成为互联网的基本生态,越来越多的AI机器人被广泛应用到教育、咨询、电商、金融等各行各业各领域,如果不加以规制,采取安全可控的解决措施,机器人也可能会传播虚假信息,骚扰人类用户,甚至对企业业务发展、社会经济稳定都造成一定的影响。

构建可控式数智化解决方案

实现AI自主学习自我迭代
希望用AI数字员工赋能业务发展的,远远不只有微博一家企业。目前,已有不少行业代表性企业将生成式AI视作加速数智化转型的重要选择之一,并在生产运营中部署应用。
例如大型时尚鞋服集团百丽时尚上线AI助理“货品数字员工”,有效解决商品流通环节的收发差异问题;电商巨头京东上线“言犀数字人主播”,主打闲时接力真人主播,深耕长尾流量价值,为闲时直播提升转化率达30%;雅戈尔集团利用AI盘活企业数据资产,降低数据分析工具使用门槛,提升调用结果的准确性……
为助力各行各业加快数化进程,解决企业AI能力应用难题,波形智能推出了面向企业级客户的一站式定制化解决方案,依托自身在垂域大模型、AI Agent以及无限式长文本生成等方面的NLP核心技术能力,通过Agents框架为企业用户打造Agents平台,提供全球首个可控的数智化解决方案,确保AIGC服务更安全、可信、可靠、可用。

  备更强的上下文理解能力,提升生成结果的准确

依托自研的RecurrentGPT——一个用大语言模型模拟递归神经网络(RNN)从而达到无限式交互长文本生成的技术,波形智能解决方案提供多轮沟通对话和连续记忆功能,用户能够与AI机器人持续进行对话、提问等互动。无论是特定行业知识、企业专业知识,还是多维度知识,AI机器人都能够精准理解并匹配适宜的回答;用户在任何时间,提出任何问题,它都能敏捷响应并提供顺畅无阻的问答互动;拥有长时记忆能力,能够联系上下文回答问题,避免“评论罗伯特”式的牛头不对马嘴以及胡说八道。

原生支持SOP和函数调用,更加精准匹配用户意图

基于原生支持SOP和函数调用的中文创作垂域大模型Weaver,波形智能解决方案实现了自主根据用户意图,自动理解、规划复杂指令,并能够处理文件处理、数据分析、图表绘制等各类复杂任务,大大增强任务拆解能力和可控性。方案支持企业根据自身需求自行部署,可针对不同业务场景灵活切换,通过录入问答知识库文档,1对1定制优化提示词,AI数字员工能够智能化地精准感知并理解获取用户意图及反馈,帮助企业建立起与用户之间更加紧密的联系,提升交互及心智渗透效率。

生成更像人类的文本内容,提供更好的用户体验

波形智能解决方案凭借全新自研的自动标注系统(instruction backtranslation)和对齐技术(constitutional DPO),让AI的语言风格更像真实人类。方案支持客户个性化配置AI的人设定位、岗位属性等多种参数,轻松定制符合企业形象、适配业务场景的数字员工,让AI更具真人感,可以更加逼真地模拟人与人之间的交流,为用户带来更灵动、自然的交互体验。    

让AI学习不失控,确保符合人类道德规范标准

波形智能作为国内领先的AIGC解决方案服务商,率先推出全球首个可控的数智化解决方案Agents框架,首次实现了对AI Agent的细粒度控制,从而让其能够按照人类确认过的流程进行运作,比如要求其必须遵循社会和道德规范,确保其输出内容不会引发伦理或法律问题,进而减少AI失控带来的风险。这个框架的好处是能大大提高透明度和可解释性,让开发者能够理解和控制模型的运算过程,从而防止「不受人类控制」的AI出现。在此基础之上,波形智能持续打造Agents 2.0框架,促使AI Agent学会主动收集最适合自己的知识数据,并使用这些数据进行训练,提高自己的准确性、灵活性和性能,实现自我适应和迭代进化,从而在多行业、多场景、多渠道更好地为人类服务。

发表回复