“腾讯DRT-o1模型升级:AI翻译新境界”
近日,腾讯研究院发布了全新的DRT-o1系列模型,该模型利用长思维链(long chain-of-thought,简称CoT)技术,在文学作品的翻译方面取得了显著突破,尤其是对比喻和隐喻等修辞手法的处理,大大提升了翻译质量。
随着神经机器翻译(NMT)技术的不断进步,日常文本的翻译已经得到了显著提升。然而,在处理文学作品时,尤其是那些含有丰富文化和语境含义的隐喻和明喻等修辞手法时,仍存在一定的挑战。传统的直译往往无法准确传达原文的内涵。针对这一难题,腾讯研究院开发了DRT-o1系统,为文学作品翻译提供了新的解决方案。
该项目的研究人员从古腾堡计划中精选了400本公共领域的英文书籍,提取了577600个句子,并从中筛选出63000个包含明喻和隐喻的句子,用于训练模型进行深度思考。DRT-o1采用了一种创新的多智能体框架,其中包括翻译员、顾问和评估员三个角色。翻译员负责初步翻译,顾问提供修改建议,评估员则根据预设指标对翻译质量进行评分。通过反复迭代,模型的翻译质量得到了显著提升。
DRT-o1的工作流程分为三个主要步骤:首先是关键词翻译,翻译者识别句子中的关键词并提供相应的翻译;其次是初步翻译,翻译者根据源句子和关键词的双语对应关系提供一个初步的翻译;最后是翻译精炼循环,顾问和评估员根据反馈和评分标准,对翻译进行优化。
最终,DRT-o1的翻译结果将由GPT-4o进行润色,以确保翻译的流畅性和可读性。目前,该模型已经完成了22264个深度思考的机器翻译样本。
以一句原文为例:“The mother, with her feet propped up on a stool, seemed to be trying to get to the bottom of that answer, whose feminine profundity had struck her all of a heap.”DRT-o1将其翻译为:“母亲将双脚搭在凳子上,似乎在努力探究那个答案,那答案中女性特有的深刻性令她猛然心生震撼。”这个翻译不仅传达了原文的意思,还保留了原文的情感色彩。
在性能方面,DRT-o1系列包括DRT-o1-7B和DRT-o1-14B两个版本。实验结果表明,与Qwen2.5-7B-Instruct相比,DRT-o1-7B的BLEU分数提高了8.26分,CometScore提高了3.36分;与Qwen2.5-14B-Instruct相比,DRT-o1-14B的BLEU提高了7.33分,CometScore提高了1.66分。DRT-o1-7B的性能甚至超过了更大的模型QwQ-32B,BLEU分数高出7.82分,CometScore高出1.46分,显示出其在处理复杂语言结构方面的强大能力。