DataGemma助力谷歌提升AI准确性
谷歌推出基于数据共享的全新语言模型版本DataGemma,助力解决大型语言模型中的幻觉问题
近日,科技媒体magnagtive发布了一篇关于谷歌推出基于数据共享的全新语言模型版本DataGemma的新闻报道。据悉,这个名为DataGemma的新版本旨在解决大型语言模型(LLMs)在处理数值或统计数据时可能出现的幻觉问题。为此,谷歌利用了谷歌数据共享(Data Commons)中的真实世界统计数据,为用户提供了更加准确的信息输出。
DataGemma模型的核心在于两种关键技术:检索交错生成(RIG)和检索增强生成(RAG)。这两种方法通过在生成过程中将模型基于现实世界数据,从而减少幻觉现象。其中,RIG技术通过主动查询可信来源,再生成回答;而RAG技术则在生成回答之前,会从数据共享平台检索相关信息,进一步提升了回答的质量。
谷歌对RIG和RAG的研究尚处于初期阶段,但初步成果已经显示出其在处理数值事实和统计查询方面的显著提升。通过对现实世界数据的嵌入,DataGemma模型在确保输出的同时,也考虑到了数据的准确性和全面性,有助于用户更好地理解和掌握相关知识。
尽管谷歌对于RIG和RAG的技术研究还处在起步阶段,但这些初步成果已经展示了其在帮助语言模型判断何时依赖外部数据与内部参数方面的潜力。未来,随着技术的不断发展和完善,我们期待Google能够为用户提供更加准确、全面的语言服务。