DeepMind发布提高翻译质量的算法ReST
(相关资料图)
谷歌DeepMind于8月21日发布论文,提出一种使LLM与人类偏好对齐更简单的算法ReST(Reinforced Self-Training)。不同于RLHF(基于人类反馈的强化学习)使用人类反馈改进语言模型,ReST通过生成和使用离线数据进行训练,从而使得LLM与人类偏好保持一致。研究团队表示,虽然ReST可用于所有生成任务,但本文的重点是机器翻译。研究者在机器翻译任务上进行了实验,测试基准包括IWSLT 2014、WMT 2020和Web Domain。结果表明,ReST可以极大地提高翻译质量。
关键词:

DeepMind发布提高翻译质量的算法ReST


程一笑:快手自研大语言模型「快意」已开启内测


Meta推出可转录和翻译近百种语言的AI模型


快手千万级主播刘二狗宣布无限期停播


鞭牛晚报:快手百度发布Q2财报,新款Model 3预计9月底量产;软银旗下Arm申请上市


泡泡玛特2023上半年营收28.14亿,净利润同比增长42.3%

相关新闻