亚洲资本网 > 资讯 > 热播 > 正文
DeepMind发布提高翻译质量的算法ReST
2023-08-28 12:45:31来源: 鞭牛士


【资料图】

谷歌DeepMind于8月21日发布论文,提出一种使LLM与人类偏好对齐更简单的算法ReST(Reinforced Self-Training)。不同于RLHF(基于人类反馈的强化学习)使用人类反馈改进语言模型,ReST通过生成和使用离线数据进行训练,从而使得LLM与人类偏好保持一致。研究团队表示,虽然ReST可用于所有生成任务,但本文的重点是机器翻译。研究者在机器翻译任务上进行了实验,测试基准包括IWSLT 2014、WMT 2020和Web Domain。结果表明,ReST可以极大地提高翻译质量。

关键词:

专题新闻
  • 培养综合素质,科大讯飞AI学习机LUMIE 10系列让孩子在快乐中成长
  • 菏泽尧舜牡丹生物科技有限公司(关于菏泽尧舜牡丹生物科技有限公司简述)
  • 郑州“夏日招聘夜市”走进万达商圈|关注高校毕业生就业
  • 自首后,特朗普狂揽710万美元竞选资金
  • 汕尾陆河创新禁毒宣传形式,将禁毒宣传与足球相结合
  • 致命失误!米尔斯空砍21+5+6,两战46分创纪录,无缘两连胜

京ICP备2021034106号-51

Copyright © 2011-2020  亚洲资本网   All Rights Reserved. 联系网站:55 16 53 8 @qq.com