首页 > AI资讯 > 行业动态 > 腾讯公司申请大语言模型专利,为训练得到具有更优性能的大语言模型提供了更加丰富、训练效果更好的数据基础

腾讯公司申请大语言模型专利,为训练得到具有更优性能的大语言模型提供了更加丰富、训练效果更好的数据基础

新火种    2023-12-13

金融界2023年12月4日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司申请一项名为“大语言模型训练方法、文本处理方法及装置”,公开号CN117149989A,申请日期为2023年11月。

专利摘要显示,本申请实施例提供了一种大语言模型训练方法、文本处理方法及装置,涉及人工智能、云技术、自然语言处理及机器学习等领域。该方法包括:获取训练样本集;训练样本集包括多个训练样本;多个训练样本包括多个第一训练样本和多个第二训练样本;第一训练样本为预测准确度大于预设阈值的训练样本;第二训练样本为预测准确度小于预设阈值的训练样本;基于训练样本集对初始奖励模型进行训练,得到训练好的奖励模型;基于奖励模型对预训练大语言模型进行训练,得到训练好的大语言模型。本申请实施例为训练得到具有更优性能的大语言模型提供了更加丰富、训练效果更好的数据基础,更好的满足了实际应用需求。

相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。