Notice: Function _load_textdomain_just_in_time was called incorrectly. Translation loading for the advanced-cron-manager domain was triggered too early. This is usually an indicator for some code in the plugin or theme running too early. Translations should be loaded at the init action or later. Please see Debugging in WordPress for more information. (This message was added in version 6.7.0.) in /www/wwwroot/www.help4uu.com/wp-includes/functions.php on line 6121
OpenAI已训练CriticGPT模型:基于GPT-4 用于发现ChatGPT生成内容错误 | 科技云

OpenAI已训练CriticGPT模型:基于GPT-4 用于发现ChatGPT生成内容错误

近日消息,据外媒报道,随着GPT系列大模型的不断升级,OpenAI所训练的ChatGPT也在拥有更强的能力,但这也带来了一些挑战,它所生成的内容中存在的错误也越来越隐蔽,逐渐到了AI训练师难以发现的程度。

OpenAI已训练CriticGPT模型:基于GPT-4 用于发现ChatGPT生成内容错误

而为了应对这一挑战,OpenAI也想出了新招,他们基于GPT-4模型,训练了一个用于发现ChatGPT输出代码错误的模型。

OpenAI当地时间周四,已在官网宣布了这一消息,他们训练的模型名为CriticGPT,从名称来看就是用于发现不足,以便让相关的应用变得更好。

从OpenAI在官网公布的消息来看,CriticGPT在他们的应用中有不错的效果,他们发现在新模型的辅助下,使用者在检查ChatGPT的输出代码时,比没有CriticGPT的协助要好60%。

在官网上,OpenAI提到,他们也是通过RLHF (从人类反馈中强化学习,Reinforcement Learning from Human Feedback)来训练CriticGPT,与训练ChatGPT类似。但与训练ChatGPT不同的是,他们在训练CriticGPT时,看了大量包含错误的输入。

虽然CriticGPT能帮助发现更多的问题,但也存在不足,还有改进的空间。OpenAI在官网上就提到,并不是所有的发现都是准确的,用于训练的ChatGPT生成内容也普遍很短,还需要开发新的方式,以协助训练师理解更长和更复杂的任务。

此外,OpenAI在官网上也提到,在研发CriticGPT的过程中,他们发现将RLHF应用于GPT-4时,能帮助生成更好的RLHF数据,他们计划扩大这一项工作的规模,并付诸实践。

文章来源于互联,不代表科技云立场!如有侵权,请联系我们。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注