问答 2024-06-27 来自:开发者社区

在 ChatGPT 的训练过程中,RLHF 起了什么作用?

在 ChatGPT 的训练过程中,RLHF 起了什么作用?

文章 2023-05-10 来自:开发者社区

别为ChatGPT高兴太早!背后的RLHF机制还有三个致命缺陷

【新智元导读】ChatGPT证明了RLHF的强大能力,但这真的是走向通用人工智能的路吗?最近OpenAI发布了一个火爆全球的问答AI产品——ChatGPT,其中最令人印象深刻的就是它的「保护机制」,比如它不会为暴力行动提供建议、也不会为世界杯结果进行预测等等。但挑逗聊天机器人更像一个「猫鼠游戏」,用户们乐此不疲地寻找撬开ChatGPT的方式,而ChatGPT的开发者也在想方设法提升保护机制。Op....

别为ChatGPT高兴太早!背后的RLHF机制还有三个致命缺陷

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。