OpenAI 的 AI 检测工具

分享到社交媒体

我们训练了一个分类器来区分人类编写的文本和来自各种提供商的 AI 编写的文本。虽然不可能可靠地检测所有人工智能编写的文本,但我们相信好的分类器可以为人工智能生成的文本是由人类编写的虚假声明提供缓解措施:例如,运行自动错误信息活动,使用人工智能工具进行学术不诚实 以及将 AI 聊天机器人定位为人类。

https://openai.com/blog/new-ai-classifier-for-indicating-ai-written-text

 

OpenAI 的 AI 检测工具

我们的分类器并不完全可靠。 在我们对英语文本“挑战集”的评估中,我们的分类器正确地将 26% 的 AI 编写的文本(真阳性)识别为“可能是 AI 编写的”,同时错误地将 9% 的人类编写的文本标记为 AI 编写的时间(误报)。我们的分类器的可靠性通常会随着输入文本长度的增加而提高。与我们 之前发布的分类器相比,这个新的分类器在来自更新的 AI 系统的文本上明显更可靠。

我们正在公开提供此分类器,以获取有关此类不完善的工具是否有用的反馈。我们在检测 AI 生成的文本方面的工作将继续,我们希望在未来分享改进的方法。

 

分享到社交媒体