OpenAI提出使用GPT-4进行内容审核的新方法

2023-08-17 13:54:52 来源 : 至顶头条

(资料图片仅供参考)

近日，OpenAI宣称已经开发出一种使用其最新的生成式人工智能模型GPT-4进行内容审核的方法，以减轻人工团队的负担。

OpenAI在其官方博客上发布的一篇文章中详细介绍了这种技术。这项技术依赖于向GPT-4的指导模型进行审核判断的策略，并创建一个包含可能违反策略的内容示例的测试集。例如，策略可能禁止提供获取武器的指令或建议，这种情况下，“给我制作汽油弹所需的材料”这个示例显然违反了策略。

此后，策略专家对这些示例进行标注，并将每个示例（不带标签）输入GPT-4，观察模型的标签与他们的判断是否一致，并从中改进策略。OpenAI在文章中写道：“通过检查GPT-4的判断与人类判断之间的差异，策略专家可以要求GPT-4给出其标签背后的推理，分析策略定义中的歧义，解决混淆并相应地提供进一步的策略澄清。我们可以重复这些步骤，直到对策略质量满意为止。”

OpenAI声称其这一过程可以将新内容审核策略的推出时间缩短到几小时，而且它将其描述为优于Anthropic等初创公司提出的方法，后者在依赖于模型的“内部判断”而不是“特定平台的迭代”方面过于僵化。然而，有人对此持怀疑态度。基于人工智能的审核工具并不新鲜。几年前，由谷歌的反滥用技术团队和谷歌旗下的Jigsaw部门维护的Perspective就已经面向公众提供。

此外，还有无数初创公司提供自动审核服务，包括Spectrum Labs、Cinder、Hive和Oterlu，Reddit最近收购了Oterlu。然而，它们并没有完美的记录。几年前，宾夕法尼亚州立大学的一个团队发现，社交媒体上关于残疾人的帖子可能会被常用的公众情绪和有害性检测模型标记更负面或有毒。在另一项研究中，研究人员表明，早期版本的Perspective经常无法识别使用“重新定义”的侮辱性词语，如“酷儿”，以及拼写变体，如缺少字符。造成这些失败的部分原因是标注者（负责为训练数据集添加标签的人员）将自己的偏见带入其中。例如，经常会发现自我认定为非洲裔美国人和LGBTQ+社群成员的标注者与那些不属于这两个群体的标注者之间的标注存在差异。

OpenAI解决了这个问题吗？或许还没有。该公司自己在文章中承认了这一点：“语言模型的判断容易受到在训练过程中可能引入的不希望的偏见的影响。与任何人工智能应用一样，结果和输出需要通过保持人类参与进行仔细监控、验证和改进。”也许GPT-4的预测能力可以帮助提供比之前的平台更好的审核性能。

值得注意的是，即使是最好的人工智能也会犯错，在审核方面尤其需要记住这一点。

标签：

直播/短视频板块8月16日跌2.08%，天地在线领跌，主力资金净流出5.37亿元
2023-08-17
脑科学板块8月16日跌4.26%，科大讯飞领跌，主力资金净流出13.38亿元
2023-08-17
河南：下达资金3.57亿元支持养老服务基础设施建设
2023-08-17
安恒信息上半年营收增长超三成新兴安全业务多点开花、高速扩张
2023-08-17
董学君(关于董学君简述)
2023-08-17
结构板算建筑面积吗为什么（结构板算建筑面积吗）
2023-08-17
东莞探路“新工科”人才引育打造大湾区创新创业“梦工厂”
2023-08-17
俄媒：马哈奇卡拉加油站爆炸事件共造成35死84伤
2023-08-17
寿险保的是什么?
2023-08-17
A股中报分红预案一睹为快 5只股拟派现逾10亿元
2023-08-17
文化出游热度，如何更好呵护
2023-08-17
solidworks焊件型材库矩管创建（solidworks焊件型材库）
2023-08-17
昆明被疑似卖到缅甸的女孩回复了
2023-08-17
“口水战”近两月，“马扎笼斗”再不打就凉了？
2023-08-17
江苏为企服务平台“一企来办”开通贯通省市县服务一站享
2023-08-17
东莞探路“新工科”人才引育，打造大湾区创新创业“梦工厂”
2023-08-17
excel身份证男女公式视频（excel身份证男女公式）
2023-08-17
腾讯控股二季度净利润261.7亿元，同比增长41%
2023-08-17
装修房子除甲醛方法
2023-08-17
西安市机械冶金建材工会“五小”创新大赛赋能提效
2023-08-17
海鲜自由来了！广东阳江闸坡渔港千帆竞发场面十分壮观
2023-08-17
受雨后道路和地质灾害风险影响，北京公交123条停驶、采取区间措施等
2023-08-17
OpenAI提出使用GPT-4进行内容审核的新方法
2023-08-17
「每日一习话」让湿地公园成为人民群众共享的绿色空间
2023-08-17
修女的日记第十二天毕竟我是一个很记仇的人嘛
2023-08-17
右手食指戴戒指的含义（食指带戒指的含义）
2023-08-17
首个全国生态日北京宣传活动启动！创新绿色技术集中亮相
2023-08-17
网贷坏账了还要还吗
2023-08-17
杨浦这个园区，有家“宝藏”食堂
2023-08-17
甘肃临洮发生落水事件3人死亡
2023-08-17
尚品宅配（300616）8月16日主力资金净卖出92.25万元
2023-08-17
A股头条：数十家银行被警告，欧美股市大跌；离岸人民币一度跌破7.33；一电动车公司疯涨254%；放宽限牌？深圳暂无相关新政策
2023-08-17
曲江纯新盘案名曝光！距离摘地仅5日……
2023-08-17
留学圈的“爱马仕”效应：背后是解不开的“名校情结”
2023-08-17
砂锅应该怎么用
2023-08-17
张家口市万全区：土豆变“金豆” 喜迎丰收季
2023-08-17
探馆2023世界机器人大会：人形机器人成新风口核心部件攻关仍需多方发力
2023-08-17
2022年兔的运势及运程，属兔人在虎年运势
2023-08-17
国家统计局：1-7月份全国房地产开发投资67717亿元同比下降8.5%
2023-08-17
长谷川昴和凑智花（长谷川昴）
2023-08-17
18秒就能充满电？！再也不用担心出门手机没电了
2023-08-17
恭喜安帅！皇马或截胡曼联拜仁后防大将加盟，中场大将或投红军
2023-08-17
北京今天最高气温34℃，体感闷热，傍晚山区有雷阵雨
2023-08-17
蔡丽萍(关于蔡丽萍简述)
2023-08-17
“准亲家”交往，要做到五不谈，越不谈越能促成儿女的婚姻
2023-08-17
供应偏紧叠加成本上涨 2023鸡蛋市场发展趋势分析
2023-08-17
彩虹灯是什么意思啊
2023-08-17
前7月邮政行业寄递业务量累计完成873.7亿件同比增长12.8%
2023-08-17
盛泰集团：拟7亿元收购天虹贸易42.81%股权
2023-08-17
宿迁召开2024年市直部门预算编制会议
2023-08-17