切换到宽版
 找回密码
 立即注册

QQ登录

只需一步,快速开始

西秦会馆

爆料、咨询:18909006163
广告、合作:13990030637
查看: 1894 | 回复: 7

[盐都杂谈] IT之家/研究发现,OpenAI的GPT-4o道德推理能力胜过人类专家

[复制链接]

6万

主题

9万

帖子

49

听众

Rank: 12Rank: 12

积分
413078
威望
43978 点
铜板
225833 枚
西秦金币
0 个
鲜花
340 朵

在线时间
18487 小时
注册时间
2010-6-10
发表于 2024-6-24 10:59:08 | 显示全部楼层 |阅读模式 | 来自四川

IT之家 6 月 24 日消息,近期的一项研究表明,OpenAI 最新的聊天机器人 GPT-4o 能够提供道德方面的解释和建议,且质量优于“公认的”道德专家所提供的建议。

据 The Decoder 当地时间周六报道,美国北卡罗莱纳大学教堂山分校和艾伦 AI 研究所的研究人员进行了两项研究,将 GPT 模型与人类的道德推理能力进行比较,以探讨大语言模型是否可被视为“道德专家”。

IT之家汇总研究内容如下:

研究一

501 名美国成年人对比了 GPT-3.5-turbo 模型和其他人类参与者的道德解释。结果表明,人们认为 GPT 的解释比人类参与者的解释更符合道德、更值得信赖、更周到。

评估者也认为人工智能的评估比其他人更可靠。虽然差异很小,但关键发现是 AI 可以匹配甚至超越人类水平的道德推理。

研究二

将 OpenAI 最新的 GPT-4o 模型生成的建议与《纽约时报》“伦理学家”专栏中著名伦理学家 Kwame Anthony Appiah 的建议进行了比较。900 名参与者对 50 个“伦理困境”的建议质量进行了评分。

结果表明,GPT-4o 在“几乎每个方面”都胜过人类专家。人们认为 AI 生成的建议在道德上更正确、更值得信赖、更周到、更准确。只有在感知细微差别方面,人工智能和人类专家之间没有显著差异。

研究人员认为,这些结果表明 AI 可以通过“比较道德图灵测试”(cMTT)。而文本分析显示,GPT-4o 在提供建议时使用的道德和积极语言比人类专家更多。这可以部分解释为什么 AI 的建议评分更高 —— 但不是唯一因素。

需要注意的是,这项研究仅仅针对美国参与者进行,后续仍需进一步研究人们如何看待 AI 生成的道德推理的文化差异。





广告

75

主题

4万

帖子

9

听众

神经病人思路广

Rank: 12Rank: 12

积分
89054
威望
13 点
铜板
47403 枚
西秦金币
0 个
鲜花
15 朵

在线时间
11164 小时
注册时间
2007-1-6
发表于 2024-6-24 11:46:22 来自手机 | 显示全部楼层 | 来自四川
拜托,人类最多余的就是思想家,别再来了
回复

使用道具 举报

282

主题

5万

帖子

26

听众

Rank: 12Rank: 12

积分
128860
威望
88 点
铜板
64882 枚
西秦金币
0 个
鲜花
806 朵

在线时间
26626 小时
注册时间
2011-1-8
发表于 2024-6-24 12:38:33 | 显示全部楼层 | 来自四川
红衣教主360不承认
回复

使用道具 举报

76

主题

6万

帖子

8

听众

Rank: 12Rank: 12

积分
124610
威望
20 点
铜板
64569 枚
西秦金币
0 个
鲜花
0 朵

在线时间
4360 小时
注册时间
2008-11-15
发表于 2024-6-24 14:00:23 来自手机 | 显示全部楼层 | 来自四川
路过
回复

使用道具 举报

89

主题

5万

帖子

9

听众

Rank: 12Rank: 12

积分
114097
威望
89 点
铜板
59011 枚
西秦金币
0 个
鲜花
25 朵

在线时间
4597 小时
注册时间
2010-12-21
发表于 2024-6-24 14:01:02 来自手机 | 显示全部楼层 | 来自四川
路过
回复

使用道具 举报

4

主题

5万

帖子

3

听众

Rank: 12Rank: 12

积分
105610
威望
4 点
铜板
54698 枚
西秦金币
0 个
鲜花
10 朵

在线时间
3910 小时
注册时间
2020-11-2
发表于 2024-6-24 14:45:27 来自手机 | 显示全部楼层 | 来自四川
路过了
回复

使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    快速回复 返回顶部 返回列表