最新研究显示,ChatGP在创造性思维任务中或超越大部分人类 |
![]() |
来源:生物世界 2023-09-21 11:44
该研究指出,ChatGPT等基于大语言模型(LLM)的AI对话机器人在创造性思维任务上或能超越一般人类,该任务要求受试者想出日常用品的替代用途(发散性思维的一个例子)。挪威卑尔根大学、斯塔万格大学的研究人员在Scientific Reports期刊发表了题为:Best humans still outperform artificial intelligence in a creative divergent thinking task的研究论文。
该研究指出,ChatGPT等基于大语言模型(LLM)的AI对话机器人在创造性思维任务上或能超越一般人类,该任务要求受试者想出日常用品的替代用途(发散性思维的一个例子)。不过,得分最高的人类受试者依然能超过对话机器人的最佳答案。
发散性思维通常是指与创造性相关的一类思维过程,需要为特定任务想出各种不同创意或对策。发散性思维一般通过替代用途任务(Alternate Uses Task,AUT)进行评估,受试者被要求在短时间内想出某个日常用品的其他用途,越多越好。受试者的回答从四个类别进行打分:流利度、灵活性、原创性和精细度。
在这项研究中,研究团队让ChatGPT3、ChatGPT4和Copy.Ai以及人类受试者完成四个物品(绳子、盒子、铅笔、蜡烛)的替代用途任务(AUT),并比较了AI和人类的答案。研究团队通过语义距离(回答与物品原始用途的相关度)和创造性给回答的原创性打分,他们用一个计算方法在0-2的范围里量化语义距离,同时让不知道作答者身份的人类打分者在1-5的范围里客观评价创造性。
平均而言,AI的回答在语义距离(0.95 vs 0.91)和创造性(2.91 vs 2.47)的得分上显著高于人类的回答。人类回答在这两项的得分差距更大 最低分远低于AI的回答,但最高分普遍比AI高。最佳人类回答在 8个评分项中的7项都超过了所有对话机器人的最佳回答。
这些结果表明,当前的AI对话机器人想创意的能力至少已与一般人类相当。但论文作者也指出,他们只评价了涉及创造性评估的单项任务的表现。作者认为,今后的研究或能探索如何将AI融入创造性过程来提升人类表现。
版权声明 本网站所有注明“来源:100医药网”或“来源:bioon”的文字、图片和音视频资料,版权均属于100医药网网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:100医药网”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。 87%用户都在用100医药网APP 随时阅读、评论、分享交流 请扫描二维码下载->

- 相关报道
-
- 研究揭示两条催产素信号通路协同作用介导小鼠救援行为 (2025-05-14)
- 胖友福音!iScience研究发现,Akk可调节肠道真菌和代谢物,经PI3K/Akt通路改善肝脏脂质代谢 (2025-05-14)
- Nature:不止DNA序列!染色质环化是何时、为何诞生在动物身上的?这项研究找到“遗失的环节” (2025-05-14)
- 术后辅助适应症获批,阿美替尼加速三代EGFR (2025-05-14)
- Immunity:衰老癌细胞释放线粒体DNA,破坏抗肿瘤免疫 (2025-05-14)
- 北航/北大合作Nature论文:柔性电子贴片,实现向内脏器官细胞的精准高效递送 (2025-05-13)
- Nature:科学家首次绘制出果蝇大脑完整的神经系统地图 (2025-05-13)
- Cell:我国科学家揭示神经活动影响大脑脑膜淋巴系统发育 (2025-05-13)
- JECCR:红细胞,看错你了!科学家发现,红细胞与肿瘤细胞的直接或间接相互作用会促进肿瘤细胞表型变化,侵袭和迁移能力增强 (2025-05-13)
- Cell Res:我国学者首次使用现货通用型CAR (2025-05-13)
- 视频新闻
-
- 图片新闻
-
医药网免责声明:
- 本公司对医药网上刊登之所有信息不声明或保证其内容之正确性或可靠性;您于此接受并承认信赖任何信息所生之风险应自行承担。本公司,有权但无此义务,改善或更正所刊登信息任何部分之错误或疏失。
- 凡本网注明"来源:XXX(非医药网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件,意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。联系QQ:896150040