国际最新研究：人工智能在创造性思维任务中或超越大部分人类-爱冒险的八月

公众号：小姨ai

导读：中新网北京9月16日电 (记者孙自法)施普林格自然旗下开放获取学术期刊《科学报告》最新发表一篇人工智能(AI)研究论文指出，大型语言模型(LLM)AI对话机器人在创造性思维任务上或能超越大部分的一般人类，该任务要求受试者想出日常用品的替代用途(发散性思维的…

中新网北京9月16日电 (记者孙自法)施普林格自然旗下开放获取学术期刊《科学报告》最新发表一篇人工智能(AI)研究论文指出，大型语言模型(LLM)AI对话机器人在创造性思维任务上或能超越大部分的一般人类，该任务要求受试者想出日常用品的替代用途(发散性思维的一个例子)。不过，该研究也显示，得分最高的人类受试者依然能超过对话机器人的最佳答案。

该论文指出，发散性思维通常是指与创造性相关的一类思维过程，需要为特定任务想出各种不同创意或对策。发散性思维一般通过替代用途任务(Alternate Uses Task，AUT)进行评估，受试者被要求在短时间内想出某个日常用品的其他用途，越多越好。受试者的回答从四个类别进行打分：流利度、灵活性、原创性和精细度。

论文第一作者、芬兰图尔库大学Mika Koivisto和通讯作者、挪威卑尔根大学与斯塔万格大学 Simone Grassini两人合作，利用人工智能大模型ChatGPT3、ChatGPT4和Copy.Ai完成绳子、盒子、铅笔、蜡烛4个物品的AUT，并对其答案进行比较。他们通过语义距离(回答与物品原始用途的相关度)和创造性给回答的原创性打分，并用一个计算方法在0-2的范围里量化语义距离，同时让不知道作答者身份的人类打分者在1-5的范围里客观评价创造性。

该研究结果显示，平均而言，对话机器人的回答在语义距离(0.95相对于0.91)和创造性(2.91相对于2.47)的得分上显著高于人类的回答。人类回答在这两项的得分差距更大最低分远低于AI的回答，但最高分普遍比AI高。最佳人类回答在8个评分项中的7项都超过了所有对话机器人的最佳回答。

论文作者总结认为，这项研究结果表明，当前AI对话机器人想创意的能力至少已与一般人类相当。他们也指出，本次研究只评价了涉及创造性评估的单项任务的表现，今后的研究或能探索如何将AI融入创造性过程来提升人类表现。(完)

公众号：小姨ai