PersonalLLM——探索LLM是否能根据五大人格特质重新塑造一个新的角色?

1.概述

近年来,大型语言模型(LLMs),例如ChatGPT,致力于构建能够辅助人类的个性化人工智能代理,这些代理以进行类似人类的对话为重点。在学术领域,尤其是社会科学中,一些研究报告已经指出,生成式代理具备模拟人类个性特征的能力。尽管在这一领域取得了显著进展,但关于个性化LLM如何精确且持续地再现特定人格特质的研究评估却相对匮乏。
在这种背景下,本文介绍了一项研究论文。该论文通过让LLMs模拟基于五大人格特质的角色,并通过从生成的内容中提取心理语言特征、进行人类评分和人格预测,来探究LLMs是否能够再现人格特征。这项研究为我们提供了对LLMs在个性化方面的潜力和挑战的深入理解。

源码地址:https://github.com/hjian42/personallm
论文地址:https://arxiv.org/pdf/2305.02547.pdf

2.五大人格特质

本文探讨了"五大"人格特质理论,这是由美国心理学家刘易斯·戈德堡提出的一个框架,用于描述和理解人的个性差异。该理论认为,人的个性可以通过五个基本维度来分类,这五个维度共同构成了人格的框架。

"五大"人格特质,也被称为五因素模型(Five-Factor Model),是心理学中一个广泛接受的人格特质理论。这个模型认为人格可以通过五个基本维度来描述,这五个维度通常被缩写为OCEAN:

  1. 开放性(Openness):与创造性、好奇心、想象力和对新体验的开放态度相关。
  2. 责任心(Conscientiousness):涉及组织性、坚持、自律、成就导向和可靠性]。
  3. 外向性(Extraversion):与社交性、活跃度、乐观和对外界刺激的需求相关。
  4. 宜人性(Agreeableness):与合作性、信任、利他、谦逊和对他人的同情相关。
  5. 神经质(Neuroticism):与情绪稳定性相反,涉及情绪波动、焦虑、抑郁和自我意识。

此外,本文还介绍了一个实验,其中让大型语言模型(LLM)根据上述五大人格特质之一来模拟角色。随后,利用大五人格量表(Big Five Inventory,BFI)对LLM模拟的角色进行了评估。通过这种方式,本文旨在探索LLM是否能够准确地再现和模拟特定的人格特质,这对于构建更加个性化和人性化的AI代理具有重要意义。

3. 实验概述

项目部署:

conda activate audiencenlp
python3.9 run_bfi.py --model "GPT-3.5-turbo-0613"
python3.9 run_bfi.py --model "GPT-4-0613"
python3.9 run_bfi.py --model "llama-2"

本文的实验工作流程如下图所示。

如图所示,本实验按照以下步骤进行。

A. 首先,运行提示,生成具有独特个性特征的LLM角色
B. 然后让生成的 LLM 角色完成故事写作任务
C. 使用 “语言探究和字数统计”(LIWC)框架,研究 "LLM角色 "所描述的故事是否包含表明指定个性特征的语言模式
D. 评估 LLM 角色(人类角色和 LLM 角色)所描述的故事。
E. 让人类和 LLM 完成从故事中预测作家 LLM 角色性格特征的任务

3.1 LLM角色模拟

实验使用了两个 LLM 模型(GPT-3.5 和 GPT-4),分别针对五大人格特质模拟了 10 个 LLM 角色,总共生成了 320 个角色
然后,使用上述的 "BFI "对所生成的 "LLM 角色 "进行了评估,以检查它们是否充分再现了 “五大角色”。

3.2故事写作

然后,320 个LLM**"角色 "被要求 "请分享一个 800 字左右的个人故事。 请不要在故事中明确提及你的性格特征**。**不要在故事中明确提及你的性格特征。不要在故事中明确提及你的性格特征。**要求参与者撰写一个文本故事用于分析,并提示 "不要在故事中明确提及您的个性特征。

3.2 LIWC 分析

接下来,我们使用LIWC(语言调查和字数统计)框架从 "角色 "所描述的故事中提取心理语言特征,这是一种通过对文本中的词汇进行抽象和分类来对属性进行归类的方法。

这项分析旨在通过研究故事中的性格特征与分配给LLM的性格特征之间的相关性,找出与性格特征的性格特征相对应的语言模式。

3.3 故事评价

然后,人类和本地语言学家根据以下标准对本地语言学家角色所描述的故事进行评分

  1. 可读性:故事是否易读、结构合理、流畅自然?
  2. 个性:故事是否独特,是否清楚地表达了作者的思想和情感?
  3. 冗余:故事简明扼要,没有不必要的内容
  4. 凝聚力:故事写得好吗?
  5. 可读性:阅读是否有趣?
  6. 可信度:故事是否引人入胜,是否符合实际情况?

3.4 性格预测

最后,支持每个人和 LLM 从给定的故事中预测作家 LLM 角色的个性特征,评分标准为 1 到 5 分。本实验的目的是评估 LLM 角色所描述的故事是否能有效地展示人类和 LLM 都能识别的人格特质。

4. 实验结果

本文使用 GPT-3.5 和 GPT4 这两个 LLM 模型生成的 320 个 LLM 角色进行了实验,以确认以下两个研究问题。

A. LLM的 "角色 "是否反映了指定的个性特征?
B. 从 "LLM 角色 "所描述的故事中,能否获得每种人格特质的语言模式?
C. LLM角色所描述的故事是否写得充分?
D. 故事能预测LLM角色的个性特征吗?

4.1 LLM的 "角色 "是否反映了指定的个性特征?

为了证实这一研究问题,本实验根据 320 个LLM角色对 BFI 的回答计算了他们的个性分数,并通过 t 检验分析了这些分数的分布与所分配的个性特征的函数关系。

结果如下。

实验结果表明在统计学上LLM的角色****在所有性格特征上都有明显的差异,这证明他们反映了他们被赋予的角色

4.2 LLM的 "角色 "是否反映了指定的个性特征?

为了证实这一研究问题,本实验使用 LIWC 从 LLM 角色生成的故事中提取了心理语言特征,并计算了这些特征与指定人格特质之间的点比对相关性(PBCs)。

点双项相关系数是一种适用于分析二元变量与连续变量之间关系的系数,在此用于研究指定的人格特质(=二元变量)与 LIWC 特征(=连续变量)之间的相关性。

下表概述了与个性特征有显著统计学相关性的 LIWC 特征。

实验结果表明,指定的人格特质对法学硕士角色的语言风格有显著影响,例如,当LLM被赋予神经质角色时,更倾向于使用负面词汇,如焦虑和负面语气。结果表明,所分配的人格特质对法学硕士角色的语言风格有显著影响

此外,更重要的是,这些相关性反映了在人类描述的故事中观察到的模式,证实了人类和 LLM 角色之间用词的一致性。(与 GPT-3.5 相比,GPT-4 的结果与人类更加一致) 。

4.3 LLM角色所描述的故事是否写得充分?

为了证实这一研究问题,本实验评估了由 LLM 角色(包括人类角色和 LLM 角色)生成的故事。

评估结果见下表。

值得注意的是,GPT-4 角色所生成的故事在可读性(可读性)、内聚性(内聚性)和可信性(现实性)方面都获得了人类和 LLM 4.0 或更高的评分。重点是在以下方面获得了 4.0 或更高的评分。

结果证实,"角色 "所产生的故事不仅语言流畅、结构连贯,而且引人入胜

4.4 故事能预测法学硕士角色的个性特征吗?

为了证实这一研究问题,本实验将每个角色的个性特征视为二元分类问题,并计算了人类和 LLM 预测个性特征的准确率。

实验结果如下图所示。

实验结果表明,人类从 GPT-4 角色描述的故事中预测性格特征的准确率在外向性和宜人性方面分别低至 68% 和 51%,这证实了人类基于文本的性格预测任务的难度。.
另一方面,GPT-4 在 “外向性”、"宜人性 "和 "自觉性 "方面的准确率分别为 97%、68%和 69%,表明它可以非常准确地预测人格特质。研究结果如下

5.总结

本论文通过模拟基于五大人格特质的角色,并通过分析生成内容中的心理语言特征、人类评价以及人格预测,深入探讨了大型语言模型(LLM)是否能够再现人格特质。
实验结果表明,LLM不仅能够成功模拟特定的人物形象,而且还能通过用词习惯反映出人格特质,进而实现对人格特质的预测。这一发现突显了LLM在模拟人类个性方面的庞大潜力。
然而,研究也指出了未来需要进一步探索的领域。例如,当前的实验并未模拟更自然的情境,如LLM角色之间的互动或协作。此外,研究主要关注英语,尚未扩展到其他语言的探索。
随着这一研究领域的持续发展,我们有理由期待,未来将能够开发出能够精确复制人类个性和行为的人工智能代理,它们的行为模式将与人类无异。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/633623.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

溪谷联运SDK功能全面解析

近期,备受用户关注的手游联运10.0.0版本上线了,不少用户也选择了版本更新,其中也再次迎来了SDK的更新。溪谷软件和大家一起盘点一下溪谷SDK的功能都有哪些吧。 一、溪谷SDK具有完整的运营功能和高度扩展性 1.登录:登录是SDK最基础…

简述MyBatis中#{}引用和${}引用的区别

各位大佬光临寒舍,希望各位能赏脸给个三连,谢谢各位大佬了!!! 目录 1.有无预编译 优点 缺点 2.SQL执行的快慢 3.能否被SQL注入 4.参数输入方式 5.总结 1.有无预编译 #{}是有预编译的而${}是没有预编译的&…

OceanBase集群如何进行OCP的替换

有OceanBase社区版的用户提出替换 OCP 管控平台的需求。举例来说,之前的OCP平台采用单节点,然而随着OceanBase集群的陆续上线和数量的不断增多,担心单节点的OCP可能面临故障风险,而丧失对OceanBase集群的管控能力。另此外&#xf…

创建vue工程、Vue项目的目录结构、Vue项目-启动、API风格

环境准备 介绍:create-vue是Vue官方提供的最新的脚手架工具,用于快速生成一个工程化的Vue项目create-vue提供如下功能: 统一的目录结构 本地调试 热部署 单元测试 集成打包依赖环境:NodeJS 安装NodeJS 一、 创建vue工程 npm 类…

以Linux为例了解线程

我最近开了几个专栏,诚信互三! > |||《算法专栏》::刷题教程来自网站《代码随想录》。||| > |||《C专栏》::记录我学习C的经历,看完你一定会有收获。||| > |||《Linux专栏》&#xff1…

IO系列(八) -浅析NIO工作原理

一、简介 现在使用 NIO 的场景越来越多,很多网上的技术框架或多或少的使用 NIO 技术,譬如 Tomcat、Jetty、Netty,学习和掌握 NIO 技术已经不是一个 Java 攻城狮的加分技能,而是一个必备技能。 那什么是 NIO 呢? NIO…

第06章 数据加载、存储与文件格式

以下内容参考自https://github.com/iamseancheney/python_for_data_analysis_2nd_chinese_version/blob/master/%E7%AC%AC05%E7%AB%A0%20pandas%E5%85%A5%E9%97%A8.md 《利用Python进行数据分析第2版》 用以学习和记录。 输入输出通常可以划分为几个大类:读取文本文…

深海奥秘:鳐鱼肽的肌肤之旅

深海,一个神秘又充满生命力的世界,总是带给我们无尽的惊喜。鳐鱼,又被称为“魔鬼鱼”,它的皮肤中含有一种特殊的肽,这种肽不仅分子量适中,易于人体吸收,还具有极高的消化率和生物利用度。来自北…

科技引领乡村振兴新潮流:运用现代信息技术手段,提升农业生产和乡村管理效率,打造智慧化、现代化的美丽乡村

一、引言 随着科技的不断进步,现代信息技术已经渗透到社会的各个领域,成为推动社会发展的重要力量。在乡村振兴战略的背景下,科技的力量同样不容忽视。本文旨在探讨如何运用现代信息技术手段,提升农业生产和乡村管理效率&#xf…

Android软件渲染流程

Android软件渲染流程 一.渲染流程1.VSync信号的监听2.VSync信号触发绘制 二.渲染原理1.画布的获取1.1 渲染缓存的初始化1.2 graphics::Canvas的创建1.3 graphics::Canvas与渲染缓存的绑定1.3.1 SkBitmap的初始化1.3.2 SkiaCanvas与SkBitmap的绑定1.3.3 SkCanvas的创建 2.矩形的…

Transformer系列专题(二)——multi-headed多头注意力机制

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、什么是multi-headed(多头注意力机制)二、multi-headed三、multi-headed结果四、堆叠多层总结 前言 在实践中,当给定相同…

【数据库基础】基本认识数据库--入门引导

文章目录 什么是数据库?主流数据库基本使用安装MySQL连接服务器服务器、数据库、表关系使用案例数据逻辑存储 MySQL架构SQL语句分类什么叫存储引擎 什么是数据库? 数据库是指在磁盘和内存中存储特定结构组织的数据。数据库通常用于存储于某个系统、组织或…

分布式异步框架celery + Redis 安装配置

引入 这里不对web框架做过多说明,到时候在总结一篇 python的常见web框架 django、flask、tornado、sanic、fastapi..各框架区别 - 内部集成功能的多少 django,内部提供了很多组件。 【相对大】flask、tornado、sanic、fastapi… 本身自己功能很少第…

Linux c开发线程锁和条件变量使用

#include <pthread.h> #include <stdio.h> #include <unistd.h>pthread_mutex_t mutex PTHREAD_MUTEX_INITIALIZER; pthread_cond_t cond PTHREAD_COND_INITIALIZER;void* thread_function(void* arg) {printf("线程等待唤醒,锁定互斥量...\n");…

【Unitydemo制作】音游制作—排行榜逻辑Json存储

&#x1f468;‍&#x1f4bb;个人主页&#xff1a;元宇宙-秩沅 &#x1f468;‍&#x1f4bb; hallo 欢迎 点赞&#x1f44d; 收藏⭐ 留言&#x1f4dd; 加关注✅! &#x1f468;‍&#x1f4bb; 本文由 秩沅 原创 &#x1f468;‍&#x1f4bb; 收录于专栏&#xff1a;就业…

查看当前Shell系统环境变量

查看当前Shell系统环境变量 查看命令 env效果 查看Shell变量(系统环境变量自定义变量函数) 命令 set效果 常用系统环境变量 变量名称含义PATH与windows环境变量PATH功能一样&#xff0c;设置命令的搜索路径&#xff0c;以冒号为分割HOME当前用户主目录&#xff1a;/rootSH…

day08-Java常用API

day08——Java常用API 一、今日内容介绍、API概述 各位同学&#xff0c;我们前面已经学习了面向对象编程&#xff0c;使用面向编程这个套路&#xff0c;我们需要自己写类&#xff0c;然后创建对象来解决问题。但是在以后的实际开发中&#xff0c;更多的时候&#xff0c;我们是…

通过 Spring 操作 Redis

要想通过 Java 操作 redis&#xff0c;首先要连接上 redis 服务器&#xff0c;推荐看通过 Java 操作 redis -- 连接 redis 创建项⽬ 勾选 NoSQL 中的 Spring Data Redis 当然, 把 Web 中的 Spring Web 也勾选⼀下.⽅便写接进⾏后续测试. 配置 redis 服务地址 在 application.…

数据库的约束 not null, unique, default, primary key, foreign key, check

约束可以理解成 数据库提供的一种针对数据的合法性进行验证的机制, 在创建表的时候使用 1. 约束类型 NOT NULL - 指示某列不能存储 NULL 值, 表里的这个内容是必填项UNIQUE - 保证某列的每行必须有唯一的值, 不能重复 每次插入/修改时, 都要先触发查询, 如果当前插入/修改的…

mysql存储比特位

一、介绍 二、SQL CREATE TABLE bits_table (id INT PRIMARY KEY AUTO_INCREMENT,bit_value BIGINT UNSIGNED );-- 插入一个 8 位的 BIT 值 INSERT INTO bits_table (bit_value) VALUES (B10101010);-- 查询并格式化输出 SELECT id,bit_value,CONCAT(b, LPAD(BIN(bit_value),…