
结合知识与人物角色信息的对话数据集FoCus(英文)
5星
- 浏览量: 0
- 大小:None
- 文件类型:ZIP
简介:
FoCus是一个独特的对话数据集,它融合了丰富的知识背景和多样化的人物设定,旨在促进更加真实、智能的人机交互研究。
本人研究生期间的研究方向为对话系统,所使用的数据集是FoCus数据集。以下是该数据集的相关介绍。
Jang等人首次构建了一个同时融入知识和人物角色信息的对话数据集——FoCus,推动了这类对话生成模型的发展。我们的研究也是基于这个特殊数据集展开的,接下来将针对FoCus对话数据集进行详细介绍。
在FoCus数据集中,每段对话都是根据人物信息与维基百科知识构建而成。对于该数据集中每一段对话的创建过程是这样的:先从谷歌地标数据集(GLDv2)中选择一个主题,并且从维基百科上选取相关的历史、设计、旅游和建筑等领域的知识文本;然后,这些知识文本中的关键词被提取出来并用于生成与所选主题有关的人物信息句子;最后,在考虑人物角色的信息以及外部提供的知识的同时创建对话内容。
该数据集中每段对话都附带了多条人物信息及相关的背景知识,并且其中一条特定的人格化语句或一份具体的背景资料会出现在实际的问答中,同时这些使用情况在数据集内也有相应的标签标注。值得注意的是,在FoCus数据集中,机器生成的回答通常比人类的问题更长,这是因为机器的话语不仅需要回答问题,还需要结合人物角色信息和外部知识来构建回复内容。
全部评论 (0)
还没有任何评论哟~


