Advertisement

FB15K 知识图谱数据集

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
FB15K知识图谱数据集是Freebase数据库的一个子集,包含约27万实体和14.9万事实三元组,广泛用于链接预测、关系抽取等任务的研究。 知识图谱FB15K数据集是一个广泛使用的基准测试集合,用于评估在大规模知识库上执行的链接预测任务的效果。这个数据集包含Freebase的一部分,并且经过精心设计以促进关系路径的学习和推理能力的研究。它包含了各种实体及其之间的复杂关系,为研究者提供了一个丰富的资源来开发和完善他们的模型和技术。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • FB15K
    优质
    FB15K知识图谱数据集是Freebase数据库的一个子集,包含约27万实体和14.9万事实三元组,广泛用于链接预测、关系抽取等任务的研究。 知识图谱FB15K数据集是一个广泛使用的基准测试集合,用于评估在大规模知识库上执行的链接预测任务的效果。这个数据集包含Freebase的一部分,并且经过精心设计以促进关系路径的学习和推理能力的研究。它包含了各种实体及其之间的复杂关系,为研究者提供了一个丰富的资源来开发和完善他们的模型和技术。
  • FB15K-OWE中的链接预测与关系预测
    优质
    简介:FB15K-OWE是用于评估知识图谱中链接预测和关系预测性能的数据集,基于Freebase构建,增加了观察不到的工作实体及其关系。 开放域知识图谱数据集是在FB15K的基础上构建的,并添加了实体描述信息。
  • family
    优质
    Family知识图谱数据集包含丰富的人类家庭关系信息,旨在促进家族树重建、遗传研究及智能系统中的语义理解与推理能力的发展。 家庭背景的知识图谱三元组数据包括entities.txt、facts.txt、relations.txt、test.txt、train.txt 和 valid.txt 这几个文件。
  • .zip
    优质
    《知识图谱数据集》包含各类结构化和非结构化的信息资源,旨在为学术研究及应用开发提供丰富的语义数据分析素材。 知识图谱学习资料供大家一起学习使用,帮助了解最新前沿动态。
  • NELL-995
    优质
    NELL-995是卡内基梅隆大学开发的知识图谱数据集,包含超过百万实体和数十万关系的事实陈述,用于训练机器学习模型理解与生成知识图谱。 The dataset format is as follows: - **raw.kb**: Contains the raw KB data from the NELL system. - **kb_env_rl.txt**: Includes inverse triples of all triples in raw.kb. This file serves as the KG for reasoning purposes. - **entity2vec.bern/relation2vec.bern**: TransE embeddings used to represent RL states, which can be trained using TransX implementations by thunlpt (though specific implementation details are not provided here). The tasks directory contains specific reasoning relations and their associated files: - **tasks/${relation}/*.vec**: Trained TransH Embeddings. - **tasks/${relation}/*.vec_D**: Trained TransD Embeddings. - **tasks/${relation}/*.bern**: Trained TransR Embeddings, trained using the specified KB embeddings. - **tasks/${relation}/*.unif**: Trained TransE Embeddings. Additionally, there are directories for each relation containing: - **transX**: Triples used to train the KB embedding models. - **train.pairs** and **test.pairs**: Training and test triples in PRA format respectively. - **path_to_use.txt**: Reasoning paths discovered by the RL agent. - **path_stats.txt**: Path frequency of randomised BFS.
  • NLPCC 2018
    优质
    NLPCC 2018知识图谱数据集是针对中文环境设计的一系列大规模知识图谱相关任务的数据集合,涵盖实体链接、关系抽取等多个方面,旨在推动自然语言处理领域的研究进展。 在今年的NLPCC开放领域问答共享任务中,我们重点关注知识,并设立了三个子任务:(a)基于知识库的问题回答(KBQA);(b)基于知识库的问题生成(KBQG);以及(c)基于知识库的问题理解(KBQU)。KBQA的任务是根据给定的知识库来解答自然语言问题,而KBQG则是依据已有的知识三元组生成相应的自然语言问题。最后的子任务KBQU旨在将自然语言问题转换为对应的逻辑形式表达。前两个子任务使用中文进行,最后一个子任务则使用英文。
  • 适用于DeepPath论文的FB15k-237领域中的应用
    优质
    该文介绍了FB15k-237数据集在知识图谱领域的应用,着重探讨了其在DeepPath论文中的作用与价值,为路径查询和推理提供了有力支持。 FB15k-237数据集在知识图谱领域被用于DeepPath论文中的关系推理研究。
  • FB15K
    优质
    FB15K数据集是一个大规模的知识图谱基准数据集,包含来自Freebase的约14,951个实体和134,518个三元组,广泛应用于知识图谱嵌入模型的研究与评估。 对于训练过程而言,数据集包含三个文件:train2id.txt 文件用于存储训练三元组的数据,其第一行为训练的三元组数量;后续每一行都以 (e1, e2, rel) 的格式表示一个实体对及其关系。entity2id.txt 文件列出了所有实体及对应的编号,每行记录了一个实体和它的 ID 编号,并且文件的第一行为实体总数目。relation2id.txt 则是列出所有的关系类型以及它们的对应 ID 号码,同样地,此文件第一行表示总的关系数目。 在测试阶段,则会额外提供两个文件(总共五个):test2id.txt 文件用于存储测试三元组的数据,格式与 train2id.txt 相同;valid2id.txt 为验证数据集的文件,其内容及结构也遵循 test2id.txt 的模式。
  • FB15K.rar
    优质
    FB15K数据集包含Freebase知识图谱中约48万事实三元组的数据集合,广泛应用于链接预测等知识图谱任务的研究与开发。 知识图谱FB15K数据集是一个广泛使用的基准测试集合,用于评估链接预测模型的性能。该数据集中包含了大量的三元组(头实体、关系、尾实体),这些三元组来源于Freebase数据库,并经过特定的方式划分训练集、验证集和测试集。
  • 鸟类百科CSV
    优质
    《鸟类百科知识图谱CSV数据集》是一份详细记录了各类鸟类信息的数据集合,内容涵盖分类学、生态习性等多方面,旨在为研究者提供便捷的研究资料。 本项目知识来源于中国环境与发展国际合作委员会生物多样性工作组补充的《中国鸟类野外手册》电子版,该手册以CHM文件格式存储。这种格式是微软于1998年推出的基于HTML特性的帮助文档系统,可以理解为打包后的HTML文件。通过解析CHM文件,可以获得其中的HTML文本,并利用爬虫技术和正则表达式从中抽取信息。最终获取了包含1251种鸟类的信息,包括所属目、科和属分类、具体描述、虹膜颜色、嘴色、脚色、叫声特点、分布范围与状况以及习性等详细知识。