Advertisement

清华大学科技知识图谱数据集

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
该数据集由清华大学构建,涵盖多领域科技文献与专利信息,旨在促进科研界的知识图谱研究及应用发展。 SciKG是一个以科研为中心的大规模知识图谱数据集,目前涵盖计算机科学领域,包含概念、专家和论文三个主要部分。科技概念及其关系是从ACM计算分类系统中提取的,并辅以每个概念的定义(大多数来自维基百科)。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • 优质
    该数据集由清华大学构建,涵盖多领域科技文献与专利信息,旨在促进科研界的知识图谱研究及应用发展。 SciKG是一个以科研为中心的大规模知识图谱数据集,目前涵盖计算机科学领域,包含概念、专家和论文三个主要部分。科技概念及其关系是从ACM计算分类系统中提取的,并辅以每个概念的定义(大多数来自维基百科)。
  • 鸟类百CSV
    优质
    《鸟类百科知识图谱CSV数据集》是一份详细记录了各类鸟类信息的数据集合,内容涵盖分类学、生态习性等多方面,旨在为研究者提供便捷的研究资料。 本项目知识来源于中国环境与发展国际合作委员会生物多样性工作组补充的《中国鸟类野外手册》电子版,该手册以CHM文件格式存储。这种格式是微软于1998年推出的基于HTML特性的帮助文档系统,可以理解为打包后的HTML文件。通过解析CHM文件,可以获得其中的HTML文本,并利用爬虫技术和正则表达式从中抽取信息。最终获取了包含1251种鸟类的信息,包括所属目、科和属分类、具体描述、虹膜颜色、嘴色、脚色、叫声特点、分布范围与状况以及习性等详细知识。
  • 研讨会 PDF与PPT资料
    优质
    简介:本资料集包含了来自清华大学举办的关于知识图谱技术及其应用的研讨会中的PDF和PPT文件,内容涵盖了理论探讨、实际案例分析等多个方面。 这是知识图谱研究青年学者研讨会(清华大学)。汇报PPT包括: - 冯岩松:csk_akbc - 韩先培:青年知识图谱研讨会 - 刘康:知识图谱讨论会 - 刘知远:大规模知识图谱表示学习的趋势与挑战_青年研讨会 - 漆桂林:知识库构建和推理技术及工具介绍 - 王昊奋:KG Applications for vertical sectors - 王泉:知识图谱学术研讨会 - 王志春:知识图谱研讨会 - 邹磊:rdf_natural_language 希望文章对你有所帮助,同时可以参考我的一篇博文《知识图谱相关会议之观后感分享与学习总结》。
  • :关于人工智能的.pdf
    优质
    本PDF由清华大学编写,主要内容涉及构建和应用人工智能领域的知识图谱,探讨其在数据处理与智能决策中的作用。 知识图谱是人工智能领域内知识工程的一个重要应用分支。本段落档旨在概括性地介绍关于知识图谱的相关概念、应用场景以及未来发展趋势。
  • family
    优质
    Family知识图谱数据集包含丰富的人类家庭关系信息,旨在促进家族树重建、遗传研究及智能系统中的语义理解与推理能力的发展。 家庭背景的知识图谱三元组数据包括entities.txt、facts.txt、relations.txt、test.txt、train.txt 和 valid.txt 这几个文件。
  • .zip
    优质
    《知识图谱数据集》包含各类结构化和非结构化的信息资源,旨在为学术研究及应用开发提供丰富的语义数据分析素材。 知识图谱学习资料供大家一起学习使用,帮助了解最新前沿动态。
  • FB15K
    优质
    FB15K知识图谱数据集是Freebase数据库的一个子集,包含约27万实体和14.9万事实三元组,广泛用于链接预测、关系抽取等任务的研究。 知识图谱FB15K数据集是一个广泛使用的基准测试集合,用于评估在大规模知识库上执行的链接预测任务的效果。这个数据集包含Freebase的一部分,并且经过精心设计以促进关系路径的学习和推理能力的研究。它包含了各种实体及其之间的复杂关系,为研究者提供了一个丰富的资源来开发和完善他们的模型和技术。
  • 东南.zip
    优质
    该文件包含东南大学制作的知识图谱相关数据集,适用于学术研究、教育及智能系统开发等领域。 东南大学在知识图谱领域开展了深入的研究工作,并取得了一定的成果。相关研究涵盖了知识表示、推理以及应用等多个方面,为推动该领域的技术进步做出了贡献。
  • NELL-995
    优质
    NELL-995是卡内基梅隆大学开发的知识图谱数据集,包含超过百万实体和数十万关系的事实陈述,用于训练机器学习模型理解与生成知识图谱。 The dataset format is as follows: - **raw.kb**: Contains the raw KB data from the NELL system. - **kb_env_rl.txt**: Includes inverse triples of all triples in raw.kb. This file serves as the KG for reasoning purposes. - **entity2vec.bern/relation2vec.bern**: TransE embeddings used to represent RL states, which can be trained using TransX implementations by thunlpt (though specific implementation details are not provided here). The tasks directory contains specific reasoning relations and their associated files: - **tasks/${relation}/*.vec**: Trained TransH Embeddings. - **tasks/${relation}/*.vec_D**: Trained TransD Embeddings. - **tasks/${relation}/*.bern**: Trained TransR Embeddings, trained using the specified KB embeddings. - **tasks/${relation}/*.unif**: Trained TransE Embeddings. Additionally, there are directories for each relation containing: - **transX**: Triples used to train the KB embedding models. - **train.pairs** and **test.pairs**: Training and test triples in PRA format respectively. - **path_to_use.txt**: Reasoning paths discovered by the RL agent. - **path_stats.txt**: Path frequency of randomised BFS.