整理知识图谱相关学习资料,提供系统化的知识图谱学习路径。
- [Learning Sequence Encoders for Temporal Knowledge Graph Completion](./paper/Learning Sequence Encoders for Temporal Knowledge Graph Completion.pdf)
中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用,包括了众多的数据集以及工具。
最新发布的Acemap知识图谱(AceKG)描述了超过1亿个学术实体、22亿条三元组信息,涵盖了全面的学术信息。具体而言,AceKG包含了61,704,089篇paper、52,498,428位学者、50,233个研究领域、19,843个学术研究机构、22,744个学术期刊、1,278个学术会议以及3个学术联盟(如C9联盟)。
同时,AceKG也为每个实体提供了丰富的属性信息,在网络拓扑结构的基础上加上语义信息,旨在为众多学术大数据挖掘项目提供全面支持。
YAGO是由德国马普研究所研制的链接数据库。YAGO主要集成了Wikipedia、WordNet和GeoNames三个来源的数据。YAGO将WordNet的词汇定义与Wikipedia的分类体系进行了融合集成,使得YAGO具有更加丰富的实体分类体系。YAGO还考虑了时间和空间知识,为很多知识条目增加了时间和空间维度的属性描述。目前,YAGO包含1.2亿条三元组知识。YAGO是IBM Watson的后端知识库之一。由于完成的YAGO数据集过于庞大,在使用过程中经常会选取其中一部分进行,比如可以抽取中带有时间注释(time annotations)的部分形成YAGO11k数据集。
WikiData的目标是构建一个免费开放、多语言、任何人或机器都可以编辑修改的大规模链接知识库。WikiData由维基百科于2012年启动,早期得到微软联合创始人Paul Allen、Gordon Betty Moore基金会以及Google的联合资助。WikiData继承了Wikipedia的众包协作的机制,但与Wikipedia不同,WikiData支持的是以三元组为基础的知识条目(Items)的自由编辑。一个三元组代表一个关于该条目的陈述(Statements)。
该任务来自NLPCC 2017评测任务,开放域问答评价任务主要包括三项子任务,基于知识库的问答(kbqa),基于文档的问答(dbqa),和基于表的问答(tbqa)。kbqa的任务是基于知识库的中文问题回答。dbqa的任务是通过选择一个或多个句子从一个给定的文档,作为答案回答中文问题。tbqa的任务是一个全新的QA任务,旨在通过从收集的表格中抽取一个或多个表回答英语问题。
GDELT(Global Database of Events, Language, and Tone)是最大的综合人类社会关系数据库,以100多种语言监控来自每个国家几乎每个角落的广播、印刷和网络新闻,并确定推动我们全球社会的人、地点、组织、主题、来源、情感、计数、报价、图像和事件每天的每一秒,它的全球知识图将世界的人,组织,地点,主题,计数,图像和情感连接到整个地球上的单一整体网络。为整个世界的计算创建一个免费的开放平台。
ICEWS(Integrated Crisis Early Warning System)捕获和处理来自数字化新闻媒体,社交媒体和其他来源的数百万条数据,以预测,跟踪和响应世界各地的事件,主要用于早期预警。该数据集在知识图谱领域主要用于动态事件预测等动态图谱方面。
OAG(Open Academic Graph包含来自MAG的166,192,182篇论文和来自AMiner的154,771,162篇论文,并生成了两个图之间的64,639,608个链接(匹配)关系。它可以作为研究引文网络,论文内容等的统一大型学术图表,也可以用于研究多个学术图表的整合。
根据知识图谱的通用基本构建流程为依据,每个阶段都整理部分工具。
DeepDive是
清华大学NLP实验室基于TensorFlow开发的知识嵌入平台,实现了大部分知识表示学习方法。
本部分介绍在知识图谱领域前沿研究或者有一定影响力的机构以及个人。
- 瑞金医院MMC人工智能辅助构建知识图谱大赛
- CCKS 2018 面向中文电子病历的命名实体识别
- CCKS 2018 面向音乐领域的命令理解任务
- CCKS 2018 微众银行智能客服问句匹配大赛
- CCKS 2018 开放领域的中文问答任务
- CCKS 2017 问题命名实体识别和链接任务
- CCKS 2017 面向电子病历的命名实体识别
- BDTC 2018 医疗知识图谱的构建和应用
- BDTC 2018 从知识图谱到人工智能:产品演进路径上的思考
- BDTC 2018 基于cnSchema的大规模金融知识图谱实战
- [BDTC 2017 Event Extraction from Texts](./conference/Event Extraction from Texts.pdf)
- BDTC 2017 知性会话:基于知识图谱的人机对话系统方法与实践
- BDTC 2017 基于图的海量知识图谱数据管理
- CSDN AI 2018 医疗知识图谱的敏捷构建和实践
- CSDN AI 2018 知识图谱的表示和推理
- CSDN AI 2018 大规模通用知识图谱构建及应用
- CSDN AI 2018 大规模通用知识图谱构建及应用