# 图谱真的没用吗?知识图谱视角下的双链笔记
zhuanlan.zhihu.com
狭义上来说,知识图谱特指一种知识表示方式,其本质上是一种大规模语义网络,即以图形化的形式、通过点和边来表达知识[1]。知识图谱的基本组成元素是点和边,点用来指代现实世界中的具体事物(实体),边用来指代事物之间的关系。现实中很多知识都可以用“实体-关系-实体”这样的三元组形式来表示。比如,“亚里士多德出生于 Chaicis”这样一条知识就可以用<亚里士多德,出生地,Chalcis>的形式来表示。
除了“实体-关系-实体”这样的形式外,知识图谱还可以表示“实体-属性-属性值”这样的知识。比如,“雅典的英文名是Athens”则可以用<雅典,英文名,Athens>的形式来表示。
基于这种图形化的知识表示方法,知识图谱可以实现一些传统搜索无法实现的应用,比如构造依赖链来辅助决策。
建立包含各种语义关联的知识图谱,构造实体间的依赖链,挖掘这些实体之间的深层关系,就显得十分重要了[1]。因此,知识图谱已经成为决策分析的重要辅助手段,为决策支持提供深层关系发现与推理能力。
关系链路不仅能用于人物、公司间的深层关系分析,也能用于科研方面
要解决这个问题,我们需要借助文献主题这个概念。
文献主题是概括文献中心论题的一个或若干概念的组合[2],用以表达文献所论述和研究的具体对象和问题[3]。简单来说,文献主题有点像我们小学语文阅读题中概括出来的文章主旨一样,只不过文献主题更精炼一些。
依据论述问题数量的多少,文献可分为单主题文献和多主题文献两种类型[2]:
单主题文献是指一篇文献只研究一个中心问题或事物,即只有一个主题。单主题文献可以是论述一个独立的事物、问题,如《市场经济》、《高等数学》、《信息咨询》等文献名称都反映了文献只有一个主题;也可以是论述一个事物或问题的某个方面,如《高等教育改革》、《市场经济的调查》、《竞争情报的咨询与技能》等
多主题文献是指一篇文献同时研究两个或两个以上的事物或问题, 即包含多个主题。多主题文献可以同时论述多个独立的主题,如《控制论、信息论、系统科学和哲学》这篇文献就涉及控制论、信息论、系统科学和哲学等多个主题;也可以同时论述几个相关联的主题,比如《太阳系、地球、小行星》、《理论力学、材料力学、弹性力学》、《热力学与统计物理学》等。但如我在先前文章中所述,一篇笔记不应该包含多个主题。
复合主题又可分为以下几种不同的类型:
a) “事物——部分”型,如计算机存储器、人的心脏等。
b) “事物——方面”型,如大黄鱼养殖、传染病预防等。
c) “事物一部分一方面”型,如拖拉机发动机故障诊断。
d) “事物——比较——事物”型,即事物间的比较关系,比如中美文化比较。
e) “事物——关系——事物” 型,即事物间的相互关系,比如鱼与水的关系。
f) “事物——影响——事物” 型,即事物间的影响关系,比如风速对运动成绩的影响。
g) “事物——应用——事物” 型,即事物间的应用关系,比如数学在农业中的应用。
h) “原因——结果”型,即事物间的因果关系,比如糖尿病眼病。描述事物整体或部分的主题,可以视为实体,对应知识图谱中的“点”;描述事物之间关系的主题,可以视为关系,对应知识图谱中的“边”。因此,基于笔记的主题,我们就能完成笔记与知识图谱之间的对应,从而实现个人知识图谱的构建。
为了在Obsidian中构建知识图谱,我们需要将笔记分成以下两类:
1. 实体笔记:实体笔记指的是论述事物、概念、理论或论述其某方面的笔记。这类笔记对应知识图谱中的实体(点)。
2. 关系笔记:关系笔记指的是论述多个事物或概念间关系的笔记。这类笔记对应知识图谱中的关系(边)。通过以上两种笔记,知识图谱“实体(点)-关系(边)-实体(点)”的形式就可以在Obsidian中表示为“实体笔记(点)-关系笔记(点)-实体笔记(点)”。换句话说,我们在Obsidian中通过一篇单独的笔记来表示两个实体间的关系。
在Obsidian中构建好图谱后,我们可以通过Obsidian的Journey插件来模拟知识图谱的路径搜索[4],从而挖掘笔记间的深层联系。比如,我想知道a和z间的关系情况,那我只需在Journey插件中以a为起点、以z为终点进行搜索即可:
- 先在一篇笔记上记录
任何领域都是从一个基本概念开始的。因此,我们在这个领域的笔记也应该从该领域的基本概念出发,从创建这个领域的实体笔记开始。
让我们在学习新知识时无需过多思考笔记结构,降低认知负载(Colliot & Jamet, 2018),从而将注意力充分集中在学习上。
- 能充分汇总相关内容,即便日后不整理,也能通过概念名称进行查找。
- 可以充分利用Obsidian别名功能完成词形控制,为检索提供多个入口。比如知识图谱这个概念,有的地方也会称其为“认知图谱”,那我就可以为“知识图谱”这篇笔记添加“认知图谱”这一别名,这样日后无论我搜索“知识图谱”还是“认知图谱”都能找到这篇笔记,Obsidian也能更好地帮我发现其他笔记与该笔记间的关联。
拆分
为新笔记命名
需要注意的是,命名不能随意命名,随意命名容易造成后期检索上的困难。比如,如果我们将一篇主题为“七七事变的历史意义”的笔记命名为《77事变的历史意义》,那么日后我们使用“七七事变”这个词进行检索时就无法查找到这篇笔记了。这也是很多人在使用笔记软件时都会出现的共性问题。为了解决这个问题,图书馆学家们提出了相应的解决办法。受篇幅所限,此处不过多说明,我们仅需要记住命名时每个概念只使用一个标准名称即可,不要今天用x、明天用y。(图书馆中使用的标准词语可到汉语主题词表服务系统 (istic.ac.cn)中查询。)另一点就是笔记的标题要充分揭示笔记主题,标题中就要包含事物名、关系名等部分,比如主题为“机器学习在管理学中的应用”的笔记就不能命名为“机器学习管理学”,否则日后我们就无法通过“机器学习”、“应用”等直接相关的关键词查找到这篇笔记。
#命名
- 链接
然后,我们应该在原笔记中链接这篇新创建的笔记。由于新笔记和原笔记是部分和整体的关系,因此其和原笔记间的链接无需详细说明,直接在原笔记中链接新笔记即可。
- 归档
如果已有论述相应主题的笔记,则对比该笔记中所记录内容和当前内容的相似程度,并再决定是否补充。
如果没有论述相应主题的笔记,则新建笔记。a) 如果论述的是一个全新的实体(比如具体的事物、概念、理论),创建后直接归档即可; b) 如果论述的是某个实体的某个部分,创建新笔记后还应在论述整体的实体笔记中链接该笔记; c) 如果笔记论述的是关系,创建新笔记后还应在关系涉及的实体笔记中链接该笔记。
总结
要在笔记软件中构造属于我们自己的知识图谱,我们只需做到以下几点即可:任何内容都应该从其基本概念开始记录,随后再细分。
当细分主题出现时,拆分笔记。这主要有两种情况:1)从论述整体变成论述部分;2)当笔记与其他笔记产生联系(具体常表现为两篇笔记都要引用同一段内容)。
链接笔记:若两篇实体笔记间存在无需说明的关系,如“a是b”、“参见”等,直接通过方括号链接。 关系笔记只能被实体笔记链接,不能直接链接实体笔记。
实体笔记很好分类,由于其往往对应一个概念,因此直接去汉表看该概念所属的范畴即可。关系笔记则按分类法相关规定处理。
在笔记软件中,与“文档”相比,“块”缺乏检索标识,因此不能算一个很好的信息单位。