当前位置 博文首页 > LucyGill的博客:荐书:理解知识图谱必看的那些书、公众号和其他

    LucyGill的博客:荐书:理解知识图谱必看的那些书、公众号和其他

    作者:[db:作者] 时间:2021-09-05 19:18

    初稿已完成,以后慢慢补充。


    在知识图谱领域摸爬滚打了近三年,几乎全靠自学,现在想起来还是一把辛酸泪。虽然现在的工作和知识图谱没太多关系,但还是放不下自己研究了很久的领域,所以在此总结一些有用的书和资料,以便自己回顾,以便他人学习。

    荐书:

    我开始研究知识图谱的时候,相关书籍真的不多。大概是我当时按照“知识图谱”这个领域来搜索,结果自然是无功而返。其实,按照“语义网”搜索,可以找到很多基础又权威的资料。知识图谱和语义网可以说是双胞胎(非常相似但有细微的不同),知识图谱的描述语言,又和xml,html是亲戚。事实上,知识图谱最常用的描述语言RDF,有xml形式的写法。

    1. 语义网基础教程

    这本书可以说是我的“师傅”了,它把我领进了知识图谱的大门。我看的是第三版,现在应该已经出到了第四版。不过此书现在并不好买,大概只能在网上的个体书店或图书馆看到。

    “知识图谱”虽然是2012年提出的,但其发展历程远不止于此。“知识图谱”更像是为了引起人们关注而起的一种噱头,它的前身语义网早在上世纪50年代就有研究资料了。语义网更重视知识图谱的上层结构,所以由此衍生出一系列通过逻辑推理补充语义网的方法。随着信息时代的到来,关于个体的数据量越来越大,所以更注重数据层的知识图谱才被提出来。

    总之,这本书说明白了知识图谱的来龙去脉,以及表示它的几种语言是怎么用的。并且这本书已经出了四版,汉化得比较好,文字容易理解。

    2. 关联数据:万维网上的结构化数据

    这本书是2018年出的,相对来说新一些。目前这本书我只看了第一章,感觉还可以,所以也推荐一下。

    在读这本书之前,我对知识图谱只有一个笼统的认识:见到知识图谱,能认出来;让我说知识图谱的用途,我也能罗列出一些诸如便于推理,辅助搜索引擎,个性化推荐等大众常识。但我并没有真正见过知识图谱的效用。这本书第一章让我真正理解了什么是关联数据(这种数据的形式,实际上就是知识图谱的形式)。由关联数据组成的网页,可以导出为RDF形式。而这种形式既便于人类理解,也便于机器理解。这种形式组成的网页,便于其他人对当前知识的利用。只要把对应的RDF复制下来,就相当于拥有了该网页中蕴含的知识,从而可以通过组合知识的方式创建自己的网页。

    总结:个人认为,市面上适合知识图谱初学者的纸质书籍仍不算太多,大概因为知识图谱本身就没有什么确切的定义吧。最近王昊奋和肖仰华都除了知识图谱相关的书,我翻看了一下,感觉书的概括面不小,但不精,也太厚,其中语言有些晦涩,貌似也不是王老师和肖老师亲笔写的全书,因此不建议逐页阅读,有需要时当作查资料的工具书未尝不可。

    荐公众号:

    1. PaperWeekly

    这个公众号可以说是比较有名了,经常解读顶会上的英文论文。此外,公众号还经常举办线下活动,在清华大学进行知识交流。主要就是邀请一些比较厉害的清华硕博士,讲自己在权威期刊或会议上发表的论文,当然还有答疑等线下交流的机会。

    2. 机器之心

    同样是学术分享公众号,但是文章的内容学术性没那么强,比较适合当作科普杂志来读。

    3. AI科技大本营

    大概和机器之心的模式差不多,分享一些AI方面的知识。

    4. 开放知识图谱

    从题目可以看出,公众号比较有针对性地介绍知识图谱方面的论文、新闻、知识。

    5. 知识工厂

    从名字也可以看出,公众号侧重分享知识图谱和深度学习的相关知识。

    ?

    荐工具:

    1. Gephi

    复杂网络领域常用的画图软件。可导入CSV格式的三元组,然后就可以把知识图谱可视化了。当然Neo4j功能应该更强大,但我没怎么用过,暂时先不推荐,用过之后再补充。

    2. Protege

    把RDF或OWL文件导入,也能可视化。和Gephi不同的是,这个软件面向语义网更多一些,所以不能承担太大的数据量,个人认为100个实体大概就是其上限了。这个软件的好处在于支持推理。

    3. rdf2rdf

    一个可将知识图谱描述文件转化为三元组的程序,具体见文章:https://blog.csdn.net/LucyGill/article/details/79501700

    (其实就是把rdf,owl,xml等格式的知识图谱转化为N-triples格式啊。转化后再用Gephi可视化一下,可以清楚地看到知识图谱的结构。)

    荐人(排名分先后):

    1.?鲍捷

    在语义网时代就开始研究知识图谱,在这个领域挺有发言权的。看过他的讲稿,感觉他真正了解知识图谱的来龙去脉,说话也通俗易懂。

    2. 王昊奋

    在小象学院开设了知识图谱相关视频课程,初学者看他的视频也是不错的。(悄悄说一句,tb在卖这个课程,只要几块钱就能买到录屏版)他曾经参与美国智能问答机器人的构建,也算是元老了。

    3. 肖仰华

    因为我的研究偏上层结构,而他一直强调上层结构重要,所以对他还是比较有好感的。看过他的文章,也不错,适合新手。

    4. 刘知远

    主要涉及深度学习方面的知识图谱,比如知识图谱向量化的Trans系列,好多算法都是他们课题组做的。清华大学的老师,比较年轻。去年在北京举办过一个逼格比较高的知识图谱活动。(两天都提供精美的餐食,很遗憾没去……)

    5. 漆桂林

    带着团队做各类知识图谱,人比较接地气。之前在知乎问过知识图谱方向的相关问题,他竟然主动回答了(惊)。师兄还加了他的微信,据说如果想的话还可以跟着他的课题组干活 。

    6. 李涓子

    不是特别了解,看过她写的知识图谱相关综述。好像也是清华的,和刘知远同事。

    ?

    cs
    下一篇:没有了