搜档网
当前位置:搜档网 › 知识图谱研究方法心得

知识图谱研究方法心得

知识图谱研究方法心得
知识图谱研究方法心得

体育政策研究现状、前沿热点与演化分析

——基于科学知识图谱的可视化分析心得

一、主要内容

作者基于科学知识图谱可视化分析,通过Web of Science TM

文献资料数据库检索体育政策研究论文,以“体育政策”的标题、摘要、关键词和收录全文为研究对象,运用引文分析、共被引分析、聚类分析、词频分析、社会网络分析等基本方法,对体育政策研究的现状、前沿热点和演化路径进行分析,采用Cite SpaceⅢ可视化软件绘制科学知识图谱,将数据以图像形式呈现出来。

通过运用Cite SpaceⅢ可视化软件,一是通过选择“country”(国家)和“institution”(机构),时区分割设置为2(Time Slice Length=2),绘制了体育政策发文高产国家分布图;二是通过选择参数“Author”(作者),绘制了体育政策发文高产作者知识图谱;三是通过选择参数“Category”(学科),绘制了体育政策研究领域的学科贡献网络图谱;四是通过导入文献,在主题词资源(Term Source)中选择标题(Title)、摘要(Abstract),节点类型(Node Types)选择关键词(Keyword),绘制出了体育政策研究领域的学科贡献网络图谱。

分别对以上四个图谱进行分析得到以下结论:1.美国是体育政

策研究的中心,无论从发文量还是文章的中心性都高居第一,高校是体育政策研究发文量的高产机构;2.体育政策领域研究者形成一小部分核心作者群,但数量较少,研究作者总体成离散性分布;3.体育政策研究需要多学科的支持,社会科学学科和公共科学学科是体育政策发文量的高产学科,形成以这两个学科为主流的研究领域;4.体育政策的关注点在不断的发展和变化,正在由对儿童的关注过渡到整体的公共健康,由体育活动过渡到发挥体育的教育功能,由对体育行为的控制过渡到形成终身体育的锻炼意识。

二、当前体育领域知识图谱研究方法应用现状

在中国知网通过以体育、知识图谱为主题和关键词进行搜索,根据关联度选取了104篇期刊、论文,进行分类发现当前体育领域应用知识图谱研究方法主要呈现在以下内容:一、单项运动。主要包括英文期刊中马拉松研究、、我国龙舟科研成果、国内外体育舞蹈研究、国外滑雪运动风险研究、太极拳运动研究、舞龙舞狮研究、攀岩运动研究、我国速度滑冰研究、国外篮球运动研究、国内外排球领域研究、羽毛球运动研究、我国乒乓球研究、我国体育舞蹈、国内外健美操、国内外啦啦操、网球研究、电子竞技现状、竞技游泳、国际有氧运动科学研究等项目的研究分析;二、学校体育教育。主要包括我国冰雪教学研究、我国体育教师教育研究、我国基础教育体育课程研究、国际学校体育研究、国外体育教师研究、高校公共体育课、高校体育教学、体育舞蹈教学、国际体育教育动态演变

研究、国内外体育教育研究、国内外高校体育教学研究现状、我国学校体育政策、体操教学研究领域、我国体育教学环境研究、我国高校体育俱乐部等内容的研究;三、体育科学。主要包括:国际体育基因研究、我国体育传播研究、我国体育信息化研究、体育创新能力、国际自闭谱系障碍研究进展分析、中国体育法研究、体育运动风险研究、国内外身体活动研究、我国体育科学研究、体育赛事研究、中国体育学科计量分析等主题的研究;四、体育产业。主要包括国内体育旅游研究、我国体育产业研究、国内体育旅游领域研究、体育专利领域、.冰雪产业、我国旅游消费、养老产业中体育服务等内容的研究应用;五、特色地区、群体体育。主要包括农村体育、民族传统体育运动研究、我国青少年体育研究、我国民俗体育研究、我国少数民族传统体育运动会、我国公共体育服务供给研究等内容;六、特色热点体育项目。包括我国校园足球研究、我国足球后备人才培养研究、我国冰雪体育旅游研究热点与发展趋势研究、对我国农村中小学校园足球制约因素研究等;七、体育文化。主要包括民间体育文化资源的开发及利用、川南民间体育文化资源、高校体育文化研究等内容的研究。

通过以上文献分类可以看出,当前知识图谱研究方法在体育类期刊、论文研究中应用较为普遍,对于体育科学研究、体育单项运动的研究、学校体育研究、体育产业研究、特色地域、群体体育、热点体育项目及体育文化的研究中均有学者运用此研究方法对于该领域的研究成果进行可视化分析并对发展趋势进行预测,可以说

知识图谱研究方法以图表的形式把作者想要展现的复杂数据形象直观的展现出来,具有直观性及较强的说服力。同时,通过以上分类发现,当前在体育文化研究领域对于知识图谱研究方法的应用尚不普遍,仅存在于对民间体育文化资源及高校体育文化研究两个方面进行了研究,由此,本人基于citespaceⅤ软件,以体育文化为研究对象进行可视化分析,以期填补空白,为当前体育文化研究提供参考依据。

三、Cite space下载过程

①百度搜索citespace,进入citespace官网https://www.sodocs.net/doc/f4305392.html,/~cchen/citespace/,点击software。

②打开计算机,点击系统属性,查看电脑系统类型(如64位操作系统)

③从官网寻找匹配计算机系统的Java JRE进行下载,并按照索引进行安装;

④再返回software页面,下载相应的citespace版本,可以选择最新日期版本,把压缩文件解压后,点击citespaceⅤ.jar即可进入citespace软件界面。

四、我国体育文化研究的知识图谱分析

通过中国知网把关键词、主题设置为体育文化,时间从2013

年8月到2018年8月,选取400篇核心期刊进行研究,导出文献后,选取refworks格式导出文献,保存为download**.text格式。通过Data Processing Utilities进行格式转化,输入citespace,时间范围选为2013年-2018年,slice设置为1,Node Types 选择为institution,得到以下数据图形

通过分析以上数据得出,从2013年8月至2018年8月之间,在体育文化研究领域,研究机构主要为高校体育学院,从分布来看,整体较为分散,个别研究机构较为突出。其中,华南师范大学体育科学学院、东北师范大学体育学院、北京体育大学、苏州大学体育学院及南昌大学(前湖校区)体育学院是核心期刊的主要输出单位,而华南师范大学体育科学学院、东北师范大学体育学院输出核心期

刊各11篇处于领先地位。

把Node Types 选择为keyword,重新得到了新的数据图形

通过分析以上数据图形可知,当前我国体育文化的研究以民族传统体育、体育管理、体育教育、体育史、群众体育、高校、体育产业等关键词在文献中出现频率较高,其中民族传统体育、群众体育出现频率最高,分别出现23次与19次,说明在当前研究中,民族传统体育文化及群众体育文化是体育文化研究的重点。从时间分布上来看,2017年、2018年发表的期刊当中,一带一路、中国公

民、协同发展、幸福感是出现频率较高的关键词,说明体育文化的研究是同当前我国政治、经济发展想适应的,体育文化的研究也正是为我国政治、经济的更好发展、实现人民对于美好生活的向往而不断努力的。

五、个人心得

知识图谱研究方法为文献研究成果提供了高效、直观的、分析工具,使人们一目了然看到以往研究的成果和关键,并根据时间点可以清楚看到研究的整个发展脉络,从而方便找出当前研究的发展变化趋势及未来研究热点,在以后的论文写作过程中可以充分利用知识图谱研究方法,来为自己的研究结论提供强有力的论据支撑。

通过了解知识图谱在论文中的应用发现,当前论文主要还停留在针对一个热点或课题选取相关文献进行数据分析的层面,只是把课题从不同角度分析得到的结果用相关数据、图形相对形象的呈现出来,并没有就这一结果进行进一步的原因探究,为什么会呈现这一结果,产生这一结果的根源或者渊源是什么并没有进一步阐释。再者,通过知识图谱研究方法分别对两个热点问题进行分析,比如体育文化及体育政策,得出其发展脉络和趋势,通过两者在不同时期的发展趋势,作用机制来探寻两者之间的关系,我认为是下一步探究的重点和难点。

徐敏

2018年8月4日

知识图谱构建方法研究

基于多数据源的知识图谱构建方法研究 摘要:针对多数据源的融合应用,构建了基于多数据源的知识图谱。首先,对不同领域内的数据源构建相应本体库,并将不同本体库通过数据融合映射到全局本体库,然后,利用实体对齐和实体链接方法进行知识获取和融合,最后,搭建知识图谱应用平台,提供查询和统计等操作。在实体对齐方面,利用传统的基于相似性传播实体对齐方法,获得良好的实体对齐效果;在实体链接方面,提出了基于约束嵌入转换的预测推理方法,实验结果表明,在预测准确率上取得较好的结果。 0 引言 在大数据时代背景下,随着海量数据的出现以及多数据源融合交叉应用,传统的数据管理模式以及查询方式受到一定的制约。近年来,知识图谱(Knowledge Graph)[1]作为一种新的知识表示方法和数据管理模式,在自然语言处理、问题回答、信息检索等领域有着重要的应用。知识图谱是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系;其基本组成单位是“实体-关系-实体”三元组,以及实体及其相关属性-值对,实体间通过关系相互联结,构成网状的知识结构[2]。 随着谷歌知识图谱的发布,知识图谱的构建与应用研究引起了学术界和工业界的广泛关注。在国内,知识图谱的构建与研究已经起步,相应取得许多重要的研究成果。如:搜狗的知立方、百度知心;复旦大学GDM实验室设计了一种面向图书阅读领域的中文知识图谱[3];金贵阳等[4]利用知识图谱和语义网技术,提出构建企业知识图谱的方法,并应用于钢铁企业信息集成,提高了企业信息查询的效率;胡芳槐[5]在博士论文中研究了基于多数据源的中文知识图谱构建方法,涉及到本体层构建、实体层的学习等,同时构建行业领域知识图谱的应用平台;王巍巍等[6]构建了双语影视知识图谱,包括影视本体库的构建、实体的链接、实体匹配等,并搭建了应用平台与开放数据访问接口;鄂世嘉等[7]提出了一种端到端基于中文百科数据的中文知识图谱自动化构建方案,并开发面向用户的中文知识图谱系统。 现有的行业领域知识图谱通常采用手工构建方式,缺乏统一的构建方法,且这类知识库目标是特定行业领域,因此,其描述范围极为有限。针对这些问题,提出了将不同领域知识库进行融合成一个知识图谱,旨在构建语义一致、结构一致的多数据融合知识图谱,实现对不同领域内的知识进行查询和展示,从而提高了数据查询效率。 本文提出一个多数据源融合的知识图谱构建流程,并对关键技术进行研究,包括数据源的获取、领域本体库的构建、全局本体库的构建、实体对齐、实体链接以及应用平台的搭建。文中利用某地区的医院医疗保健数据、空气污染监测数据和环境监测数据,构建了多数据融合的知识图谱。 1 知识图谱构建过程 知识图谱构建是知识图谱得以应用发展的前提,涉及实体抽取和实体及实体之间关系的建立,同时还需要很好地组织和存储抽取的实体与关系信息,使其能够被迅速的访问和操作[8]。知识图谱构建过程通常可以分成两步:知识图谱本体层构建和实体层的学习[5]。本体层构建通常包含术语抽取、同义词抽取、概念抽取、分类关系抽取、公理和规则学习;实体层学习则包含实体学习、实体数据填充、实体对齐和实体链接等。 知识图谱的构建方法通常有自顶向下和自底向上两种[2]。所谓自顶向下的方法是指先构建知识图谱的本体,即从行业领域、百科类网站及其它等高质量的数据源中,提取本体和模式信息,添加到知识库中;而自底向上的方法是指从实体层开始,借助于一定的技术手段,对实体进行归纳组织、实体对齐和实体链接等,并提取出具有较高置信度的新模式,经人工审核后,加入到知识图谱中。然而,在实际的构建过程中,并不是两种方法孤立单独进行着,而是两种方法交替结合的过程。本文在构建多数据源的知识图谱时采用两种方法的结合,首先采用自顶向下的方式来构建本体库,然后采用自底向上的方式进行提取知识来扩展知识图谱。

科学知识图谱在学科评价中的应用研究[开题报告]

(2011届) 本科毕业论文(设计) 开题报告 题目:科学知识图谱在学科评价中的应用研究学院:商学院 专业:信息管理与信息系统 班级: 学号: 姓名: 指导教师: 开题日期:

一、选题的背景、意义 1.该选题的历史背景及国内外现状 科学知识图谱,是将传统的文献计量方法与现代的文本挖掘和复杂网络、数学、统计学、计算机科学方法以及可视化技术等有机地整合在一起的一种综合分析科学发展的知识发现方法。从20世纪 50年代至今,科学知识图谱的研究已经有几十年的历史。 (1)引文分析理论的发展促进了科学知识图谱的兴起。20世纪60年代,加菲尔德(Eugene Garfield)创办科学引文索引 (SCI)。1965年,普赖斯以SCI为数据来源,发表了一篇科学计量学的杰作《科学论文的网络》。在这篇论文中,普赖斯第一次提出并界定了“研究前沿”的概念。到了20世纪70、80年代,匈牙利的三位学者T.布劳温 (Tibur Braun)、W.格伦采尔 (Wolfgang Glanze1)和A.舒伯特 (Andres Schubert)以SCI数据库为基础,出版了《科学计量学指标》,这实际上是世界科学地图和科学知识图谱的雏形。 (2)复杂网络系统和社会网络分析的兴起丰富了引文分析理论与方法。美国社会心理学家斯坦利·米尔格兰姆(Stanley Milligram)于1967年通过社会网络人际关系的“六度分隔”试验发现了著名的“小世界”现象。90年代中期,比利时情报计量学专家埃格赫 (Leo Egghe)和鲁索 (Ronald Rousseau)合作出版了《情报计量学引论》,促进了科学知识图谱的产生。进入21世纪,社会网络分析的探索与应用向纵深发展,风靡全球。 (3)信息可视化为科学知识图谱提供了强大的技术支持。1999年陈超美出版了该领域的第一部学术专著《信息可视化与虚拟环境》,R.斯宾塞 (Robert Spence)2000年出版了《信息可视化》之后相关研究如雨后春笋般涌现。 总体来讲,无论是企业还是科研领域,我国对知识图谱的关注滞后于国外。相比国外知识图谱的研究状况,我国起步稍晚,但是也取得了一些成绩。国内在知识图谱的应用方面缺少理论上的实证分析,主要是将知识图谱作为一个工具,应用于各个领域,而且相对于国外,应用研究还比较薄弱。目前而言,国内知识图谱研究中存在主要困难和问题如下: (1)研究手段和方法的严重滞后 国内近几年有关知识图谱的研究也有一些,如大连理工大学的刘则渊教授带领的团队进行了科学计量学、管理学人机工程学学科以及国内所有工程领域研究前沿的知识图谱构建;武汉大学的马费成、刘青林、社科院的蒋颖等也对国内外知识管理、数字资源管理、战略管理、文献计量学等领域进行了共词图谱的绘制;南京大学的邓三鸿、浙江大学的潘有能等初步建立了图书情报学科的学科知识地图;金莹以CSSCI 数据粗略构建了我国社会科学的学

知识图谱研究方法心得

体育政策研究现状、前沿热点与演化分析 ——基于科学知识图谱的可视化分析心得 一、主要内容 作者基于科学知识图谱可视化分析,通过Web of Science TM 文献资料数据库检索体育政策研究论文,以“体育政策”的标题、摘要、关键词和收录全文为研究对象,运用引文分析、共被引分析、聚类分析、词频分析、社会网络分析等基本方法,对体育政策研究的现状、前沿热点和演化路径进行分析,采用Cite SpaceⅢ可视化软件绘制科学知识图谱,将数据以图像形式呈现出来。 通过运用Cite SpaceⅢ可视化软件,一是通过选择“country”(国家)和“institution”(机构),时区分割设置为2(Time Slice Length=2),绘制了体育政策发文高产国家分布图;二是通过选择参数“Author”(作者),绘制了体育政策发文高产作者知识图谱;三是通过选择参数“Category”(学科),绘制了体育政策研究领域的学科贡献网络图谱;四是通过导入文献,在主题词资源(Term Source)中选择标题(Title)、摘要(Abstract),节点类型(Node Types)选择关键词(Keyword),绘制出了体育政策研究领域的学科贡献网络图谱。

分别对以上四个图谱进行分析得到以下结论:1.美国是体育政策研究的中心,无论从发文量还是文章的中心性都高居第一,高校是体育政策研究发文量的高产机构;2.体育政策领域研究者形成一小部分核心作者群,但数量较少,研究作者总体成离散性分布;3.体育政策研究需要多学科的支持,社会科学学科和公共科学学科是体育政策发文量的高产学科,形成以这两个学科为主流的研究领域;4.体育政策的关注点在不断的发展和变化,正在由对儿童的关注过渡到整体的公共健康,由体育活动过渡到发挥体育的教育功能,由对体育行为的控制过渡到形成终身体育的锻炼意识。 二、当前体育领域知识图谱研究方法应用现状 在中国知网通过以体育、知识图谱为主题和关键词进行搜索,根据关联度选取了104篇期刊、论文,进行分类发现当前体育领域应用知识图谱研究方法主要呈现在以下内容:一、单项运动。主要包括英文期刊中马拉松研究、、我国龙舟科研成果、国内外体育舞蹈研究、国外滑雪运动风险研究、太极拳运动研究、舞龙舞狮研究、攀岩运动研究、我国速度滑冰研究、国外篮球运动研究、国内外排球领域研究、羽毛球运动研究、我国乒乓球研究、我国体育舞蹈、国内外健美操、国内外啦啦操、网球研究、电子竞技现状、竞技游泳、国际有氧运动科学研究等项目的研究分析;二、学校体育教育。主要包括我国冰雪教学研究、我国体育教师教育研究

科学知识图谱研究综述

?新技术应用? 科学知识图谱研究综述 梁秀娟 (湘潭大学公共管理学院 湖南湘潭411105) 文 摘 随着可视化技术的发展,将其与引文分析技术相结合,可以直观、形象地向人们揭示学科以及学科之间的联系。本文结合国内外在引文分析和可视化方面的最新研究,从起源、概念、绘制方法、应用及研究展望等方面对科学知识图谱进行了较为详细的分析。 关键词 引文分析 可视化 科学知识图谱 Rev i ew of M app i n g Knowledge D o ma i n s L i a ng X i ujuan (Public Manage ment School of Xiang Tan University,XiangTan HuNan,411105) Abstract:W ith the devel opment of visual technol ogy which co mbined with citati on analysis technol2 ogy,it can reveal the link bet w een subjects intuitively and vividly.I n this paper,combined with the latest research on citati on analysis and visualizati on,we make a detailed intr oducti on in the areas of mapp ing knowledge domains fr om the origin,concep ts,techniques,app licati ons and the latest p r o2 gress. Key words:Citati on analysis,V isualizati on,Mapp ing knowledge domains 随着信息技术、可视化技术和科学计量学、文献计量学理论的发展,以图形的方式来揭示学科间的联系已不再是一件难事。而近年来科学计量学、文献计量学研究领域兴起的热点之一,就是如何在准确、翔实地传达知识的基础上以可视化的图像直观、形象地向人们揭示学科以及学科之间的联系。科学知识图谱(Mapp ing Knowledge Domains)正是在这一研究领域中出现的一个新的热点。 1 科学知识图谱的起源 科学知识图谱是引文分析与数据、信息可视化相结合的产物。引文分析是指利用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引证与被引证现象进行分析,以揭示其数量特征和内在规律的一种文献计量分析方法[1]。正式的引文分析始于上个世纪50年代初,1964年美国的尤金?加菲尔德(Eugene Garfield)创立引文数据库S C I(Science Citati on I ndex,科学引文索引),为学者们利用引文分析法分析学科领域知识结构提供了强有力的工具。S C I不仅为引文分析奠定了数据平台,而且使得规范化、高质量的引文分析成为可能。60年代早期,加菲尔德等人开始了基于引文数据的开拓性研究,他们在《应用引文数据撰写科学历史》(The use of citati on data in writing the hist ory of science)中绘制了DNA研究领域的历史发展图谱;不久之后,普赖斯用相同的数据在其一系列经典著作———《巴比伦以来的科学》《小科学,大科学》《科学文献的网络》中,进行了知识图谱绘制的开创性工作。尽管当时并没有使用“知识图谱”这一概念,但是,实际上以引文分析为基础的“知识图谱”理论与方法己经应运而生了[2]。国内自上个世纪80年代引入S C I,很快引起了广大学者的极大兴趣,被越来越多的科学研究者所认同和使用,主要用于揭示科学结构、研究科学史的发展规律、评价科研绩效、预测研究领域热点等方面。 与此同时,计算机技术的快速发展及其在科学计算领域的应用,为数据和信息处理提供了有力的

科学知识图谱研究综述

#新技术应用# 科学知识图谱研究综述 梁秀娟 (湘潭大学公共管理学院湖南湘潭411105) 文摘随着可视化技术的发展,将其与引文分析技术相结合,可以直观、形象地向人们揭示学科以及学科之间的联系。本文结合国内外在引文分析和可视化方面的最新研究,从起源、概念、绘制方法、应用及研究展望等方面对科学知识图谱进行了较为详细的分析。 关键词引文分析可视化科学知识图谱 R evie w of M apping Know ledge Dom ains L iang X i u j uan (Pub lic M anage m en t School of X iang Tan Un iversity,X iangTan H uN an,411105) Abst ract:W it h the develop m ent o f v isual techno logy w hich co mb i n ed w ith citation analysi s techno-l ogy,it can reveal the link bet w een subjects int u iti v e l y and v ividly.I n t h is paper,co mb i n ed w it h the latest research on citation ana l y sis and v isua lizati o n,w e m ake a de tailed introducti o n i n t h e areas o f m apping kno w ledge do m a i n s fro m the or i g i n,concepts,techniques,applications and the latest pr o-gress. K ey w ords:C itati o n analysis,V isualization,M app i n g kno w ledge do m ains 随着信息技术、可视化技术和科学计量学、文献计量学理论的发展,以图形的方式来揭示学科间的联系已不再是一件难事。而近年来科学计量学、文献计量学研究领域兴起的热点之一,就是如何在准确、翔实地传达知识的基础上以可视化的图像直观、形象地向人们揭示学科以及学科之间的联系。科学知识图谱(M app i ng K now l edge Dom ains)正是在这一研究领域中出现的一个新的热点。 1科学知识图谱的起源 科学知识图谱是引文分析与数据、信息可视化相结合的产物。引文分析是指利用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引证与被引证现象进行分析,以揭示其数量特征和内在规律的一种文献计量分析方法[1]。正式的引文分析始于上个世纪50年代初,1964年美国的尤金#加菲尔德(Eugene G arfield)创立引文数据库SCI(Science C itati on Index,科学引文索引),为学者们利用引文分析法分析学科领域知识结构提供了强有力的工具。SCI不仅为引文分析奠定了数据平台,而且使得规范化、高质量的引文分析成为可能。60年代早期,加菲尔德等人开始了基于引文数据的开拓性研究,他们在5应用引文数据撰写科学历史6(T he use of c itati on data i n w riti ng the hist o ry o f sc i ence)中绘制了DNA研究领域的历史发展图谱;不久之后,普赖斯用相同的数据在其一系列经典著作)))5巴比伦以来的科学65小科学,大科学65科学文献的网络6中,进行了知识图谱绘制的开创性工作。尽管当时并没有使用/知识图谱0这一概念,但是,实际上以引文分析为基础的/知识图谱0理论与方法己经应运而生了[2]。国内自上个世纪80年代引入SCI,很快引起了广大学者的极大兴趣,被越来越多的科学研究者所认同和使用,主要用于揭示科学结构、研究科学史的发展规律、评价科研绩效、预测研究领域热点等方面。 与此同时,计算机技术的快速发展及其在科学计算领域的应用,为数据和信息处理提供了有力的

知识图谱的发展与构建

第41卷第1期 2017年2月 南京理工大学学报 Journal of Nanjing University of Science a n d T echnology Vol.41 No.1 Feb.2017知识图谱的发展与构建 李涛i2,王次臣^2,李华康 (南京邮电大学1.计算机学院;2.江苏省大数据安全与智能处理实验室,江苏南京210003) 摘要:知识图谱作为一种智能、高效的知识组织方式,能够帮助用户迅速、准确地查询到自己 需要的信息。本文通过回顾学者及科研机构或公司对知识图谱的研究内容,对知识图谱的发展 和构建方法作了全面的介绍,包括知识图谱概念的起源、发展以及最终形成;构建知识图谱的数 据来源;构建过程中涉及的方法,包括本体和实体的抽取,图谱的构建、更新、维护,以及面向知 识图谱的内部结构挖掘和外部扩展应用。最后,对知识图谱的未来发展方向和面临的挑战作了 展望。虽然现在已经有很多知识图谱被应用到各类系统中,但是其基础理论和应用技术,仍需 展开进一步的研究。 关键词:知识图谱;构建方法;实体;知识挖掘;扩展应用 中图分类号:TP39 文章编号:1005-9830(2017)01-0022-13 D O I:10.14177/https://www.sodocs.net/doc/f4305392.html,ki.32-1397n.2017.41.01.004 Development and construction of knowledge graph Li Tao1,2,Wang Cichen1,2,Li Huakang1,2 (1. School of Computer Science;2.Jiangsu Province Key Lab of Big Data Sec Processing,Nanjing University of Posts and Telecommunications,Nanjing210003,China) A b s tra c t:Knowledge graph,as an intelligent and efficient way for knowledge organization,enables users to quickly and accurately query the information they need.In this paper,we provide a comprehensive survey on the development and construction of knowledge graph by reviewing and summarizing recent advances i n the research and practice of knowledge graph systems in the relevant literature.In particular,our introduction includes the concept origin,development,and eventual formation of t he knowledge graph,various data sources for the knowledge graph,the ontology construction and the entity extraction,and the process of knowledge mining,updating,and maintenance.Finally,we discuss the technical challenges,development trends,and future research 收稿日期:2016-07-25修回日期:2016-12-18 基金项目:国家自然科学基金(61502247,11501302,61502243,91646116);中国博士后科学基金(2016心600434); 江苏省科技支撑计划(社会发展)项目(B E2016776);江苏省“六大人才高峰”项目(X Y D X X J S-C X T D- 006);江苏省博士后科研基金(1601128B)资助 作者简介:李涛(1975-),男,博士,教授,主要研究方向:数据挖掘,E-mail:toweiiee@njupt. edu. c n。 引文格式:李涛,王次臣,李华康.知识图谱的发展与构建[J].南京理工大学学报,2017,41(1):22-34. 投稿网址:http://zrxuebao. njust. edu. cn

知识图谱构建方法研究

知识图谱构建方法研究 Company number:【0089WT-8898YT-W8CCB-BUUT-202108】

基于多数据源的知识图谱构建方法研究摘要:针对多数据源的融合应用,构建了基于多数据源的知识图谱。首先,对不同领域内的数据源构建相应本体库,并将不同本体库通过数据融合映射到全局本体库,然后,利用实体对齐和实体链接方法进行知识获取和融合,最后,搭建知识图谱应用平台,提供查询和统计等操作。在实体对齐方面,利用传统的基于相似性传播实体对齐方法,获得良好的实体对齐效果;在实体链接方面,提出了基于约束嵌入转换的预测推理方法,实验结果表明,在预测准确率上取得较好的结果。 0 引言 在大数据时代背景下,随着海量数据的出现以及多数据源融合交叉应用,传统的数据管理模式以及查询方式受到一定的制约。近年来,知识图谱(Knowledge Graph)作为一种新的知识表示方法和数据管理模式,在自然语言处理、问题回答、信息检索等领域有着重要的应用。知识图谱是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系;其基本组成单位是“实体-关系-实体”三元组,以及实体及其相关属性-值对,实体间通过关系相互联结,构成网状的知识结构。 随着谷歌知识图谱的发布,知识图谱的构建与应用研究引起了学术界和工业界的广泛关注。在国内,知识图谱的构建与研究已经起步,相应取得许多重要的研究成果。如:搜狗的知立方、百度知心;复旦大学GDM实验室设计了一种面向图书阅读领域的中文知识图谱;金贵阳等利用知识图谱和语义网技术,提出构建企业知识图谱的方法,并应用于钢铁企业信息集成,提高了企业信息查询的效率;胡芳槐在博士论文中研究了基于多数据源的中文知识图谱构建方法,涉及到本体层构建、实体层的学习等,同时构建行业领域知识图谱的应用平台;王巍巍等构建了双语影视知识图谱,包括影视本体库的构建、实体的链接、实体匹配等,并搭建了应用平台与开放数据访问接口;鄂世嘉等

基于Web的领域知识图谱构建平台的研究与实现

基于Web的领域知识图谱构建平台的研究与实现领域知识图谱通常是从特定领域资源中抽取实体和实体之间的 语义关系而构建的语义网络,它包含的知识体系具有很强的领域针对 性和专业性。领域知识图谱构建平台则是为领域专家提供的,基于海 量数据构建领域针对性强、准确度高的知识体系的简单易用的半自动化工具,应具备如下三个特点:构建流程定义完备;能够涵盖领域知识 图谱构建过程中数据获取、信息抽取、知识融合、构建图谱、知识更新等各个流程;引入大数据处理能力;海量数据处理加工成为知识的 过程离不开大数据平台的支持,因此平台需要具备大数据处理能力; 简单易用,可操作性强;由于领域知识图谱具有很强的领域针对性和 专业性,使用门槛过高不利于领域专家在构建过程中进行监督与干预。但是在当前大多公开的领域知识图谱构建平台中,还存在知识图谱构 建流程定义不完善、缺乏大数据相关技术的支持和对于领域专家来说可操作性差的问题与挑战:当前大多公开的领域知识图谱构建平台对 于知识图谱构建流程定义不完善,孤立地强调了知识图谱构建环节的 某几个方面,诸如知识图谱中的数据采集、知识表示、图谱可视化等,不足以支撑全生命周期知识图谱构建工作;当前大多公开的领域知识 图谱构建平台鲜少提及知识图谱构建过程中对应需要大数据相关技 术的支持,缺乏对知识图谱实际构建过程的指导价值。在基于平台构 建领域知识图谱的过程中,为保证精确度,往往需要领域专家的监督 与干预,但是自然语言处理技术和大数据处理流程对于领域专家来说 理解难度大,技术实现门槛高,可操作性差,对领域知识图谱的普及和

应用产生了一定的限制。针对以上问题与挑战,本文重点围绕领域知识图谱的构建技术和流程进行研究与分析,完成了基于Web的领域知识图谱构建平台的设计与实现,主要研究内容有以下三项:1)设计并实现了基于Web的领域知识图谱构建平台,为领域专家提供构建流程定义完备、具备大数据处理能力且简单易用的知识图谱构建服务。在开发过程中为实现知识图谱构建流程的自定义编排,提出并实现了一种可视化Web服务组合编排技术。此外,还提出并实现了 DSACC(Dynamics Scheduling Algorithm for Concurrent Connections)算法,解决了知识图谱可视化过程中大数据量渲染的前端性能优化问题。2)提出并实现了一种基于大数据驱动的领域知识图谱构建方法,在完成第一项研究内容后,本文对知识图谱构建流程进一步总结,旨在研究在知识图谱构建过程中对应需要大数据相关技术的支持,为知识图谱的实际构建过程提供一定的参考价值。3)以基于Web的领域知识图谱构建平台为工具,以一种基于大数据驱动的领域知识图谱构建方法为指导,完成人工智能产业知识图谱的构建。图谱涵盖3458家人工智能企业,1087个人工智能领域技术标签,16324条专利数据,69866条相关新闻,全面展示人工智能产业发展现状,进一步证明平台与方法的有效性和完整性。

国内知识图谱研究综述与评估20042010年

国内知识图谱研究综述与评估:2004-2010年 * 汤建民/余丰民 2012-9-21 10:11:12 来源:《情报资料工作》2012年01期【英文标题】Review and Evaluation of Knowledge Mapping Research in China: 2004-2010 【作者简介】汤建民,男,1967年生,浙江树人大学科学计量学研究中心主任、教授,杭州310015;余丰民,1976年生,浙江树人大学图书馆副研究馆员,杭州310015 【内容提要】文章综合运用词频统计、共词分析及可视化技术等文献计量方法,分析了国内知识图谱研究的整体现状,包括论文的总量分布、发表期刊分布、作者分布、机构分布、基金资助分布及论文研究热点等,并综合归纳了论文研究的主要内容。在此基础上,对该研究领域的现状和存在的问题进行了综述和评估,并提出了相应的对策。 This paper combines word frequency analysis, co-word analysis and visualization to demonstrate the general situation of knowledge mapping study in China. The authors discuss the distribution of papers, published journals, authors, organizations and funds as well as the focus of the existing papers and sum up main contents of the study. On this basis, the paper reviews and evaluates the status of the research and its existing problems, puts forward relevant counter-measures.

基于文献计量的科学知识图谱发展研究

收稿日期:2009-05-16 修回日期:2009-07-23 作者简介:任红娟(1979-),女,博士研究生,研究方向为情报分析、文献计量和战略情报;张志强(1964-),男,教授,博士生导师,研究方向为战略情报、地球科学、生态经济学。 基于文献计量的科学知识图谱发展研究 The Evolution of Mapping K now ledge Domains B ased on the Bibliometrical Method 任红娟1,2 张志强1 (1.中国科学院国家科学图书馆兰州分馆 兰州 730000;2.中国科学院研究生院 北京 100090) 摘 要 利用文献计量方法综合研究科学知识图谱领域发展状况的研究相对比较少的问题,从构建种子数据集,并利用一级引用在进行数据集扩展的基础上,采用作者共被引和共词分析方法对科学知识图谱研究领域的知识结构进行了划分,并利用逐年演化的高频词共现关系分析了该领域的演化趋势和研究重点,从定量和定性结合的角度对科学知识图谱研究领域进行了全面的描述。关键词 作者共被引 共词分析 科学知识图谱 中图分类号 G 310 文献标识码 A 文章编号 1002-1965(2009)12-0086-05 0 引 言 科学知识图谱[1],是将传统的文献计量方法与现代的文本挖掘和复杂网络、数学、统计学、计算机科学方法以及可视化技术等有机地整合在一起的一种综合分析科学发展的知识发现方法。它利用一定的方式把抽象数据映射在2D 或3D 的图形中,从宏观、中观、微观各个层面来揭示一个领域或者学科、主题发展的概貌,使得人们能够从各个角度全面地审视一个学科的结构和研究热点、重点等信息。由于图形展示方式,非常符合人的认知习惯,而且比起文本信息,人的大脑能够处理更多的图形信息,因此科学知识图谱的方法越来越受到各个领域研究者的关注。 虽然自文献计量学出现以来就有了科学知识图谱发展的雏形[2-4],但其真正的发展是在20世纪90年代末。十多年来科学知识图谱方法体系在不断的发展和扩充,如今处在一个什么样的发展阶段?主要研究哪些内容?领域的主要领军人物是谁?领域的研究结构如何?这些信息到目前都还不十分明了。虽然国内外的学者对于科学知识图谱的发展都进行了综合的研究[5-7],但主要还是从描述和内容总结的角度出发的。从定量的角度来研究科学知识。 图谱领域的发展,尤其是领域的演化趋势还很少有人涉及。因此,本文主要从计量学的角度对科学知识图谱研究领域的主要参与主体和研究的内容以及研究的动态进行了深入的研究。 1 科学知识图谱主要代表人物和主要研究内容分析 1.1 种子数据集的构建和基础分析 选取汤姆森科技的SCI 和SSCI 数据库,利用“science mapping ”or “mapping science ”or “visualiz 3knowledge domain 3”or “knowledge domain 3visualiz 3”or “mapping knowledge domain 3”为检索词进行主题检索,选取数据库收录的 所有年限的数据,检索结果共得到70篇文献。去除与该领域不相关的遥感和地理学领域的文献并经过去重处理,共得到50篇文献,是该领域的研究成果的集中代表。从这些文献的来源期刊的学科分布来看,主要集中在信息科学和图书馆科学、计算机科学和信息系统学科领域。 从学科的产出分布来看,德莱克斯大学的陈超美是这个领域最高产的作者,论文数量达到了8篇,可以说是科学知识图谱领域的领军人物。他不但比较早就开始关注和研究科学知识图谱方法,而且还自行研发了CITESPACE 一代和二代可视化软件[8],主要用于分析文献、期刊和作者之间的共被引关系。利用 PFNETs 、期望值最大化、时间序列等算法,把基于文献 的数据转化为多彩的可视化图谱。目前这个软件已经在知识图谱和文献计量领域被广泛采用。 排在第二位的是Small ,他是科学计量和文献计量领域的重要代表人物之一。从Small 的几个代表作品来看,在知识图谱领域他主要关注大科学的图谱,而不是学科专业知识的展示和揭示,着重宏观知识图谱方 第28卷 第12期2009年12月 情 报 杂 志JOURNAL OF IN TELL IGENCE Vol.28 No.12Dec. 2009

大数据在商业中的研究态势与前沿热点--基于科学知识图谱的文献计量分析

基金项目:国家自然科学基金项目 互联网+ 平台型企业创新生态系统的治理二协同效应与生态优势研究 (项目编号:71772163?项目负责人:谢洪明)成果之一?浙江省自然科学基金项目 浙江省自然科学基金项目 互联网+ 背景下平台生态系统的竞争力及其动态竞争 (项目编号:LY16G020009?项目负责人:谢洪明)成果之一? 作者简介:谢洪明?管理科学与工程博士?浙江工业大学管理学院教授二博士生导师?研究方向:企业战略管理?杨浩(通信作者)?浙江工业大学管理学院硕士研究生?研究方向:创新创业二战略管理? 大数据在商业中的研究态势与前沿热点 基于科学知识图谱的文献计量分析 谢洪明一杨一浩 (浙江工业大学管理学院?杭州310023) 摘一要:基于WOS数据库文献来源?运用文献计量方法?对2011 2018年和商业相关联的大数据研究文献数据进行文献统计分析以及关键词共现分析?绘制研究热点知识图谱?研究发现:基于商业的大数据研究呈现多科学交叉趋势?涉及管理二经济二信息技术等多个学科?信息技术二大数据与商业管理和经济的渗透发展二新时代背景下的大数据和商业深度融合应用是当下研究热点?社交网络二企业组织二知识管理是近几年来的前沿趋势?关键词:商业领域?大数据?知识图谱?研究热点 一一随着信息技术的发展?人类进入数字信息时代?互联网二云计算二物联网二GPS等新兴技术的涌现催生了海量数据?2011年?麦肯锡在题为?海量数据? 创新二竞争和提高生产率的下一个新领域?的研究报告中指出?数据已经渗透到每一个行业和业务职能领域?逐渐成为重要的生产因素?而人们对于海量数据的运用将预示着新一波生产率增长和消费者盈余浪潮的到来?人二机二物三元世界的高度融合?带来数据规模的爆炸式增长?促进当今社会进入大数据时代?2008年9月世界顶级学术期刊?Nature?出版 BigData 专刊? 大数据 逐渐在学术界得到越来越多的关注?大数据在商业和消费者创造价值方面具有巨大的潜力?其所蕴含的潜在价值将被释放?引起新一波的创业方向二创造价值和投资机会 [1] ? 1一数据来源与研究方法 本文选择国际公认社会科学领域中最好的核心期刊数据库 ISIWebofKnowledge中的SCI ̄EX ̄ PANDED和SSCI数据库作为文献来源?主题词选择 bigdata ?将文献类型限制为论文和综述?年限为 2011 2018年?将学科类别限制在管理二商业二经济二商业与金融4个相关领域?通过对搜索结果进行精炼?最后得到739篇文献?筛除搜索结果中的新闻报道和无关联文献?最后确定726篇文献作为数据来源?科学知识图谱把知识域作为对象?以图像形式显示科学知识的发展进程与结构关系[2]?通 过对文献信息可视化分析?使研究者能够直观捕捉相关研究领域的作者和研究机构二关键词二参引文献二被引作者等?从而把握某一学科或知识域在一定时期发展的趋势与动向[3 ̄4]?本文使用CiteSpace可视化分析软件绘制可视化知识图谱?梳理和总结商业层面上大数据研究的热点与态势?并在此基础上提出未来该领域的研究展望?以提供理论价值和实践意义? 2一论文数据统计分析 2.1一文献增长趋势分析 通过对文献数量变化及时序规律的统计分析?可以把握某一领域的总体发展速度及研究水平?图1显示了近8年来商业领域大数据研究的时间特 征?该领域大数据研究文献从2011 2018年间呈现总体上升趋势?从检索到的726篇文献中可以发现?虽然大数据研究至今已经有十余年?但在2011年之前商业领域的大数据研究论文依旧是空白状态?直到2011年Lavalle二Steve等人在?MITSLOANMANAGEMENTREVIEW?上发表了题为?BigData? 2 4

科学知识图谱

科学知识图谱应用研究概述 廖胜姣肖仙桃 知识图谱是可视化显示知识资源及其关联的一种图形,可以绘制、挖掘、分析和显示知识间的相互关系,在组织内创造知识共享的环境,从而最终达到促进知识交流和研究深入的目的。从20世纪50年代至今,科学知识图谱的研究已经有几十年的历史。科学知识图谱出现之前,科学计量学家们一直努力在寻找一种同传统方法相比,具有更大的客观性、科学性、数据的有效性和高效率的新方法来研究科学学科的结构与进展。科学知识图谱出现之后,其相关的理论与应用研究不断涌现。本文试图从应用的角度对科学知识图谱的研究与发展状况进行一个系统的梳理,具体从应用领域、研究机构与网站以及绘图软件方面着手。 1应用研究现状 从20世纪50年代开始兴起的各种文献计量方法为科学知识图谱的出现奠定了坚实的理论基础,是科学知识图谱理论与方法的“根”。如今,知识图谱已经成为计量学领域的一个新兴分支,活跃在各个领域的研究中。笔者将从应用领域、研究机构和软件方面阐述科学知识图谱的应用研究状况。

1.1应用领域方面 科学知识图谱的应用领域很广,从科研到教学到社会问题的解决等,无不渗透。 1.1.1应用于科研领域 笔者认为,知识图谱最早是在科研领域活跃起来的。在知识图谱中,学科前沿之间的交互关系是以空间的形式展现出来的。研究发现,科学引文与被引文之间往往有着学科内容上的联系。通过引文聚类分析,特别是从引文间的网状关系进行研究,能够探明有关学科之间的亲缘关系和结构,划定某学科的作者集体,分析推测学科间的交叉、渗透和衍生趋势,还能对某一学科的产生背景、发展概貌、突破性成就、相互渗透和今后发展方向进行分析,从而揭示科学的动态结构和某些发展规律。这里仅列举近些年知识图谱的一些应用研究情况。White,McCain,Garfield,Boyack,Huang等对知识图谱的用途进行了不断的扩充,得出知识图谱的主要应用有:文献、专利的结构分析;学科动态、社会网络、领域发展分析等;Shiffrin等认为,涉及到展开的学科间科学区域的知识图谱旨在绘制图形、挖掘、分析、分类、导航以及显现知识等等。 将知识图谱方法应用于构建学科知识图谱的研究人员

科学知识图谱效能评估可视化分析

系统效能是系统的实际行为表现与系统目标的匹配程度,其度量和评估往往牵涉系统科学、管理科学和行为科学等多个领域[1]。目前,国内效能评估研究成果多集中在武器装备[2]、火控雷达[3]、电子对抗[4]等领域,研究内容包括评估指标体系及模型构建、评估方法及模拟仿真。但是,这些研究主要是效能评估领域某一知识点的微观聚焦,缺乏对该领域研究现状整体格局的宏观可视化分析。科学知识图谱(MappingKnowledgeDomains)是用于显示科学知识发展进程和结构关系的图形,既是具有时间序列化的知识谱系,又是可视化的知识图形;可对知识或研究群体所构成的复杂网络进行聚类分析和共引分析,将海量数据以图形、图像等可视化集中表现形式,挖掘数据之间的潜在关联,实现数据可视化信息处理,以协助人们做出科学合理的决策[5-6]。科学知识图谱分析技术在大数据时代背景下发展迅速[7],目前被广泛应用于管理科学[8]、安全科学[9-10]、科技管理[11]等领域。笔者基于华裔学者陈超美开发的科学知识图谱可视化软件CiteSpaceV[12],以中国知网CNKI上的核心期刊为数据源,检索效能评估领域近20年所载论文,分析研究成果产出时序、研究力量分布、作者合作、机构合作、关键词及其文献共引、突变词分析;通过科学知识图谱的可视化分析呈现效能评估研究领域的知识结构、规律和分布情况,实现科学知识从微观聚焦到宏观可视化分析的突破,进而对效能评估领域研究动态的总体把握。 1效能评估研究成果可视化分析 1.1数据来源及方法。以“主题=效能评估”在中国知网(CNKI)上检索最近20年(1998年~2017年)的文献,共得到3089条数据;根据布拉德福定律可知,少数核心期刊集中了该研究领域的大量重要文献,于是在高级检索中将期刊来源类别选择为核心期刊和EI源期刊,检索条件:精确,经过筛选去除不相关的声明、通知、公告等,可得该领域的有效文献1248篇。将检索结果导出为Refworks文本文件,导入CiteSpaceV中进行格式转换,“TimeSlicing”选择1998年-2017年,“YearsPerSlice”设置1年为一个时间分区,“TOPNPerSlice”选择阈值50,即每个时区选择高频出现的前50个节点,采用网络裁剪运算策略(pruningslicednetwork),绘制作者、机构合作网络知识图谱,有效地完成效能评估领域科学研究进行可视化分析。1.2论文产出时间图谱。论文产出是衡量研究领域已有知识的累积量以及成熟程度的重要指标,笔者将效能评估研究近20年的核心期刊论文进行时间图谱分析如图1所示:效能评估领域研究论文产出曲线基本符合科学文献的指数增长规律———普赖斯逻辑增长曲线。1998年-2000年,国内效能评估研究还处于初级阶段,论文年平均不超过10篇,是普赖斯曲线缓慢增长的初级阶段;2001年-2003年,国内效能评估

我国自然辩证法研究科学知识图谱_姜春林

第26卷 第3期2010年 3月 自然辩证法研究Studies in Dialectics of Nature V ol .26,N o .3 M ar .,2010·问题讨论·文章编号: 1000-8934(2010)03-0104-05我国自然辩证法研究科学知识图谱 姜 春 林 (大连理工大学21世纪发展研究中心辽宁大连116024) 摘要:利用科学计量学的前沿研究方法———科学知识图谱,基于CSSCI (1998-2008)收录的我国自然辩证法研 究领域三大核心期刊数据,借助于改进的Bibex cel 计量软件,从作者合作、机构合作、关键词共现、共被引等几个指标分别绘制了科学知识图谱。从图谱中快速了解到,我国自然辩证法研究形成了以山西大学郭贵春等为代表的一些主要群体,以科学技术、科学哲学和技术哲学为核心话题,以国外经典学术著作为学科研究的文献基础。 关键词:自然辩证法;科学知识图谱;科学计量学 中图分类号:N 031 文献标志码:A 收稿日期:2009-08-26 基金项目:大连理工大学人文社会科学项目(D U T HS2008304);大连理工大学研究生院教改项目(JG 0805)作者简介:姜春林(1970-),吉林延边人,大连理工大学副教授,主要研究方向为科学学与科学技术管理。会员号:I010******* 对于任何一位从事学术工作的人来讲,无论他 是资深研究者还是学术新手,无论是期刊编辑还是科研管理者,都希望能够快捷而准确地了解某一学科的发展状况。科学学是一个对科学技术进行整体研究和深度反思的学科领域,其子学科———科学计量学的一些重要手段无疑对于人们探析学科发展线索提供了重要方法论支持。自然辩证法是一个涵盖哲学、科技史、科学社会学等学科的跨学科研究领域。她以其独特的学科特质向人们展示了思想深邃的理论成果和立足现实问题关照的实践成果。从科学学视角看,需要向关心自然辩证法领域的人群解答此类元问题:近年来,自然辩证法研究的队伍如何,他们都在关心一些什么样的问题,研究成果产生了何种影响,学者们的引证文献呈现什么特征......近年来,已有国内学者对我国自然辩证法的发展状况从科学计量学的角度做了大量细致研究。贺天平等人对《自然辩证法通讯》20多年的载文做了详细的计量分析〔1〕 ,汤建民也对该刊被引用情况做 了定量研究 〔2〕 ;成素梅等人受编辑部委托对《自然辩 证法研究》1985-1997年的载文进行了统计分 析〔3〕;韩永强等人在纪念《科学技术与辩证法》创刊20周年之际,对该刊发展历程从多角度做了剖析〔4〕;鞠树成等人以CSSCI 为数据源,从被引角度全面分析了《科学技术与辩证法》的学术影响力状况〔5〕。上述研究都做了大量的文献调查,得到了详 实的统计数据,分析了典型的科学计量学指标,得出了一些令人信服的结论。但是上述研究也存在一定局限性,如分析样本多为某一期刊,缺乏对整个自然辩证法领域的全面分析。同时研究结果多以统计数字来展示,生动直观性不够。 科学知识图谱是利用数学、图形学、统计学、计算机科学,通过一定算法显示科学知识的发展进程、状况及其结构关系的一种图形。目前作为一种有效的方法论已成为国际科学学和科学计量学界主流研究领域之一〔6〕。本文尝试利用科学知识图谱方法,以“快照”形式,快速、全面、直观展示近十年来我国自然辩证法研究领域的发展状况。 1 样本选择和数据来源 众所周知,《自然辩证研究》、《自然辩证法通讯》 和《科学技术与辩证法》是我国自然辩证法界三大核心期刊,集中了自然辩证法最主要的研究成果。尽管有成果散见发表在其他综合性期刊中,但从文献量和影响力角度看,仍不及三大刊在学人中的地位高。因此,我们选择三大刊作为研究样本有相当的代表性。数据直接从中文社会科学引文索引(CSS -CI )中下载,下载年份为1998———2008年。数据下载格式存为.tx t 。 104

相关主题