搜档网
当前位置:搜档网 › 大数据在商业中的研究态势与前沿热点--基于科学知识图谱的文献计量分析

大数据在商业中的研究态势与前沿热点--基于科学知识图谱的文献计量分析

大数据在商业中的研究态势与前沿热点--基于科学知识图谱的文献计量分析
大数据在商业中的研究态势与前沿热点--基于科学知识图谱的文献计量分析

基金项目:国家自然科学基金项目 互联网+ 平台型企业创新生态系统的治理二协同效应与生态优势研究 (项目编号:71772163?项目负责人:谢洪明)成果之一?浙江省自然科学基金项目 浙江省自然科学基金项目 互联网+ 背景下平台生态系统的竞争力及其动态竞争 (项目编号:LY16G020009?项目负责人:谢洪明)成果之一?

作者简介:谢洪明?管理科学与工程博士?浙江工业大学管理学院教授二博士生导师?研究方向:企业战略管理?杨浩(通信作者)?浙江工业大学管理学院硕士研究生?研究方向:创新创业二战略管理?

大数据在商业中的研究态势与前沿热点

基于科学知识图谱的文献计量分析

谢洪明一杨一浩

(浙江工业大学管理学院?杭州310023)

摘一要:基于WOS数据库文献来源?运用文献计量方法?对2011 2018年和商业相关联的大数据研究文献数据进行文献统计分析以及关键词共现分析?绘制研究热点知识图谱?研究发现:基于商业的大数据研究呈现多科学交叉趋势?涉及管理二经济二信息技术等多个学科?信息技术二大数据与商业管理和经济的渗透发展二新时代背景下的大数据和商业深度融合应用是当下研究热点?社交网络二企业组织二知识管理是近几年来的前沿趋势?关键词:商业领域?大数据?知识图谱?研究热点

一一随着信息技术的发展?人类进入数字信息时代?互联网二云计算二物联网二GPS等新兴技术的涌现催生了海量数据?2011年?麦肯锡在题为?海量数据?

创新二竞争和提高生产率的下一个新领域?的研究报告中指出?数据已经渗透到每一个行业和业务职能领域?逐渐成为重要的生产因素?而人们对于海量数据的运用将预示着新一波生产率增长和消费者盈余浪潮的到来?人二机二物三元世界的高度融合?带来数据规模的爆炸式增长?促进当今社会进入大数据时代?2008年9月世界顶级学术期刊?Nature?出版 BigData 专刊? 大数据 逐渐在学术界得到越来越多的关注?大数据在商业和消费者创造价值方面具有巨大的潜力?其所蕴含的潜在价值将被释放?引起新一波的创业方向二创造价值和投资机会

[1]

?

1一数据来源与研究方法

本文选择国际公认社会科学领域中最好的核心期刊数据库 ISIWebofKnowledge中的SCI ̄EX ̄

PANDED和SSCI数据库作为文献来源?主题词选择 bigdata ?将文献类型限制为论文和综述?年限为

2011 2018年?将学科类别限制在管理二商业二经济二商业与金融4个相关领域?通过对搜索结果进行精炼?最后得到739篇文献?筛除搜索结果中的新闻报道和无关联文献?最后确定726篇文献作为数据来源?科学知识图谱把知识域作为对象?以图像形式显示科学知识的发展进程与结构关系[2]?通

过对文献信息可视化分析?使研究者能够直观捕捉相关研究领域的作者和研究机构二关键词二参引文献二被引作者等?从而把握某一学科或知识域在一定时期发展的趋势与动向[3 ̄4]?本文使用CiteSpace可视化分析软件绘制可视化知识图谱?梳理和总结商业层面上大数据研究的热点与态势?并在此基础上提出未来该领域的研究展望?以提供理论价值和实践意义?

2一论文数据统计分析

2.1一文献增长趋势分析

通过对文献数量变化及时序规律的统计分析?可以把握某一领域的总体发展速度及研究水平?图1显示了近8年来商业领域大数据研究的时间特

征?该领域大数据研究文献从2011 2018年间呈现总体上升趋势?从检索到的726篇文献中可以发现?虽然大数据研究至今已经有十余年?但在2011年之前商业领域的大数据研究论文依旧是空白状态?直到2011年Lavalle二Steve等人在?MITSLOANMANAGEMENTREVIEW?上发表了题为?BigData?

计算机科学前沿热点及发展趋势

计算机科学前沿热点及发展趋势 摘要:计算机科学围绕信息、知识、智能等主题发展迅速。文章系统地介绍了信息处理、文字与自然语言的理解、数据仓库和数据挖掘;知识科学;人工智能、人工神经网络的研究、遗传算法、逻辑学等领域研究中前沿的若干问题,并提出未来计算机科学的发展趋势。 关键词:信息技术知识科学智能技术发展趋势 在短短的60年里,计算机科学发展至今,取得了巨人的成就。从观念上改变了人们对世界的认识,将人类社会带入了信息时代。加速T人类社会的发展。在今天计算机科学技术已经成为人们日常生活工作中不可或缺的重要组成部分,而计算机技术的发展也将越来越多影响人类社会的进步。 1 计算机科学前沿热点 近年来,计算机科学中前沿的问题主要围绕信息、知识、智能三大研究领域展开讨论。本文中所指的信息是指客观事物的属性。而知识不同于信息,它是人们对信息经过大脑的加工与处理后,形成的规律、规则、方法及认识。智能则是指大脑从历史信息、知识的基础之上形成的对现有信息、知识的推理、演绎、判断的方法。 根据研究分析表明,在三大研究领域中,主要有以下前沿热点研究: (1)信息方面:信息处理、数据仓库和数据挖掘、生物信息学。 (2)知识方面:以知识科学与知识工程为主要研究的问题。 (3)智能方面:以人工神经网络的研究,机器证明,人工智能与专家系统,遗传算法,代数逻辑学形成了本研究领域的主要特色。 1.1 信息科学 1.1.1 信息处理技术 信息处理技术是当今计算机科学发展的重点,目前计算机处理的信息可分为符号和数据,因而一切要由计算机处理的对象首先是符号化和数字化。信息科学正在形成和迅速发展,现在主要的研究课题集中在以下六个方面: (1)信息源理论和信息的获取。主要研究自然信息源和社会信息源,以及从信息源提取信息的方法和技术。 (2)信息的传输、存储、检索、转化和处理。 (3)信号的测量、分析、处理及显示。 (4)模式信息处理。研究对文字、声音,图像等信息的处理、分类和识别,研制机器图像和语音识别系统。 (5)知识信息处理。研究知识的表示、获取和应用,建立具有推理和自动解决问题能力的知识信息处理系统,即专家系统。 (6)决策和控制。在对信息的采集、分析、处理、识别和理解的基础上作出判断、决策或控制,从而建立各种控制系统、管理信息系统和决策支持系统。 1.1.2 数据挖掘技术 传统的数据库技术是单一的数据资源,即以数据库为中心,对事务处理、批处理到决策分析等各种类型的数据处理工作。近年来,随着计算机技术的发展,对数据库中数据操作提出了更高的要求,希望计算机能够更多的参与数据分析与决策的制定等领域。数据库处理可以大致划分为两大类:操作型处理和分析型处理(或信息型处理)。这种分离,划清了数据处理的分析型环境与操作型环境之间的界限,从而由原来的以单一数据库为中心的数据环境发展为一种体系化环境,因而产生了数据挖掘技术。在这方面目前主要解决的前沿问题有: (1)异构数据的接口机制;(2)数据仓库的体系结构问题;(3)数据仓库的数据优化问题;(4)数据仓库中数据的获取与整理;(5)历史数据的提出和信息挖掘;(6)信息挖掘的方法学问题;

课程与教学论研究的前沿热点

《课程与教学论研究的前沿热点——教学研究中的问题意识》 吴刚平,华东师大课程与教材研究所副所长,教授,博士生导师。近年来在课程改革与教材建设方面发表学术论文、专着70余篇,在20多家刊物刊登。2015年4月10日下午,吴教授在新疆师范大学教科院作此讲座。 (讲座记录:刘军笔录,未经本人审阅。2015年4月10日) 去新疆师范大学教科院听了华东师大教授吴刚平先生的讲座,深有感触和启发。付刚老师要求我录上音转给他听一听,但这录音也没能保住。今天下午稍有点时间就整理了一下笔记,晚饭后接着整理发现就七千多字了。实际上还有一些生动的案例没记全。在这里分享给大家吧,毕竟有许多朋友没有机会一睹吴教授的风采,领略他对课改精深的研究成果的冰山一角。 一、关于从教学意识向课程意识的扩展问题。 近年来不少人说我们的教育出了问题,实际上指的也就是教学。难道把教学与课程分离?许多问题不是教学所能解决的问题,因为它是社会问题。比如说一些课程学生不喜欢,这是教学出了问题吗?对于中小学教师来说,教学目标这是个核心问题,是最重要的东西。但不少教师则总觉得不是该他们关心的问题,而只关心教学。因为标准是国家定的,教师不清楚,认为做得再多也没有意义。教师只关心教学的材料和内容,不关心目标是什么,所以质量是无法保证的。 比如《捕蛇者说》,学生从小学、中学到大学都在学,同样的教学内容,各个阶段怎样教,怎么学,就是目标。小学生,知道这个故事就行了;中学生则要读字习词弄清句子意思,学些修辞,还要了解时代背景;大学则要整体把握。如它在文学史上的地位等。学成怎样,学出什么来,这就是不同的目标。这也就是课程知识中的重要东西。教师在自己的学习、教书生涯中,关于课程是缺乏专业基础的,但课改要求我们的教师要变化,要有专业发展,

第13章++知识图谱与知识推理

第13章知识图谱与知识推理 王泉 中国科学院大学网络空间安全学院 2016年11月

?13.1概述 ?13.2知识图谱构建 ?13.3 知识图谱中的知识推理–13.3.1 表示学习技术 –13.3.2 张量分解技术 –13.3.3 路经排序算法?13.4 本章小结

?13.1概述 ?13.2知识图谱构建 ?13.3 知识图谱中的知识推理–13.3.1 表示学习技术 –13.3.2 张量分解技术 –13.3.3 路经排序算法?13.4 本章小结

实体和关系 ?实体 (entity):现实世界中可区分、可识别的事物或概念–客观对象:人物、地点、机构 –抽象事件:电影、奖项、赛事 ?关系 (relation):实体和实体之间的语义关联 –BornInCity, IsParentOf, AthletePlaysForTeam

?知识图谱 (knowledge graph):实体和关系所构成的异质、有向图,是表征实体间语义关联的语义网络 ?节点代表实体 ?边代表不同类型的关系 (异质) ?两个节点之间有边相连表明它们之间存在相应关系 ?边是有向的表明关系是非对称的

?三元组 (triple/triplet):也称事实 (fact),是最基本的知识存储方式,表现为(主语, 谓词, 宾语)形式 (Tom, BornInCity, Paris) (Tom, LivedInCity, Lyon) (Tom, Nationality, France) (Tom, ClassMates, Bob) (Paris, CityLocatedInCountry, France) (Lyon, CityLocatedInCountry, France) (Bob, BornInCity, Paris)

科学知识图谱研究综述

?新技术应用? 科学知识图谱研究综述 梁秀娟 (湘潭大学公共管理学院 湖南湘潭411105) 文 摘 随着可视化技术的发展,将其与引文分析技术相结合,可以直观、形象地向人们揭示学科以及学科之间的联系。本文结合国内外在引文分析和可视化方面的最新研究,从起源、概念、绘制方法、应用及研究展望等方面对科学知识图谱进行了较为详细的分析。 关键词 引文分析 可视化 科学知识图谱 Rev i ew of M app i n g Knowledge D o ma i n s L i a ng X i ujuan (Public Manage ment School of Xiang Tan University,XiangTan HuNan,411105) Abstract:W ith the devel opment of visual technol ogy which co mbined with citati on analysis technol2 ogy,it can reveal the link bet w een subjects intuitively and vividly.I n this paper,combined with the latest research on citati on analysis and visualizati on,we make a detailed intr oducti on in the areas of mapp ing knowledge domains fr om the origin,concep ts,techniques,app licati ons and the latest p r o2 gress. Key words:Citati on analysis,V isualizati on,Mapp ing knowledge domains 随着信息技术、可视化技术和科学计量学、文献计量学理论的发展,以图形的方式来揭示学科间的联系已不再是一件难事。而近年来科学计量学、文献计量学研究领域兴起的热点之一,就是如何在准确、翔实地传达知识的基础上以可视化的图像直观、形象地向人们揭示学科以及学科之间的联系。科学知识图谱(Mapp ing Knowledge Domains)正是在这一研究领域中出现的一个新的热点。 1 科学知识图谱的起源 科学知识图谱是引文分析与数据、信息可视化相结合的产物。引文分析是指利用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引证与被引证现象进行分析,以揭示其数量特征和内在规律的一种文献计量分析方法[1]。正式的引文分析始于上个世纪50年代初,1964年美国的尤金?加菲尔德(Eugene Garfield)创立引文数据库S C I(Science Citati on I ndex,科学引文索引),为学者们利用引文分析法分析学科领域知识结构提供了强有力的工具。S C I不仅为引文分析奠定了数据平台,而且使得规范化、高质量的引文分析成为可能。60年代早期,加菲尔德等人开始了基于引文数据的开拓性研究,他们在《应用引文数据撰写科学历史》(The use of citati on data in writing the hist ory of science)中绘制了DNA研究领域的历史发展图谱;不久之后,普赖斯用相同的数据在其一系列经典著作———《巴比伦以来的科学》《小科学,大科学》《科学文献的网络》中,进行了知识图谱绘制的开创性工作。尽管当时并没有使用“知识图谱”这一概念,但是,实际上以引文分析为基础的“知识图谱”理论与方法己经应运而生了[2]。国内自上个世纪80年代引入S C I,很快引起了广大学者的极大兴趣,被越来越多的科学研究者所认同和使用,主要用于揭示科学结构、研究科学史的发展规律、评价科研绩效、预测研究领域热点等方面。 与此同时,计算机技术的快速发展及其在科学计算领域的应用,为数据和信息处理提供了有力的

G研究报告前沿及热点评析

2009年我国3G研究前沿及热点评析 摘要:2009年,随着3G的普及推广及应用,我国媒体发生的变化,手机媒体发展及手机 广告都是受关注的问题。本文选取了2009年3G研究之文章八十余篇,从3G媒体本身、3G 媒体与传统媒体、3G媒体与网络媒体、3G时代的手机媒体广告等五个方面对这些文章进行归类分析,以描述2009年度的3G媒体研究现状,为3G媒体以后的研究有所裨益。 关键词:3G手机媒体手机广告传统媒体 2009年1月7日工业和信息化部为中国移动、中国电信和中国联通发放3张第三代 移动通信<3G)牌照,自此,期待了十多年之久的3G时代终于来临。3G时代的手机媒体, 3G新媒体与传统媒体,媒介融合,3G手机广告发展等等都是09年3G研究重点之所在。 一、3G技术及特征 3G是“ 3rd Generation ”的简写,代表着第三代移动通信技术。手机问世至今,经历了第一代模拟制式手机<1G和第二代GSM TDMA等数字手机<2G)。 3G是指将无线通信与国际互联网等多媒体通信结合的新一代移动通信系统,有人简称其为“无线互联网”。 相对第一代模拟制式手机(1G1和第二代GSM TDMA等数字手机(2G>, 3G通信的名称繁多,国际电联规定为“ IMT-2000 ”(国际移动电话2000>标准,欧洲的电信业巨头们则称其为“ UMTS通用移动通信系统。该标准规定,移动终端以车速移动时,其传送数据速率为144Kbps,室外静止或步行时速率为 384Kbps,而室内为2Mbp&但这些要求并不意味着用户可用速率就可以达到2Mbps,因为室内速率还将依赖于建筑物内详细的频率规划以及组织与运营商协作的紧密程度。目前已经进行商业应用的 2.5G移动通信技术是从2G迈向3G 的衔接性技术,由于3G是个相当浩大的工程,所牵扯的层面多且复杂,要从目前的2G迈 向3G不可能一下就衔接得上,因此出现了介于2G和3G之间的2.5G。HSCSD GPRS WAP EDGE 蓝牙(Bluetooth〉、EPOC等技术都是2.5G 技术。 国际电信联盟<TTU将3G定义为便于成长、拓展带宽和支持多样化应用的第三代移动通信技术。“便于成长”是指3G技术具有和2G的兼容性;“拓展带宽”意味着在传输声 音和数据的速度上得到极大提升;而“支持多样化应用”则是指3G技术能够处理图像、音 乐、视频流等多种媒体形式,从而支持手机提供手机电视、手机广播、手机广告,无线上网、视频电话等多种信息服务。1 二、3G时代的手机媒体发展 在中国互联网络信息中心(CNNIC>发布的《中国手机媒体研究报告》中,把手机媒体分为手机报、手机音频广播、手机视频、手机电视和手机小说五种形式。3G技术的成熟与普 及为手机媒体提供了一个信息传输更为高效的网络,这极大的拓宽了手机媒体的应用范围,促进了手机媒体的发展。有些学者认为,在3G时代,手机媒体必将成为主流新媒体, 并对手机媒体的发展前景颇为看好,而有学者却指出,手机媒体由于自身限制,只能成为其他媒体的补充,甚至不能被称作“第五媒体”。在这些探讨中,可以看出,3G时代的手 机媒体发展前景是光明的,但现在,也仅仅处在起步阶段。 有学者通过SWOT分析得出手机媒体的潜在机遇与威胁、优势与劣势。潜在机遇包括3G系统的技术优势;政府资金及政策扶植;手机用户基数大,手机上网人数激增。潜在威胁包括:用户接受程度及阅读习惯的障碍;定位空间内竞争者较多;立法滞后、监管缺位。潜在优势包括:3G手机终端的自身优势;传播特性。潜在劣势包括:产业价值链及运

政治学研究前沿与热点问题

政治学研究前沿与热点问题 政治学是研究以国家政权为核心的社会主要政治现象和政治关系的科学。改革开放以来,中国政治学取得了长足的发展,不断为中国特色社会主义政治发展提供理论指导和理论服务。了解政治学研究的前沿与热点问题,有利于政治学研究工作者更好地思考中国政治学繁荣发展的思路,对促进中国特色社会主义政治学的健康发展,推动中国特色社会主义政治发展具有重大的理论意义和现实意义。 一、中国政治学的发展阶段 中国,政治学既是一门古老的学科,也是一门新兴的学科。我们的祖先给我们留下了丰富的政治学方面的典籍,几千年的治国理念和治国实践,尤其是政治制度和机制方面的创制和运作,曾经为中华文明的创立繁荣立下了汗马功劳。 伴随改革开放恢复和发展起来的中国政治学,坚守经世致用的学科本质,始终把握时代脉搏,紧随历史前进的步伐,服务于中国的政治体制改革和中国特色社会主义政治建设和政治发展,在30年的辉煌历程中,大致经历了以下4个发展阶段: 第一个阶段,恢复和重建阶段(1977-1985年)。改革开放伊始,面对中国经济、政治、社会生活一系列的制度性疑惑和体制性缺陷,中国社会呼唤着政治学为中国的政治生活提供说明、解读和指引,为推进中国特色社会主义的政治建设提供理论支撑和理论服务,使我们的政治建设更加合理、科学和优良。中国特色社会主义政治建设需要政治学为其提供理论支撑和服务。 第二个阶段,飞速发展阶段(1986-1989年)。随着政治体制改革的全面展开和社会主义民主建设的飞速发展,中国政治学政治学研究的学术视野迅速拓展,在社会大众中的影响不断扩大。尤其是在党的十三大前后,政治学研究开始出现政治体制改革研究热潮,并直接带动、强化了政治制度研究、反腐败研究和行政体制改革研究等。 第三阶段,全面深刻反思阶段(1989-1991年)。1989年之后,中国政治学届的广大理论工作者和实际工作者,以高度负责的精神,对恢

信息抽取层、知识融合层、知识加工层

《知识图谱构建技术综述》—— 笔记 刘峤李杨段宏刘瑶秦志光《计算机研究与发展》, 2016, 53 (3):582-600 一、摘要 说明知识图谱的定义和内涵 将知识图谱分成信息抽取层、知识融合层、知识加工层 分类说明三个层次涉及的关键技术的研究现状 面临的挑战和关键问题 二、知识图谱的定义与架构 2.1 定义 知识图谱:是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系。其基本组成单位是。“实体-关系-实体”三元组,以及实体及其相关属性-值对,实体间通过关系相互联,构成网状的知识结构。 知识图谱本身是一个具有属性的实体通过关系链接而成的网状知识库。(从图的角度看,图中节点表示实体(概念),节点之间的边表示实体与实体之间的关系) 2.2 架构 知识图谱自身的逻辑结构 数据层:知识以事实(fact)为单位存储在图数据库。 模式层:模式层在数据层之上,是知识图谱的核心。储存提炼过的知识,采用本体库进行管理模 式层。 知识图谱所采用的技术(体系)架构(本文的重点) 知识图谱的构建过程是从原始数据出发,采用一系列自动或半自动的技术手段,从原始数据中提取出知识要素(即事实),并将其存入知识库的数据层和模式层的过程.这是一个迭代更新的过程,根据知识获取的逻辑,每一轮迭代包含3个阶段:信息抽取、知识融合以及知识加工。

2.3 构建方式 自顶向下:从高质量数据中提取本体和模式信息,加入到知识库中。 自底向上:从公开采集的数据中提取出资源模式,选择其中置信度较高的新模式,加入到知识库中。 三、知识图谱的构建技术

3.1 信息抽取 信息抽取是一种自动化地从半结构化和无结构数据中抽取实体、关系以及实体属性等结构化信息的技术。关键技术包括:实体抽取、关系抽取和属性抽取。 实体抽取(命名实体识别NER) 指从文本数据集中自动识别出命名实体。(最关键最基础) 关系抽取 1. 实体抽取得到的是离散的命名实体,还需从相关预料中提取出实体之间的关系。 2. 关系抽取就是解决如何从文本语料中抽取式体检关系这一问题。 属性抽取 1. 属性抽取的目标是从不同信息源中采集特定实体的属性信息。由于可以将实体的属性视为实体与 属性值之间的一种名词性关系,因此也可以将属性抽取问题视为关系抽取问题。 2. 属性抽取一般是从百科类网站上的半结构化数据中抽取,或者是采用数据挖掘的办法直接从文本 中挖掘实体属性与属性值之间的关系模式。据此发现对属性名和属性值在文本中的定位。

知识图谱概述与应用

导读:知识图谱 (Knowledge Graph) 是当前的研究热点。自从2012年Google推出自己第一版知识图谱以来,它在学术界和工业界掀起了一股热潮。各大互联网企业在之后的短短一年纷纷推出了自己的知识图谱产品以作为回应。比如在国,互联网巨头百度和搜狗分别推出”知心“和”知立方”来改进其搜索质量。那么与这些传统的互联网公司相比,对处于当今风口浪尖上的行业 - 互联网金融,知识图谱可以有哪方面的应用呢? 目录: 1. 什么是知识图谱? 2. 知识图谱的表示 3. 知识图谱的存储 4. 应用 5. 挑战 6. 结语 1.什么是知识图谱? 知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里

输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。 另外,对于稍微复杂的搜索语句比如”Who is the wife of Bill Gates“,Google能准确返回他的妻子Melinda Gates。这就说明搜索引擎通过知识图谱真正理解了用户的意图。 上面提到的知识图谱都是属于比较宽泛的畴,在通用领域里解决搜索引擎优化和问答系统(Question-Answering)等方面的问题。接下来我们看一下特定领域里的 (Domain-Specific) 知识图谱表示方式和应用,这也是工业界比较关心的话题。 2.知识图谱的表示 假设我们用知识图谱来描述一个事实(Fact) - “三是四的父亲”。这里的实体是三和四,关系是“父亲”(is_father_of)。当然,三和四也可能会跟其他人存在着某种类型的关系(暂时不考虑)。当我们把也作为节点加入到

科学知识图谱研究综述

#新技术应用# 科学知识图谱研究综述 梁秀娟 (湘潭大学公共管理学院湖南湘潭411105) 文摘随着可视化技术的发展,将其与引文分析技术相结合,可以直观、形象地向人们揭示学科以及学科之间的联系。本文结合国内外在引文分析和可视化方面的最新研究,从起源、概念、绘制方法、应用及研究展望等方面对科学知识图谱进行了较为详细的分析。 关键词引文分析可视化科学知识图谱 R evie w of M apping Know ledge Dom ains L iang X i u j uan (Pub lic M anage m en t School of X iang Tan Un iversity,X iangTan H uN an,411105) Abst ract:W it h the develop m ent o f v isual techno logy w hich co mb i n ed w ith citation analysi s techno-l ogy,it can reveal the link bet w een subjects int u iti v e l y and v ividly.I n t h is paper,co mb i n ed w it h the latest research on citation ana l y sis and v isua lizati o n,w e m ake a de tailed introducti o n i n t h e areas o f m apping kno w ledge do m a i n s fro m the or i g i n,concepts,techniques,applications and the latest pr o-gress. K ey w ords:C itati o n analysis,V isualization,M app i n g kno w ledge do m ains 随着信息技术、可视化技术和科学计量学、文献计量学理论的发展,以图形的方式来揭示学科间的联系已不再是一件难事。而近年来科学计量学、文献计量学研究领域兴起的热点之一,就是如何在准确、翔实地传达知识的基础上以可视化的图像直观、形象地向人们揭示学科以及学科之间的联系。科学知识图谱(M app i ng K now l edge Dom ains)正是在这一研究领域中出现的一个新的热点。 1科学知识图谱的起源 科学知识图谱是引文分析与数据、信息可视化相结合的产物。引文分析是指利用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引证与被引证现象进行分析,以揭示其数量特征和内在规律的一种文献计量分析方法[1]。正式的引文分析始于上个世纪50年代初,1964年美国的尤金#加菲尔德(Eugene G arfield)创立引文数据库SCI(Science C itati on Index,科学引文索引),为学者们利用引文分析法分析学科领域知识结构提供了强有力的工具。SCI不仅为引文分析奠定了数据平台,而且使得规范化、高质量的引文分析成为可能。60年代早期,加菲尔德等人开始了基于引文数据的开拓性研究,他们在5应用引文数据撰写科学历史6(T he use of c itati on data i n w riti ng the hist o ry o f sc i ence)中绘制了DNA研究领域的历史发展图谱;不久之后,普赖斯用相同的数据在其一系列经典著作)))5巴比伦以来的科学65小科学,大科学65科学文献的网络6中,进行了知识图谱绘制的开创性工作。尽管当时并没有使用/知识图谱0这一概念,但是,实际上以引文分析为基础的/知识图谱0理论与方法己经应运而生了[2]。国内自上个世纪80年代引入SCI,很快引起了广大学者的极大兴趣,被越来越多的科学研究者所认同和使用,主要用于揭示科学结构、研究科学史的发展规律、评价科研绩效、预测研究领域热点等方面。 与此同时,计算机技术的快速发展及其在科学计算领域的应用,为数据和信息处理提供了有力的

人力资源管理热点前沿问题

1、浅析股票期权激励机制在公司治理中的作用 2、中国劳动力流动及户籍问题研究 3、中国农村劳动力转移与城市化问题研究 4、中国民族企业的人力资源管理问题分析 5、现代企业薪酬设计 6、现代企业人事测评技术及其应用 7、国有企业的管理人员培训问题研究 8、研发人员素质测评体系构建 9、中层行政管理人员评价体系的建立 10、员工持股计划在我国国有企业中的应用 11、关于经营管理者称奇报酬激励机制的探讨 12、国有企业经营者年薪制的思考 13、浅析企业员工绩效考核制度 14、论激励在现代企业人力资源管理中的作用 15、沟通在绩效管理中的体现研究 16、绩效考评方法体系研究 17、小型IT企业人力资源管理问题的研究 18、企业中高层管理人员的选拔研究 19、工资管理制度的比较分析 20、公司如何平衡各部门员工的绩效工资 21、企业销售人员绩效考评体系研究 22、浅议我国企业绩效评价体系 23、薪酬制度与员工激励问题初探 24、工资决定因素与企业劳动工资改革分析 25、论企业管理中的激励问题 26、中小企业实行股份合作制的探讨 27、成才素质研究系统 28、论我国劳动力市场的培育和完善 29、论现代企业制度中的员工持股计划 30、企业员工的培训与开发 31、职工持股计划在高技术产业的探索与实践 32、知识经济时代人力资源的新发展 33、关于企业职工持股若干问题的研究 34、关于企业管理人员绩效考评研究 35、基于KPI的绩效管理体系设计 36、战略与绩效考核的桥梁------平衡计分卡实施研究 37、基于工作绩效的雇员流动机制研究 38、招聘面试的方案设计与研究 39、国有企业绩效考评问题研究 40、企业管理人员绩效考核体系研究 41、企业绩效评价的方法与应用 42、手机终端零售人员人力资源管理方法与研究 43、我国国有企业经营者报酬激励机制研究 44、工作绩效评估中的信度问题研究

知识图谱概述及应用

导读:知识图谱(Knowledge Graph) 是当前的研究热点。自从2012年Google推出自己第一版知识图谱以来,它在学术界和工业界掀起了一股热潮。各大互联网企业在之后的短短一年内纷纷推出了自己的知识图谱产品以作为回应。比如在国内,互联网巨头百度和搜狗分别推出”知心“和”知立方”来改进其搜索质量。那么与这些传统的互联网公司相比,对处于当今风口浪尖上的行业- 互联网金融,知识图谱可以有哪方面的应用呢? 目录: 1. 什么是知识图谱? 2. 知识图谱的表示 3. 知识图谱的存储 4. 应用 5. 挑战 6. 结语 1.什么是知识图谱? 知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。

知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。 另外,对于稍微复杂的搜索语句比如”Who is the wife of Bill Gates“,Google能准确返回他的妻子Melinda Gates。这就说明搜索引擎通过知识图谱真正理解了用户的意图。

基于知识图谱和人工智能技术的数据关系智能辨识及可视化应用

XXX公司科学技术项目可行性研究报告 项目名称:基于知识图谱和人工智能技术的数据关系智能辨识及可视化管理研究 申请单位: 起止时间:2020年1月1日-2020年12月31日项目负责人: 通信地址: 邮政编码: 联系电话:

传真: 申请日期:2019.09

一、目的和意义 XXX公司(以下简称“公司”)正在大力推进泛在电力物联网及坚强智能电网建设,对电网及电网企业的信息化水平提出了更高的要求,尤其是对于数据资产的深入挖掘利用、全业务流程的协同贯通,有着迫切的需求。因此,全面建设了全业务统一数据中心,实现了源端全业务融合、后端大数据分析。 随着全业务统一数据中心的全面建设,数据的价值发现及使用越来越受重视。为追求企业数据价值最大化,历史数据贯通以及基于业务规则的数据异常发现势在必行。目前虽然通过主数据管理,统一编码管理等方式进行了数据贯通和数据管理,但是对于历史数据的梳理和贯通却收效胜微。主要存在以下问题: (1)对于历史数据的贯通多采用人工的方式,质量难以得到保证。 (2)需要对原业务系统进行改造,返工工作量及配合成本巨大。 (3)缺乏有效的保障措施,难以确保数据贯通的持续有效。 (4)缺乏知识提取技术,尤其是对于半结构化和非结构化数据知识提取存在盲区,丢失了很多有价值数据,缺乏覆盖电网全业务的知识图谱。 (5)缺少统一的知识库,数据搜索需在多个数据库或应用中分别实现,缺乏关联性,搜索体验差,缺乏智能推荐等功能。 (6)数据资源缺乏全生命周期管控,数据处理各个环节不能有效监管。 因此,亟需在全业务统一数据中心的数据仓库与数据集市之间通过语义标准构建业务数据知识图谱,引入数据化决策模型和监控体系,建立公司信息全息画像,实现业务数据的跨业务贯通,并提供网格化的高速检索和深度挖掘功能,提升企业管理的规范化、标准化、精益化水平。

国外竞争情报研究热点_前沿及趋势的可视化分析

国外竞争情报研究热点、前沿及趋势的可视化分析 杨利军 魏晓峰 中山大学资讯管理系 广州510006 摘要 利用W eb of Science 的文献数据,借助C ite Space 软件绘制知识图谱,分析国外竞争情报研究的重要学科领域、知识基础、研究热点和前沿,预测未来竞争情报研究的趋势,为国内竞争情报研究和学科发展规划提供必要的参考依据。 关键词 竞争情报 信息可视化 知识图谱 分类号 G350 V isualizati o n Analysis of t he Hot Topics ,Frontiers and Trends of R esearches on Foreign Com petitive Intel ligence Y ang L ijun W e iX iao feng Schoo l o f Infor m ation M anage m ent ,Sun Y at sen Un i v ers it y ,G uang z hou 510006 Ab stract U si ng docu m en ts dat um fro m W eb o f Sc i ence and m app i ng v isua lized know ledge doma i ns by operati ng C iteSpace ,t h is pa per ana l yses i m portant sub j ects invo l ved ,kno w l edge base ,the hot top i cs and fron tiers of researches on foreign co m pe titive intelligence ,furt her predicts resea rch trends to prov i de essenti a l re ferences for furthe r research ,develop m ent and l ayou t o f sub j ect on do m esti c co m petiti ve intelligence . K ey word s competiti ve i n telligence i nfor m a tion v isuali zati on m app i ng know ledge dom a i ns 收稿日期:2010-05-11 修回日期:2010-07-19 本文起止页码:62-66 本文责任编辑:王传清 1 引 言 竞争情报是当今市场激烈竞争和社会信息化高度发展的必然产物,是指以提高企业的竞争力为目的,关于竞争环境、竞争对手和竞争策略的情报。它不仅包括竞争数据的收集和行业数据、竞争对手的分析,而且还体现出企业的一项核心能力,即通过对有关竞争对手、竞争环境和竞争策略信息的收集与分析,生成关于企业机会、威胁、优势与弱点的新知识和情报,并以此为依据制定出能够发挥和保持企业竞争优势的经营战略;它既是一种信息产品,又是一种信息活动和过程。竞争情报已经成为企业等竞争实体核心竞争力的集中体现 [1] 。 国外在此方面的研究起步早于国内,研究成果及其转化应用也比国内成熟。因此,有必要对国外竞争情报领域的研究状况进行总结,以供国内各方参考借鉴。 2 数据来源及处理 2.1 数据来源 本文所使用的数据来源于W e b of Science 数据库, 检索时间为2010年1月20日。检索表达式设定为Top ic=( co mpet it*i i ntelligence )OR Top i c=( co mpetiti * i nfor mati on )OR T opic=(co mpetiti * S AME i ntelli gence)OR Topic=(co m pet it*i SA M E i nfor mation),学科 类别范围是所有学科领域;入库时间设定为2000-2010年;文献类型只包含期刊论文(A rticl e)。经过检索得到有效的文献记录为1522篇,总引文频次为10517,引证文献(去除自引)为9563篇,如图1和图2所示: 图1 每年出版的文献数 2.2 数据处理工具 C iteSpace 是美国德雷赛尔大学( D rexel Un i versity)

第14章 知识图谱的落地与实践

《知识图谱: 概念与技术》 第14 讲 知识图谱落地与实践 肖仰华 复旦大学 shawyh@https://www.sodocs.net/doc/c011015594.html,

概述

知识图谱产业概览 产业化概览 KW 构建大规模通用知识图谱和领域图谱, 为机器认知提供背景知识 百科图谱 商情图谱 垂直图谱 知识图谱数据与服务 提供领域知识图谱构建与应用咨询 服务或落地解决方案,给华为、电 信、移动、阿里巴巴、滴滴等数十 家应用单位提供了知识图谱解决方 案。 知识图谱咨询与方案 1)支撑知识图谱运作的混合型系 统,提供高效稳定的查询; 2)领域知识图谱构建的工具集成 系统,提供知识图谱构建能力 智能数据获取系统 图数据库系统 知识库构建工具集 底层支撑系统与产品

系统 技术体系 智能信息获取 图数据管理 数据 商情图谱 工商、产品、投融资、诉讼、专利软著、商标 百科图谱 人物、字词、地理、经济、军事、科学、社会 其他图谱 影视、音乐法律、食物 服务 百科问答 知识库验证码 实体链接 信息抽取 智能水军

支构建 应用 知识图谱能力体系 文本理解 工商百度百科 中文维基音乐图管图嵌入 图划分查询分发关联查询 图缓存 社团查询 基于mongo 数据的管理 分布式爬虫 智能爬虫 移动端支持优先级调度 多语言支 持 屏蔽检测验证码智能枚举抽取 概念识别概念抽取 实体链接 中文OpenIE 纯文本事实抽取 关系分类体系构建 关系抽取 实体识别融合 冲突消解属性值归一化 属性融合 属性值分割标注 众包 样本优化远程监督 实体理解 文本相似性文本提问 文档标签化 文档摘要搜索推荐 AVP 检索Type 检索描述检索 领域数据标注 关系标注 概念标注 垂直领域 开放领域 半结构化数据抽取 清洗 补全 类别补全属性补全 三元组补全 纠错 众包反馈版本更迭 错误检测外链 DBpedia 类别链接中英文跨语言链接 SameAs 外链 更新 主动更新基于日志的更新 周期更新 局点同步意图理解 对答 知识库对话 知识库问答 实体同义词 同义实体识别 图片实体化 文本实体化推理 众包反馈版本更迭 传递性推理

管理学前沿和热点介绍

管理学前沿和热点介绍 我们现在的考试中不仅仅有很多基础知识。也会有涉及到现在管理学的一些前沿知识和热点知识。所以我们现在将开辟此栏目来帮助大家!!! 这期是:标杆管理因为工作比较忙。所以希望用一个月的时间把这期做好。 希望大家支持。你也可以这样做了,或者把好的东西发到论坛上。 标杆管理(benchmarking)起源于70年代末80年代初美国学习日本的运动中,首 开标杆管理先河的是施乐公司。1976年以后,一直保持着世界复印机市场实际垄断地 位的施乐遇到了来自国内外特别是日本竞争者的全方位挑战,如佳能、NEC等公司以 施乐的成本价销售产品且能够获利,产品开发周期、开发人员分别比施乐短或少50% ,施乐的市场份额从82%直线下降到35%。面对着竞争威胁,施乐公司最先发起向日 本企业学习的运动,开展了广泛、深入的标杆管理。施乐公司使用了"竞争标杆方法 "(Competitive benchmarking)概念和方法,这个方法是指,从生产成本、周期时 间、营销成本、零售价格等领域中,找出一些明确的衡量标准或项目,然后将施乐公 司在这些项目的表现,与佳能等主要的竞争对手进行比较,找出了其中的差距,弄清 了这些公司的运作机理,全面调整了经营战略、战术,改进了业务流程,很快收到了 成效,把失去的市场份额重新夺了回来。在提高交付定货的工作水平和处理低值货品 浪费大的问题上,同样应用标杆管理方法,以交付速度比施乐快3倍的比恩公司为标 杆,并选择14个经营同类产品的公司逐一考察,找出了问题的症结并采取措施,使仓 储成本下降了10%,年节省低值品费用数千万美元。于是,西方企业群

起学习借鉴, 把标杆管理作为竞争的最佳指导,优化企业实践,提高企业经营管理水平和市场竞争 力,取得了显著的改进成效。一些企业取得了系统突破,许多公司回报在五倍以上。 什么是标杆管理? 标杆管理的概念可概括为:不断寻找和研究同行一流公司的最佳实践,以此为基 准与本企业进行比较、分析、判断,从而使自己企业得到不断改进,从而进入赶超一 流公司创造优秀业绩的良性循环过程。其核心是向业内或业外的最优企业学习。通过 学习,企业重新思考和改进经营实践,创造自己的最佳实践,这实际上是模仿创新的 过程。 标杆管理站在全行业甚至更广阔的全球视野上寻找基准,突破了企业的职能分工 界限和企业性质与行业局限,重视实际经验,强调具体的环节、界面和流程,因而更 具有特色。 标杆管理的三种方法 标杆管理主要分为战略性、操作性和国际性三种。 1、战略性标杆管理,是在与同业最好公司进行比较的基础上,从总体上关注企 业如何竞争发展,明确和改进公司战略,提高公司战略运作水平。战略标杆管理是跨 越行业界限寻求绩优公司成功的战略和优胜竞争模式。 战略性标杆分析需要收集各竞争者的财务、市场状况进行相关分析,提出自己的 最佳战略。许多公司通过标杆管理成功地进行了战略转变。 2、操作性标杆管理,是一种注重公司整体或某个环节的具体运作,找出达到同 行最好的运作方法。从内容上可分为流程标杆管理和业务标杆管理。流程标杆管理是 从具有类似流程的公司中发掘最有效的操作程序,使企业通过改进核心过程提高业绩

2020-2021年中国知识图谱行业研究报告

中国知识图谱行业研究报告 2019-2020年

场中以金融领域和公安领域应用份额占比最大。 摘要 人工智能本质是解决生产力升级的问题,人类生产力可以归类为知识生产力和劳动生产力,人工智能走入产业后,可以分为感知智能、认知智能和行为智能,后两者更与生产力相对应,NLP 和知识图谱是发展认知智能的基础。 原始数据通过知识抽取或数据整合的方式转换为三元组形式,然后三元组数据再经过实体对齐,加入数据模型,形成标准的知识表示,过程中如产生新的关系组合, 通过知识推理形成新的知识形态,与原有知识共同经过质量评估,完成知识融合, 最终形成完整形态上的知识图谱。 在面对数据多样、复杂,孤岛化,且单一数据价值不高的应用场景时,存在关系深度搜索、规范业务流程、规则和经验性预测等需求,使用知识图谱解决方案将带来最佳的应用价值。 2019年涵盖大数据分析预测、领域知识图谱及NLP 应用的大数据智能市场规模约为 106.6亿元,预计2023年将突破300亿元,年复合增长率为30.8%,其中2019年市 随着整体市场数据基础的完善和需求唤醒,大数据智能领域规模持续走高,但在行业可落地性和理性建设的限制下,预计市场增速将呈现下降趋势,期间咨询性需求将会大量出现,从整体发展来看增速处于良性区间,对真正有价值的公司和产品有正向意义。 4 5 1 3 2

1知识图谱技术概述 中国知识图谱市场概述2中国知识图谱细分市场分析3中国数据智能代表企业案例展示4

人工智能技术分类和趋势 三种流派的融合应用,使人工智能向想象更进一步 人工智能是对一类能够实现机器模拟智慧生命某些特征的技术统称,从学术上可以分为,对人类已有知识进行组织编辑的 符号主义、通过数学理论公式推导聚类和预测问题的连接主义,以及利用机器模仿生物活体行为的行为主义三个流派,分 别以知识工程、机器学习和仿生机器人为时代代表,而知识图谱就是新一代知识工程的具体体现。2012年,深度学习在计算机视觉和智能语音上产生重大突破,打开了人工智能商业化的大门,使得连接主义一度成为人工智能的代名词,但随着 应用落地成为主旋律,缺位行业逻辑和理论概念的连接主义,往往找不到最佳的应用场景而止步于浅层尝试,在此背景下, 人工智能技术应当走向融合,符号主义需要连接主义提供强大的计算支撑,连接主义需要符号主义的逻辑指导,二者又共 同作用于行为主义,充当机器人的大脑和“记忆宫殿”,在多种技术综合利用下的垂直领域智能解决方案才是当今最符合 市场期待的方向。 人工智能三大流派分类与融合趋势 机器学习 控制论 知识图谱 智能机器人系统 信息理论 控制理论 知识工程 深度学习 神经系统 智 能 语 音计算机视觉 自然语言理解 …… 专家系统 控制逻辑 计算机 智能控制系统 生物控制论 启发式算法 自组织系统 工程 控制论 行为主义 符号主义 连接主义

相关主题