文化科技成果转化系统构建及应用场景

2021-07-30 07:02
演艺科技 2021年6期
关键词:科技成果关联检索

杨 俊

(中国艺术科技研究所,北京 100007)

科技成果能否转化为现实生产力已经成为衡量一个国家和地区科技发展水平的重要标志,促进科技成果转移转化是实施创新驱动发展战略的重要任务,是加强科技与经济紧密结合的关键环节,对于推进结构性改革尤其是供给侧结构性改革、支撑经济转型升级和产业结构调整,打造经济发展新引擎具有重要意义。

依据《中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》,以近年来党中央国务院就高质量发展、供给侧结构性改革、培育新业态新动能、扩内需促消费、完善要素市场、发展文化产业做出的系列部署为指导,遵循大幅提高科技成果转移转化成效要求,构建文化科技成果转化的系统(即专业性网站或软件系统),其以科研项目、学术论文、专利、科技动态、科研人员、机构等为主要数据源,进行文化科技学科分析、影响力评价、关联挖掘等大数据加工,并利用专业应用门户网站展示成果转化的核心结构、发展历史、前沿领域以及数据源的关系。通过文化科技成果转化系统可以探索科技成果转化路径,激发数据资源潜力,推动文化科技产业链创新和应用。

1 文化科技领域成果转化现状

目前,文化科技的创新研究主要集中在科研院所和大专院校,以及有研发能力的企事业单位,文化科技创新成果与企业相结合的路径和模式上存在问题,从基础研究到技术开发、从实验室模型到企业转化存在断点,科技项目、科研人员、科技成果等方面有海量科研数据资源极度分散,共享程度较低,研究项目与应用需求没有对接。如何将这些科技成果供给与文化产业需求精准对接,以达到科技创新促进经济高质量发展,是亟待解决的问题。

2 文化科技成果转化系统的构建

2.1 技术方案

为构建文化科技成果转化系统,需要建立一套技术方案,如图1所示。首先,通过开放API(Application Programming Interface,应用程序接口),进行公开数据、爬取数据与合作数据的采集,如通过CNKI、DBLP、CSCD、OAD等数据库获取论文数据,通过国内外专利网站获取专利数据,通过合作机构获取人才数据、科研成果数据;再进行预处理,依据统一规范的元数据描述,将采集到的数据存入数据库或者分布式文件系统中。然后,使用基于规则和智能算法的实体识别和实体融合,抽取数据库中的实体和关系,从而构建图数据库模型。同时,通过知识推理相关技术,实现学科耦合关系推理、师承关系推理、学科热词推理等功能,丰富和扩展数据库;并基于此更新任务流水线,实现系统模式层和数据层的动态增量更新。

2.2 系统架构

文化科技成果转化系统的架构分为四层,分别是数据层、分析层、服务层及应用层,如图2所示。

图2 系统架构

2.2.1 数据层

在数据层,首先抽取、重新组织开放数据、爬取数据与合作数据,包含开源专利、公开科技文献、科研人员、机构、项目等多种数据类型。然后,通过唯一标识、网络关联及结构化等方法完成对数据的预处理,构建文化科技知识网络图数据库、多维数据库等模型,进行有效的数据库运行和维护,支持数据分布式处理,支持导出与发布,实现一体化数据存储,形成统一的数据资源中心。

文化科技数据资源中心,通过ETL(抽取-转换-装载)实现对大规模多维数据及网络数据的高效存储,结合成熟的开源大数据平台及大数据平台管理工具,构成起文化科技大数据关系网络体系,为数据存储、管理提供基础的大数据环境。

2.2.2 分析层

分析层是在数据层完成对数据组织与管理的基础上,实现多维统计分析以及知识网络检索、分析。其中,多维统计分析服务子系统的构建包括统计维度、Top-N统计、CUBE、SQL界面,基于Kylin的多维分析功能,根据管理的需求进行自定义的开发,以实现多维分析的功能。知识网络检索与分析服务子系统的构建包括关联检索、关键节点发现、聚类分析、PageRank分析等,基于Titan的网络分析功能,根据知识库管理的需求进行自定义的开发,以实现网络分析的功能。

在同一类数据内部及不同类数据之间,存在大量的网络特性,利用经典的网络分析算法,在数据层的数据处理基础上,实现知识网络关联查询、知识网络图分析及知识网络图分析挖掘算法库,为上层应用子系统提供分析服务及算法支持。在知识网络关联查询上,实现科研项目、科研人员、科研成果、依托科研单位等分布式三角形计算的关联关系查询、分布式连通子图查询,实现基于最小生成树获取图的概要信息和索引结构及基于遍历的实时查询。在知识网络图分析上,实现知识网络图的关键节点发现、频繁子图挖掘及重叠社区发现。在知识网络分析挖掘算法库上,实现PageRank分析、知识网络聚类分析、科研社区分析和抽取的知识网络LDA(Linear Discriminant Analysis, 线性判别分析)及科研人员网络的三角关系关联分析。

2.2.3 服务层

在分析层完成基本的多维分析及网络分析方法的基础上,服务层以微服务接口的方式提供查询服务、统计分析和智能挖掘服务。

(1)查询服务

查询服务指以Web交互的方式检索存在关联的项目、人员、成果等,为用户与知识网络提供关联交互手段。例如,用户输入关键字“项目A”,应用子系统返回“项目A”的相关信息,如主要参与人员、项目成果、以及存在关联关系的项目、成果、人员。用户可以根据这些信息选择进一步的检索,以发现感兴趣的研究课题和研究成果,与相关科研人员建立朋友关系以便进一步合作。

(2)统计分析

统计分析指在研究人员、单位、项目、成果等多维度组合数据查询结果基础上,采用可视化技术把多维数据展示出来,并提供项目、成果、词汇的趋势分析。

(3)智能挖掘

智能挖掘指采用混合搜索的方式,同时输入实体和关系,以缩小检索范围。如果知识网络中存在对应实体和关联,则可视化输出,否则输出与之近似的检索内容,辅助用户做进一步的检索决定。另外,基于知识网络的关联分析,支持项目、科研人员和科研成果的关联查询。

2.2.4 应用层

应用层提供新技术发现、科技规划支持、交叉学科分析、专家智库推荐、科技成果转化等功能。通过科技大数据知识图谱服务门户系统,为相关人员提供一体化的大数据知识管理服务,满足对项目、成果、人员等的交互式查询,并实现科技规划支持、领域技术画像、新技术发现、交叉学科分析、专家智库推荐、科技成果转化等功能。

3 文化科技成果转化系统的应用场景

3.1 在区域科技决策中的应用

通过文化科技成果转化系统,以开源专利、公开科技文献、科研人员、科研机构、项目等数据源为基础,有效呈现智能数据收集、处理,并借助多维统计分析子系统和知识网络检索分析子系统对其进行学科分析、影响力评价、关联挖掘,进一步将海量数据集中进行数据展示、分析,从而提供从宏观到微观不同尺度的预判,洞悉科技前沿发展,提升创新能力,为文化领域的决策、布局提供依据。

3.2 在产业服务中的精准应用

(1)专家智库对接

依据公开数据、合作数据、爬取数据,汇聚文化领域的各类专家,为专家进行大数据画像,并实时跟踪他们技术研究进展及可转化的成果,挖掘科研机构之间的合作关系,发现存在合作关系的人员和单位,辅助用户寻找频繁合作的人员、机构等群体,然后根据产业、区域的具体需求,通过大数据和人工智能的分析,打破地域和机构边界,进行精准匹配和推送(见图3),可有效实现点对点解决技术难题。

图3 匹配和推送方案

通过以上技术方案,用户可以通过查询相关的专家信息进行专家智库的推荐与匹配,如图4所示。

图4 专家智库的推荐与匹配

(2)科技成果转化

利用文化科技成果转化系统,使科技创新成果和目标企业的精准匹配(见图5),快速落地,充分挖掘科技成果的价值,提升科技成果的转化质量和效率。

图5 科技成果转化

4 结论

通过文化科技成果转化系统汇聚文化科技服务的海量数据,建立文化科技知识网络图数据库、多维数据库等模型,并借助多维统计分析以及知识网络检索、分析等大数据分析工具和算法,使文化科技成果在行业创新方面充分发挥其效能,引导并满足企业技术创新需求,为文化科技创新提供专业化服务,预测未来科技创新发展趋势,为文化科技创新提供专业化服务;挖掘文化科技创新与经济社会发展的互动规律,推进科技链、产业链、创新链的有机融合,促进文化事业和文化产业的繁荣发展。

猜你喜欢
科技成果关联检索
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
“一带一路”递进,关联民生更紧
2019年第4-6期便捷检索目录
打通科技成果转化“最后一公里”
奇趣搭配
智趣
专利检索中“语义”的表现
科技成果
科技成果
科技成果