本文的研究对象是在国内各学术期刊公开发表的有关数据新闻研究领域的学术论文。采用检索方式是主题与关键词检索的方式,对中国知网CNKI自1995年来,近20年的论文被引用数据进行收集,本文的指标为全部的被引用数,包括自引和他引。以CNKI引用指数为主,万方数据库关键词检索的被引用排行数据为辅。
综合两库收集的数据我们设计了一个高被引论文的影响力测算公式即高被引论文影响力=CNKI被引用综合分+万方数据被引用综合分数,被引综合分按被引用数从高到低排序被引用数排序第一的为100分。接下来按被引用排序依次打分,考虑到本项研究的主要目的是分析数据新闻研究中高被引论文的学术影响力,本文参考大季丹的分析方法[1],将2库影响力分配不同的权重,CNKI被引用为0.6,万方数据库被引用为0.4,主要原因是CNKI的使用范围、收入论文数量、质量、用户人数较之于万方数据库要优秀,基于CNKI指标更能反映出论文在学术市场的接受度。
根据两库综合打分本文得出了一个中国网络领域高被引论文的影响力前50位的综合排序(见表1),本项研究采用内容分析的定量研究方法,对50篇论文的关键词进行编码将最终数据输入SPSS16.0统计软件中进行数据处理从而获得以下基本研究发现。
从表1所列的近十年来50篇数据新闻高影响力论文排序中可以发现中国数据新闻研究发展大致情况见图2。
如图2所示,数据新闻研究的高被引用论文的时间分布上相对比较集中,大部分引用近2年的文献,与图1形成对照,高被引用文献基本与数据新闻的文章数量成正比;值得注意到的是,2013年中国知网收录的数据新闻研究文献数量为20篇,基本均被引用;14年学者的创作引用多是基于2013年的研究之上,这突出体现当前研究的集中和对文献数量的需求之强烈,数据新闻研究的前后两阶段分界明显,之前的研究已经落后于时代的需要和步伐。
结合表1、图1和前文所述,我们可以看到,2012年之前的“数据新闻”研究还处于对新闻报道中数字的使用,以及数字化系统和存储设备的研究,关于“数据新闻”直接议题的高被引用论文几乎为零,为数不多的2篇是对数据技术挖掘和处理的研究,线年开始。