据笔者调查,国内主要图书馆购买的以及可免费利用的外文专业数据库资源,已超过千种。这些数据库就文献类型而言,可分为图书、期刊、学位论文与会议论文、、档案、统计资料、报告、书目与文摘、图片、音视频等。就收入内容而言,历史学涉及史学理论、世界通史与断代史、地区国别史(涉及70个左右的国家)、传记、文物考古,其他学科如地理、哲学与教、与法律、军事、经济、文化、科学、教育、体育、语言与文字、文学、艺术、医药卫生等,也有很多资源可以参考。世界史研究需要利用数据库尤其是外文数据库,这是无须的问题。需要讨论的是,如何对这些数量庞大的数据库进行利用。本文从定名与定性、专题数据库的建立、数据库内容考辨三个角度,谈一些的看法。
一般而言,因数据库开发者都会提供数据库名称,定名问题不会有太大的困难,但也有一些特殊情况。其一,数据库开发者有时会改变数据库的名称,从而导致在不同的馆藏地或不同的学者引用中对同一数据库标引不同。如美国档案类数据库“美国解密档案在线”(U.S. Declassified Documents Online),原名为“解密档案参考系统”(Declassified Documents Reference System);期刊类全文数据库“综合学科学术文献大全”(Academic Search Complete),原来的英文名为“Academic Search Premier”。在这种情况下,标引以最新名称为准,同时了解其历史名称。其二,存在总库、子库的情况。如HeinOnline法律数据库有60余个子库,美国图书馆的“数字化收藏”(Digital Collections)有300多个子库。一些开发商或代理商,还会重组其数据资源,形成新的总库。如Gale公司,它把旗下部分期刊类的库组成Gale NewsVault,又把以档案为主的300余个子库组成“珍稀原始典藏档案”(Archives Unbound,简称AU),还把这两个库和它的其他偏重原始档案文献的子库组合起来,形成了Gale Scholar超大型数据库。就个人利用而言,清晰的子库名称更重要;但由于一些馆藏只标引了总库,所以也需要了解总库名称。其三,馆藏机构的标引方式,也会造成名称的混乱。比如,有的馆藏只列翻译而无原文名称,各馆藏有时翻译名称不同,以及有的馆藏根据购买情况重新拟定数据库名称。如国家图书馆购买了AU中亚洲的部分专辑,命名为“珍稀原始典藏档案合集:亚洲”(Archives Unbound Asia)。
确定性质指确定文献的收录类型。前文已提及,外文数据库的文献类型包括图书、期刊、、档案等。不同类型的文献,在史学研究中所起到的作用是不同的,或作为目录检索径,或作为前期学术