打印

[赵京桥]探索建立哲学社会科学电子资源学术搜索引擎

[赵京桥]探索建立哲学社会科学电子资源学术搜索引擎

探索建立哲学社会科学电子资源学术搜索引擎
赵京桥

   

     
    一、我国哲学社会科学电子资源现状
     目前我国可公开使用或有偿使用的、具有一定规模和影响力的哲学社会科学研究电子资源数据库提供者主要有:中国知网(www.cnki.net)、维普资讯(http //www.cqvip.com/)、万方数据(http //www.wanfangdata.com.cn/),这三者都是收集期刊电子文档、部分博士和硕士论文、会议论文电子版以及各类标准、法律法规,并提供付费下载的综合类学术资源网站;新华社专供数据和人民日报数据则是两大媒体机构以自有资源电子化的方式形成的研究资源;人大复印报刊资料全文数据和索引汇总则是《人大报刊复印资料》收录的全文数据和索引汇总;中国年鉴资源全文数据库则是以年鉴数据为基础的大型电子资源数据库,等等。除此之外,还有各级社科系统、各类协会、研究机构、高校等机构内部使用的电子资源数据库。
     目前我国哲学社会科学电子资源在内容建设上已经取得了显著的成果,并且伴随着对电子资源重视程度的提高,纸质资源正加快电子化进程,未来我国哲学社会科学电子资源将更加丰富和全面。
     但我国哲学社会科学电子资源在快速发展的同时仍存在一系列问题:
     1.各自为政,多头建设。由于看好哲学社会科学电子资源的价值,纸质资源版权拥有者往往从自身利益出发制定符合自己利益的电子化方案:自身能力比较强的主要通过自建的方式进行,如人民日报等;其他则出售电子版权,由于如果同时出售给不同电子版权购买者,容易造成数据收集不全或数据重复建设。如果加上各个机构组织出于内部使用目的建设的电子资源,那么数据收集不全面和重复建设的问题就更加严重,造成数据搜索成本的提高。同时多头建设也造成了数据标准不统一,给未来整合搜索造成阻碍。
     2.我国哲学社会科学电子资源提供者服务单一。收费然后提供浏览、搜索和下载是目前最为常见的哲学社会科学电子资源提供者的经营模式,提供者之间的竞争在于数据的全面性、搜索速度和价格。随着电子资源的日益丰富,简单关键词搜索方式所需要的人工搜索时间越来越长,已经不能满足用户的需求。
     3.电子版权保护。电子版权的保护是促进我国哲学社会科学电子资源产业健康发展的保障。但电子版权的保护与立法在我国尚属起步阶段,电子版权保护缺位或不作为,导致了公开电子资源数据库重复性很高。
     二、整合与搜索哲学社会科学研究资源的必然性
     互联网的发展历史按照数字内容的规模和提供形式,大致经历了4个阶段:数字内容建设时期、数字内容爆发式增长时期、数字内容整合和搜索时期、Web2.0和搜索智能化时期。我国哲学社会科学电子资源在经历了内容建设和丰富的时期后,需要通过整合和加强搜索服务,形成系统性的哲学社会科学电子资源体系和专业学术垂直搜索服务,最终实现以哲学社会科学专业学术搜索引擎为统一入口,以各种哲学社会科学整合资源为支撑的哲学社会科学电子资源共享体系。
     三、我院哲学社会科学电子资源体系发展优势
     我院在信息化建设十年中,非常重视哲学社会科学电子资源的建设。我院哲学社会科学电子资源从无到有,从基本框架到内容极大丰富,已经形成了“中国社会科学院哲学社会科学网”和以所局级网站为支撑的信息门户体系,以中国哲学社会科学知识库、中国社会科学院成员库、成果库、期刊库以及所局级数据库为支撑的数据库体系,为丰富我国哲学社会科学电子资源数据库作出了重要贡献。
     我院建设系统性哲学社会科学电子资源体系具有天然的优势:
     1.我院是国家级哲学社会科学研究机构,拥有包括哲学学科、经济学科、社会政法学科、文学学科、历史学科和国际学科在内的六大学科,31个研究所,45个研究中心,近300个二三级学科,其中重点学科120个。
     2.我院目前拥有科研业务人员3200多人,其中高级专业人员1600多名,中级专业人员1200多名,建设系统性的哲学社会科学电子资源体系拥有庞大的内部科研用户群,便于根据科研人员的研究特性开发与科研相关的学术搜索引擎。
     3.我院拥有大量不涉及电子版权的纸质资源。建院三十年来,我院共出版学术著作4300多本,科学论文55000多篇,调查报告、研究报告7200多份,翻译著作2700多本,翻译论文16000多篇,以及相当数量的古籍整理、校勘、注释、各种工具书和普及读物;拥有82种学科领先的学术刊物;还有各研究所在调查研究过程中形成的基础数据。
     4.我院拥有较为完善的文献资料积累和交流体系。设有综合性的图书馆,绝大部分研究所设有专业图书馆,拥有古今中外的基本文献资料;馆藏图书已达537万余册,其中包括相当数量的善本典籍、珍本图书;与国内外科研机构建立了图书资料交换关系。
     5.在我院信息化建设领导小组领导下,院网络中心统筹全院信息化建设的信息化组织结构有利于我院哲学社会科学电子资源建设的标准化和各个下属单位的利益协调。
     四、探索建立学术垂直搜索引擎
     通过部门的资源整合,只能实现部门内资源共享,多个入口、资源割据的现状还无法改变,建立哲学社会科学电子资源学术搜索引擎是解决这种状况的有效途径。
     国内现有的学术搜索引擎主要有CNKI知识搜索、Google学术搜索和搜数网等,而这三者中Google学术搜索相当于文献搜索引擎,即通过与维普资讯、万方数据等合作,可以在Google学术搜索栏中搜索合作数据库的文献摘要信息,但要下载还得登录维普资讯和万方数据;搜数网(http //www.soshoo.com/)则是专注于搜索统计数据的搜索引擎;CNKI知识搜索是目前具备较为完善功能的学术搜索引擎,搜索功能包括了文献、数字、学术定义、学术趋势、图形表格、翻译,搜索内容是中国知网建立的巨大的期刊、博士和硕士论文、法律法规、标准等的数据库。但不管是CNKI还是Google,目前推出的学术搜索引擎都是试用版本,因此从现状来看,我国学术搜索引擎还处于发展初期的探索阶段。
     专业的哲学社会科学学术搜索引擎在我国目前还是空白,这为我院在哲学社会科学学术搜索引擎上的突破提供了良好的机遇。当然实现这种突破的基础就是拥有强大的哲学社会科学电子资源数据库。因此,必须首先建立我院自己的系统性的哲学社会科学电子资源数据库,在此基础之上再与其他国内外数据库合作,为哲学社会科学学术搜索引擎提供强大支持,最终通过建立哲学社会科学研究资源专业搜索引擎来统一入口,实现以搜索引擎为入口,以各种哲学社会科学整合资源为支撑的哲学社会科学研究资源共享体系。这样一方面能给哲学社会科学研究带来极大的便利,另一方面也能有效地防止学术腐败。


文章出处:中国社会科学院院报
本网发布时间:2008-10-9 10:44:56

TOP