华体会体育官网下载:科研人员标识的应用研究及对策建议

来源:华体会体育官网下载    发布时间:2025-06-01 23:57:17

华体会app官网活动:

  随着国外主流科研人员标识的发展及其日益占据主导地位,国内各方慢慢地认识到构建自主可控的科研人员标识的重要性。科研人员标识作为识别科研人员学术身份和关联科研要素的媒介,对高效管理科研数据、建立科学数据更新机制、构建多源学术信息知识图谱具备极其重大意义。文章运用文献调研与网站调研相结合的方法,剖析科研人员标识的应用现状与存在的不足,避免在我国构建科研人员标识的过程中出现姓名消岐方法、数据质量控制和隐私安全等常规性问题,结合我国真实的情况,统筹国内各方力量,在标准制定、功能完善、系统互操作、数据质量控制和应用推广等方面通力合作,构建面向开放科学、服务科学研究的科研人员标识体系。

  随着科研活动的日益频繁及与网络信息技术的交互融合,科学研究已迈入以数据密集型和开放性为特点的科研新范式,科学数据成为驱动科研范式变革的重要基础和推动开放科学发展的重要组成部分,其核心囊括了科研人员在全科研生命周期中所产生的科研项目和科研成果,例如科学数据、科研方法、学术文献等。然而,在科学数据快速推动科学发现和知识创新的同时,数据质量参差不齐、多源异构问题都会存在,这对数据清洗、集成、检索和管理带来一定挑战,制约开放科学环境下科学数据共享流通。科研人员作为科学数据的创造者、管理者和应用者,在促进数据高效集成与共享方面发挥着关键作用。

  据经济合作与发展组织(OECD)统计,截至2024年,世界科研人员数量已突破8 900万人,我国具备中级及以上职称或博士学位的研究人员全时当量达226.9万人年,且呈持续不断的增加趋势;2022年,全球科学引文索引(SCI)收录文章量达278万余篇,SCI收录来自中国的文章量达78万余篇。在增量式科学时代下,科研人员和科研成果数量激增、科研人员姓名重复和格式不一等现象突出,以及科研人员流动规模日益加剧等情况,增加了网络环境下通过科研人员姓名进行快速、准确检索其学术信息的难度,阻碍了科学数据的高效管理和科研成果的广泛传播,制约了开放科学环境下的学术交流与合作。

  为解决以上问题,早在1998年,Gary Cleveland就指出数字图书馆中分配科研人员唯一标识的重要性。之后,又有学者分别从建立不同数字对象之间的关联、规范引文和版权管理、提高学术信息检全率和检准率、提升科研人员学术能力评估的公平性和公开性、便捷科研项目申报与管理、构建基于科研人员唯一标识的图书馆身份认证服务系统等多角度分析了科研人员标识的重要作用。

  尽管学术界对科研人员标识的关注度日益加强,但仍存在较多问题亟须解决。例如,科研人员标识的标准化和互操作规范缺乏,数据安全和隐私保护重视度不足,数据质量控制标准缺少,我国科研人员标识体系发展缓慢等。为此,本文在分析科研人员标识发展驱动因素和国内外主要科研人员标识发展现状的基础上,深入剖析科研人员标识应用中面临的挑战,为构建我国自主可控的科研人员标识提出对应的对策建议。

  科研人员标识作为识别科研人员学术身份和关联科研要素的媒介,对高效管理科研数据、建立科学数据更新机制、构建多源学术信息知识图谱、强化科研诚信与学术规范、助推数据共享应用与开放科学具备极其重大意义。

  科研人员标识是解决论文作者姓名歧义的有效方式。在学术出版和科学研究领域,由于全世界内作者姓名的多样性、拼写差异及同名同姓情况,导致难以准确识别论文与作者之间的归属关系,造成检索结果与实际的需求不符,降低学术数据的质量和可用性。针对作者姓名歧义问题,通过为每位科研人员分配一个独特的、持久的数字标识符,对存在姓名歧义作者的论文集合进行划分,将科研成果正确归属给相应的科研人员,不仅能提升成果检索效率,也是准确构建科研人员学术画像、开展学术趋势变化分析的前提。

  科研人员标识对高效管理科研数据、建立科学数据更新机制具备极其重大作用。面对当前科研成果爆发性增长态势,数据来源复杂、数据格式和标准参差不齐等问题不断涌现,为科研数据的整合、分析和管理带来一定难度。通过科研人员标识将科研生产链中的实体有效关联,有助于消除数据冗余、提升数据整合的准确性与数据的互操作性,从而建立实时有效的数据更新、共享机制。

  鉴于科研人员标识在科研数据管理中的及其重要的作用,已有大量学者对科研人员标识进行了系统性概述。本部分在梳理国内外主要科研人员标识的基础上,重点分析科研人员标识的特点和主要差异。

  国外科研人员标识的赋码方式各有不同,存在一人多码的情况。Scopus Author ID是根据归属机构、联系地址、研究领域、出版物名称、出版日期、合著者等信息分配赋码,当科研人员变更归属机构或同一归属机构出现不同表达方式时,会为同一位科研人员再分配新的Scopus Author ID,并显示变更前后的归属机构,出现一人多码情况。而Researcher ID、ORCID、RNR则需要个人主动注册申请。据统计,ORCID约有20%的注册用户处于非活跃状态,即“僵尸账号”,这削弱了ORCID的可靠性、信任度和完整性。

  ① 关联科研要素,创建个人主页,导入成果信息。Scopus Author ID、Researcher ID和ORCID不仅提供通过DOI、PubMed ID等的多种成果快速添加方式,还支持不同科研人员标识之间的关联,进而通过数据库关联导入成果,提升科研人员维护个人主页的效率,确保成果汇聚的全面性和准确性。

  ② 提供学术信息分析服务。Scopus Author ID和Researcher ID同时提供多指标信息分析服务,如文献与引文趋势、合著者统计、H-index(衡量科研人员学术产出与学术影响力)、作者影响力射束图等,力求全面、客观反映科研人员的学术贡献。

  ① ORCID与期刊出版商建立合作伙伴关系,提升科研要素汇聚能力。截至2021年10月,全球已有112家期刊出版商与ORCID签署了“最佳实践协议”,要求作者在投稿时提供ORCID,并将论文与ORCID关联。然而,有学者指出,尽管这些期刊出版商强制要求作者在投稿时提供ORCID,便于投审稿流程管理,但在未与更广泛作者群体磋商的前提下,实施强制性政策,对没有注册ORCID的作者带来了隐性压力。

  ② ORCID与基金资助机构、学(协)会、大学(含图书馆)等建立会员机制,通过应用程序编程接口(API)连接科研管理系统、基金管理系统,实现数据的自动推送。2013年,美国国立卫生研究院(NIH)与ORCID开展合作,支持SciENcv与ORCID连接,要求科研人员在申请部分基金项目时提供ORCID,简化简历创建流程,未提供ORCID的申请将不予受理。2018年,NIH与ORCID开展“ORCID减轻负担,提高透明度”(ORBIT)项目,旨在扩展ORCID数据模型,收集科研人员学术档案信息,提升基金资助效率。除NIH外,瑞典研究委员会(SRC)、奥地利科学基金会(FWF)、爱尔兰科学基金会(SFI)也相继授权使用ORCID。在ORCID大范围的应用的同时,也存在一定的问题,例如利用ORCID进行学术欺诈、为虚假个人和/或由虚假个人建立ORCID账户,给公平、公正的学术环境带来潜在威胁。

  近年来,国外科研人员标识加快速度进行发展,获取了我国大量科研人员的信息,带来一定的数据垄断风险,对我们国家科技安全造成一定威胁。为此,国内各方慢慢地认识到构建自主可控的科研人员标识的重要性,并先后付诸实践。例如,清华大学图书馆构建的Tsinghua University Researcher ID(ThuRID),中国科学技术协会构建的Science and Technology ID(STID)和国家自然科学基金委员会构建的Basic Researcher ID(BRID)(表1);中国科学院文献情报中心和中国科学技术信息研究所也在不断探索科研人员标识的生态构建与应用。

  国内科研人员标识正值起步阶段,处于多方各自建设的局面。2009年,清华大学图书馆创建ThuRID,着手建立以清华学者为中心的知识服务系统,即“清华大学学者库”,旨在全面梳理并维护清华学者及其学术产出之间的精准关联。截至2022年10月,清华大学学者库已服务53个院系和机构,为3700余名清华学者建立了个人学术主页。2023年,中国科学技术协会和国家自然科学基金委员会分别对外发布STID和BRID,部署在中国科协智慧评审系统和国家自然科学基金大数据知识管理服务门户及科学基金网络信息系统中。其中,BRID是按照我国国家标准《科技资源标识(GB/T 32843—2016)》构建的基础研究科研人员标识,将在以下4个方面发挥作用:

  ① 服务科学基金项目全过程管理。科研人员可在项目申请、进展报告填报、结题报告填报等工作中,通过BRID调用科学基金项目资助成果,减轻信息填报负担,优化信息系统服务功能,提升工作的便捷性。

  ② 服务依托单位追踪科研产出。国家自然科学基金依托单位通过BRID追踪本单位科研人员的科研产出,查询发文量与被引量等数据信息,方便对科研人员进行学术评价和服务。

  ③ 构建高效科研数据生态,提升信息化服务水平。国家自然科学基金委员会以BRID为纽带,与期刊出版商、图书馆、学术资源数据商等构建长期有效的科研数据更新机制,汇集科研人员多维度的学术成果,为科研活动参与主体提供便捷、高效的信息化服务。

  ④ 服务社会公众查询、追踪前沿学术动态。社会公众将可通过BRID查询科研人员的学术成果信息,实时、有效追踪最新科研成果,洞悉学术动态。

  国内科研人员标识缺乏有效的数据关联机制。与国外科研人员标识丰富的应用场景相比,我国科研人员标识仅停留在为科研人员创建学术主页,缺乏在数字化环境下与期刊出版平台、引文数据库之间的关联,缺乏有效的数据汇聚共享机制,这将在一些范围和一定阶段限制国内科研人员标识的应用和发展。

  科研人员标识的直接作用是姓名消岐,即解决“谁是谁”的问题,主要利用计算机自动消岐技术实现。计算机自动消岐技术最重要的包含2类:

  ① 基于特征(文本特征和语义特征)的姓名消岐——通过人工对文本属性进行建模或建立无监督语言模型,判断待消岐论文是否属于同一个真实世界研究者,为同一作者赋予唯一科研人员标识,建立科研人员与成果之间的对应关系;

  ② 基于连接的姓名消岐——利用网络拓扑结构所蕴含的丰富高阶语义信息实现作者姓名消岐。这2类计算机自动消岐技术各具特点和优势,且在应用中已取得一定进展,但仍存在一定局限性。例如,仅单一利用论文文本和语义特征或关系属性,没有充分挖掘并融合多类型特征,忽略待消岐任务之间有几率存在的联系和全局网络关系。武南南等提出融合多空间特征的网络对齐模型,但此模型从理论到具体应用仍存在诸多挑战。

  由于数据源的复杂性和消岐技术的局限性,计算机自动消岐结果总是存在一定误差,在此基础上发挥科研人员的主观能动性,对个人科研成果记录进行真实性认证是一种有效可行的补充方法,但若缺乏严格的监督机制,科研人员标识系统将有几率会成为科研人员装饰其科研成果与科研水平的场所,丧失其应有的意义与价值。

  科研人员标识系统亟待加强对元数据质量和标准的控制。高质量的数据是整合各类学术信息、构建学术交流平台、提供高效信息检索服务的核心要素和前提基础,故提升数据质量控制水平、降低数据信息缺失发生率至关重要。缺乏对科研人员所输入元数据的质量监督,势必会产生大量虚假信息,降低数据有效性,还会为元数据更新带来困难。此外,现有科研人员标识系统存在元数据字段和标准不一致的情况,这不仅影响标识系统之间的互操作,还限制对元数据的开发与应用。

  大数据时代个人隐私数据泄露已成为全世界重大的社会问题,科研人员标识系统在汇聚融合科研人员和科研成果等学术信息的同时,还需要重视个人隐私信息的授权公开和保护。科研人员将个人隐私信息提交至标识系统,意味着这些个人隐私信息将全部公开,这需要科研人员对标识系统和系统使用者的双重信任,确保个人隐私信息不会被泄露和非法使用。科研人员信息外流将对我们国家科技安全造成一定威胁,因此我国日益重视对科研人员信息的保护。

  我国科研人员标识系统建设处于起步阶段,面临诸多困难挑战,主要体现为3个方面:

  ① 各自建设,尚未形成规模化应用。清华大学、中国科学技术协会、国家自然科学基金委员会等均建有本系统特色的科研人员标识,人员覆盖存在一定重叠,易出现一人多码的情况,科研信息整合度不高,不利于全方面提高学术信息资源的利用效率。

  ② 未实现与外部数据库关联,成果汇聚不全面,时效性差。目前,国内科研人员标识系统仅停留在为科研人员创建个人主页,依靠科研人员主动上传或认领科研成果,成果汇聚的时效性和全面性较差;尚未建立完善的标识解析系统,缺乏与外部数据库的互操作性,一旦科研人员标识脱离各自的系统,将成为无意义的字符串。

  ③ 科研人员标识的可推广性不受重视。尽管科研人员标识在信息检索、知识传播与共享、学术评价等方面发挥了非消极作用,但由于我国科研人员标识的构建仍处于起步阶段,许多功能尚未开发和应用,缺乏与高校图书馆、国内外出版商等之间的合作,这将直接引发其在推广应用中面临诸多挑战。

  在全球开放科学快速地发展的背景下,快速且准确地检索科研人员及其科研成果已成为开展科学研究的迫切需求。科研人员标识既为此带来新的机遇,也面临一系列的挑战。加快构建我国自主、安全、高效的科研人员标识体系,既要从全球视角出发,积极融入国际主流科研人员标识生态网络,探索与国际期刊出版商和数据库的合作方式,又要以我国科研人员标识的具体应用场景为牵引,完善相关制度规范,加强数据质量控制与监督。

  鉴于国际主流科研人员标识已逐步实现规模化应用,且国内各方对构建自主科研人员标识的积极响应,我们应采取对应措施,构建面向开放科学、具有一定引领作用的科研人员标识。为此,提出以下3个方面建议。

  随着国内科研人员和科研成果的爆炸式增长,以及大数据和人工智能技术的快速的提升,数据科学的新范式逐步兴起。构建科研人员标识是一项涉及面广、影响深远的工程,要发挥我国集中力量办大事的新型制优势,推动信息汇聚、元数据规范、软硬件集成开发、信息联通与服务等方面的协同合作。

  ① 出台国家层面的科研人员标识管理办法。通过制定有关技术标准,对科研人员标识及其元数据进行统一管理与维护,并针对数据隐私保护等问题进行明确界定;依托完备的科研人员标识管理办法,逐步建立跨行业、跨机构的科研人员标识关联与应用生态,实现多元学术价值增值和知识共享。

  ② 建立有效的科研人员标识运行管理机制。加强对标识系统构成属性的管理,例如科研人员标识构成规则、注册与分配规则、数据存储空间、数据许可原则等;加强对标识系统服务属性的管理,如API数据检索接口管理、国内科研人员标识系统集成、国外科研人员标识系统关联等。

  ③ 构建高效的科研人员标识运行模式。例如成员机构准入资格和共同决策原则、良好的公众监督与信息反馈制度等。这些措施将加速我国科研人员标识体系建设进程,推动科研人员标识的可持续发展。

  ① 依托多方需求,构建定制化科研人员标识服务平台。科研人员标识系统应以服务开放科学环境中的科学研究为导向,针对不同群体的需求开发个性化服务窗口和定制化模块,为科研人员、科研机构、科研资助机构、期刊出版商等提供量身定制的服务。例如,科研人员注册标识后,可以维护个人科研主页;科研资助机构和期刊出版商可以将标识嵌入各自的工作流程,消除姓名歧义、减轻工作负担、提升成果关联度;科研机构可通过标识系统中的数据更新本地数据库,降低数据库管理与维护成本,营造公平公正的科研评价体系。

  ② 构建基于科研人员标识的数据相互连通与更新机制。科研人员标识系统的数据更新是一个持续动态的过程,除了科研人员主动更新数据外,还一定要通过数据接口与外部数据库及其他科研人员标识系统建立关联,实现系统间数据共享与复用,充分的发挥各类系统的潜在价值,推动学术交流,促进知识创新。

  ③ 国内相关组织应热情参加国际标识项目与实践,在交流和实践中逐步完善我国科研人员标识体系。

  科研人员标识的广泛应用需要科研人员、科研机构、科研资助机构、期刊出版商等各方的共同努力。

  ① 根据具体应用场景,制定科研人员标识使用规范。要求科研人员在有关工作流程中提供个人标识,提升标识的可见度和影响力。

  ② 通过采取激励机制,鼓励科研人员和相关机构热情参加科研人员标识的推广与应用。例如,能够最终靠邮件或其他方式将与科研人员标识关联的成果数据推送给科研人员或相关机构,推动期刊出版商在学术出版过程中嵌入科研人员标识,加强科研人员标识的宣传力度,促进其推广与普及。

  韩 阳国家自然科学基金委员会科学传播与成果转化中心助理研究员。主要研究领域:开放获取,开放科学,科技资源标识建设与管理等。

  贾雷坡国家自然科学基金委员会科学传播与成果转化中心副研究员。主要研究领域:开放获取,开放科学,科技成果转化等。

  本刊发表的所有文章,除另有说明外,文责自负,不代表本刊观点。返回搜狐,查看更加多

上一篇:每日互动请求生成词云的处理办法专利添加获取的特定方针用户集体的特征数量
下一篇:我国人民抗日战役暨国际反法西斯战役成功80周年留念活动标识运用说明