
由中国科学院植物科学数据中心高级工程师宋创业、李敏等16人共同编写的《植物科学数据规范》由高等教育出版社正式出版发行。
长期的植物学研究积累了大量数据,随着观测和分析技术的发展,植物科学数据在研究中的重要性日益突出。如何规范化地集成、管理和利用多源、海量的植物科学数据是植物学研究领域亟需解决的问题。为解决这个问题,植物科学数据中心成立了《植物科学数据规范》编制组,参考了国内外科学数据规范和标准研究领域的最新成果,优先制定了引领性、核心的数据管理规范,如数据分类与编码、数据集核心元数据;按照植物物种、植被生态和迁地保育等三个方向分别编制了植物物种名录数据、数字化植物标本数据、植物图像数据、在线植物志数据、植被样方调查数据、植被长期定位观测数据、植被类型调查样点数据和植物迁地保育数据等数据的结构规范;元数据借鉴了“中国科学院科学数据库核心元数据标准”“科技平台资源核心元数据”等,在字段定义和标识中参考了Darwin Core生物多样性信息学数据标准,在一定程度上反映了国内外科学数据标准和规范领域的最新研究进展。
以下为部分植物科学数据规范,并提供在线浏览与下载服务。
元数据(Metadata)被定义为描述数据的数据,是对数据及信息资源的描述性信息。元数据是数字信息组织和处理的基本工具,为不同形式的数字化信息单元和资源集合提供规范的描述基准和方法,在识别资源、评价资源、追踪资源变化和管理资源方面发挥着日益重要的作用(李善青等,2019)。在科学数据元数据领域,国内外都做了大量的工作,如美国国际图书馆电脑中心(Online Computer Library Center, OCLC)和美国超级计算应用中心(National Center for Supercomputer Applications, NCSA)联合制定的都柏林核心(Dublin Core)元数据(DC元数据)、美国联邦地理数据委员会(Federal Geographic Data Committee, FGDC)制定的地理学科元数据标准、国际标准化组织地理信息技术委员会(ISO/TC 211)制定的ISO/TC 211元数据标准等。我国也制定了一系列的元数据标准,如科技平台资源核心元数据(GB T 30523-2014)、科学数据共享元数据(SDS/T 2112-2004)、中国科学院科学数据库核心元数据标准、生态科学数据元数据(GB/T 20533-2006)、土壤科学数据库元数据标准(GB∕T 32739-2016)等。在植物科学数据领域,还缺乏针对性的元数据标准。因此,采用中国科学院科学数据库核心元数据标准(2.0版)的模块设计,选择了其中的必选模块,针对植物科学数据的具体情况进行了调整,制定了植物科学数据集核心元数据。规定了用来描述植物科学数据集所需要的核心信息,适用于植物科学数据集核心元数据整理、建库、汇编、发布及共享服务。本章第3节“规则和术语”及第4节“元数据表达方式”两节中相关内容引自中国科学院科学数据库核心元数据标准(2.0版)。另外,可以在核心元数据的基础上,根据具体需求和数据的实际情况选用、扩充详细元数据内容,建立相应级别的元数据库。
浏览与下载链接:https://www.plantplus.cn/cn/standards/6
植物标本是植物学研究中一类重要的本底研究资料,一般保藏于植物标本馆中,供研究人员查询浏览。上世纪90年代开始,随着数码摄影和计算机技术在中国的发展,各大植物标本馆开始尝试将馆藏植物标本数字化、数据化,并依托互联网进行数据开放共享,且已经与野外采集植物标本的工作流程进行了深度整合。我国也涌现了众多提供数字化植物标本线上共享服务的网络平台,而各个平台的数字化植物标本的数据标准却存在较大差异。因此,在植物标本数字化领域,需要依据一套全面、科学的数据规范来开展工作,以确保数字化植物标本数据在生产、存储和共享等阶段中的质量和兼容性,从而提升数据利用的效率。作为国内最大的数字化植物标本数据在线共享平台,始建于2006年的中国数字植物标本馆(Chinese Virtual Herbarium,CVH,www.cvh.ac.cn)在中国植物馆藏标本数字化领域深耕十余年,在数字化植物标本数据的标准化、规范化方面进行了深入的探索。本规范在编写时,参考了CVH的数字化植物标本数据标准化存储模式,并结合中国植物标本数字化工作流程的特点进行了补充扩展。本规范适用于数字化植物标本数据(如腊叶标本、种子标本等),旨在为中国数字化植物标本数据的生产与管理提供一个全面、科学的数据标准和数据质量控制准则,促进植物科学数据标准的统一和完善,保证数据质量,并与全球主流生物多样性数据标准对接,提升数字化植物标本数据的开放和共享的能力。
浏览与下载链接:https://www.plantplus.cn/cn/standards/7
植物图像数据是针对野生或栽培植物类群,通过数码相机或扫描仪采集植物数码图像过程中所产生的数据,包括植物图像、鉴定物种信息、拍摄时间、地点、生境等数据。植物图像是认识和理解植物性状最直观的途径,也是植物分类学及相关研究工作的重要资料。植物图像除了可作为研究资料在科学研究、科学普及、物种鉴定等领域发挥作用外,其拍摄或采集时记录的时间、地点、生境等信息也可作为重要的观测数据,有效补充植物标本采集等传统物种信息采集方式在时效性、完备性等方面的不足。此外,分类鉴定的植物图像也可作为计算机视觉技术研究的基础数据,用于开发植物图像智能识别系统等快速鉴定技术。本规范的编制以中国植物图像库(Plant Photo Bank of China, PPBC)标准数据格式及Darwin Core生物多样性信息标准为基础,旨在为植物图像数据提供一个全面、科学的数据规范准则,促进植物科学数据标准的统一和完善,保证数据质量。
浏览与下载链接:https://www.plantplus.cn/cn/standards/8
中国是世界上植物物种最丰富的国家之一,也是世界上植物志资料比较完备的国家之一,有国家级植物志、地方植物志,如《中国植物志》、Flora of China、《北京植物志》、《小五台山植物志》等。植物志一般依分类系统编排(如恩格勒系统、哈钦松系统、被子植物分类系统等),记载了植物名称(学名、通用名和别名)、文献出处、形态特征、产地、生态习性、地理分布、经济价值等,并有分科、分属和分种检索表,科、属说明和插图等。这些志书数据是植物科学数据重要组成部分,应用非常广泛。但一直以来,有些植物志出版较早,且多为纸书,没有电子版,印刷量少,现在已经断版,广大用户很难找到这些资料。为了便于用户使用,对植物志书进行数字化做成在线植物志是比较理想的方式。本规范的编制本规范的编制以《中国植物志》及Flora of China全文数字化数据库标准格式及Darwin Core生物多样性信息标准为基础,旨在为植物志书数字化和在线植物志建设提供一个全面、科学的数据标准和数据质量控制准则,促进植物科学数据标准的统一和完善,保证数据质量。本规范也可以作为农业、林业、生态和环境等行业志书数字化建设的参考规范。
浏览与下载链接:https://www.plantplus.cn/cn/standards/9
植被样方调查数据是针对植物群落的物种组成、群落结构、生物量以及环境因子等,在不同区域以不同尺寸的样方(通常草本样方为1 m×1 m,灌木样方为5 m×5 m,乔木样方为20 m×30 m)为调查单位收集的数据。植被样方调查数据是植物科学数据重要组成部分,是进行植被生态学、地理学、植物学等研究的基础数据,对揭示植被的物种组成与分布格局、结构和功能等具有关键作用。植被样方调查数据是反映区域乃至国家自然资源本底状况的基础数据,对制定生态系统管理政策与发展战略,支撑国家生态文明建设具有重要作用。长期以来,植被样方调查数据缺乏统一的标准和规范,不同的部门和调查人在调查指标、数据规范等方面都存在较大的差异,这也影响了植被样方调查数据的深度集成与广泛应用。2018年,中国科学院启动了战略性先导科技专项“地球大数据科学工程”(CASEarth),在CASEarth的项目“生物多样性与生物安全”支持下,“植被及其生态信息数据库”课题组制定了植被样方调查数据规范,用于收集和整编全国植被样方调查数据。在该工作的基础上,2020年,“第二次青藏高原综合科学考察研究”的“森林和灌丛生态系统与资源管理”专题工作组编写了“青藏高原森林和灌丛调查规范”,对森林和灌丛的调查指标、方法和数据格式等做了详细的规定。基于上述工作,我们制定了植被样方调查数据规范,旨在为植被样方调查数据提供一个全面、科学的数据规范,促进植被样方调查数据标准的统一和完善,保证数据质量。同时,本规范也可供从事植被调查的林业、草原、湿地等部门以及从事植被生态学研究的科研和教学人员参考使用。
浏览与下载链接:https://www.plantplus.cn/cn/standards/10
植被长期定位观测数据是对植被的结构、功能等进行有计划的、长时间序列定点观测积累的数据,是植物科学数据重要组成部分。植被长期定位观测数据对探讨植被变化规律及其驱动因素、揭示各类生态系统的生态功能和生物多样性的变化规律,探讨有关生态过程变化的机制以及生态系统的适应性管理等具有重要的意义。植被长期定位观测的内容丰富,监测指标众多,涉及植物群落的物种组成、群落结构和动态、物质生产与循环等多个方面,数据类型涵盖数字、字符、图像等多个类型,数据标准和规范建设对于数据的一致性、可比性至关重要。我国开展植被及生态系统长期定位观测的机构较多,中国科学院、国家林业和草原局、生态环境部、农业农村部以及各大高校和地方政府都开展了植被及生态系统的长期定位观测,也开展了观测规范建设工作,如隶属于中国科学院的中国生态系统研究网络制定了生态系统生物、土壤、水分、大气等要素的观测指标与规范,国家林业和草原局、生态环境部也制定了一系列的植被、生态系统和生物多样性监测行业标准。这些标准、规范在指导各部门的监测工作中发挥了重要作用,然而,各部门制定的监测标准和规范存在一定的差异,不同部门的数据之间也存在较多结构差异问题,影响了多源监测数据的深度整合及进一步的应用。本章在中国生态系统研究网络编写的《陆地生态系统生物观测指标与规范》(吴冬秀、张琳和宋创业等,2019)基础上,制定了植被长期定位观测数据规范。但需要说明的是,本规范是数据层面的规范,主要是对观测数据的内容、数据表的结构进行了规定,而深层次的数据规范和质量控制涉及观测数据生产的各个环节,如监测方案制定、野外观测技术规范、数据记录、仪器校对、室内理化分析等等,内容众多,感兴趣的读者可以阅读《陆地生态系统生物观测指标与规范》。本规范旨在提供一个全面、科学的植被长期定位观测数据标准和质量控制准则,促进植物科学数据标准的统一和完善,保证数据质量。本规范还可以供从事植被和生态系统监测的林业、草地管理部门以及从事植被生态学研究的科研和教学人员参考。
浏览与下载链接:https://www.plantplus.cn/cn/standards/11
植被是人类赖以生存和发展的基础,不仅为人类直接或间接地提供着食物、能源、材料等生活必需品,而且对维持区域和全球生态平衡、美化和稳定人类生存环境具有关键性作用。植被图是现存植被空间分布在地图上的具体表达,不仅是开展生态学和地理学研究的基础资料,还是国土管理、自然资源开发等重大战略决策制定和实施的重要依据。植被图的绘制需要人工实地调查、遥感影像解译和专家知识相互结合。由于遥感影像常常存在“同谱异物”和“同物异谱”的现象,植被类型地面调查样点数据的不足无法满足群系(建群种或主要共建种相同的植物群落联合即为群系)级别的植被类型识别需求,只有依靠海量的植被类型空间分布信息才能保证大尺度植被图绘制的准确度。目前,植被类型调查样点数据的来源多样,例如文献记录、科研调查、公民自发记录等,各类调查之间缺乏统一的标准,而且记录植被类型的层级也不一致,难以实现数据的汇聚用于植被制图。只有通过制定统一的规范,将这些数据进行过滤、加工和分析并形成规范的植被类型调查样点数据库,同时通过规范引导科研人员和公众开展植被类型调查样点的记录内容,使其容易入库。为此,本规范的研制旨在为“植被类型调查样点数据”的收集和汇聚提供一个科学、全面、可行的数据规范。通过本规范的制定可以指导植被类型调查样点数据采集软件开发,基于采用统一的植被类型调查样点数据记录规范,更易于地面验证点调查数据库的构建,服务于植被/土地覆被图的绘制和更新。本规范还可供各林业、草原等管理和研究部门、相关高校和科研院所参考。
浏览与下载链接:https://www.plantplus.cn/cn/standards/12
在全球气候变化的背景下,就地保护无法拯救所有的植物,迁地保育则有效弥补了就地保护条件下的不确定性、可控性差、监测困难等一系列不足。迁地保育不仅为人类未来所需的植物多样性资源提供保障,而且是实施濒危植物回归自然的技术和材料的基础。当务之急是必须更有效地研究迁地保育的理论、技术和方法,采用更实用、有效的迁地保育方法和技术,从而促进迁地保育在植物多样性保护中的广泛应用。植物迁地保育数据是在植物迁地保育过程中,对植物的引种、栽培、繁育、生长、物候、病虫害等进行长期监测积累的数据,是植物科学数据重要组成部分,既为植物分类学和基础生物学研究提供丰富翔实的活体植物生长发育的材料,也为基础生物学研究提供可靠的原始数据,对基础植物学研究具有举足轻重的作用。全面开展我国植物迁地保育基础数据的收集整理,加强各植物园之间的信息联系和数据共享,对提升植物迁地保护科学研究水平有很重要的意义。然而,植物迁地保育数据散落在各个从事迁地保育研究的研究所、植物园、高校以及其他研究机构,缺乏统一的数据结构,数据之间存在结构性差异,严重影响迁地保育数据的整合和应用。本规范的编制以中国数字植物园(Chinese Virtual Botanical Garden, CVBG)相关数据标准格式及Darwin Core生物多样性信息标准为基础,旨在为植物迁地保育数据提供一个全面、科学的数据标准和数据质量控制准则,促进植物科学数据标准的统一和完善,保证数据质量。本规范还可以供农业、林业、生态环境保护等行业的相关科研和管理人员参考使用。
浏览与下载链接:https://www.plantplus.cn/cn/standards/13
植物图像数据是针对野生或栽培植物类群,通过数码相机或扫描仪采集植物数码图像过程中所产生的数据,包括植物图像、鉴定物种信息、拍摄时间、地点、生境等数据。植物图像是认识和理解植物性状最直观的途径,也是植物分类学及相关研究工作的重要资料。植物图像除了可作为研究资料在科学研究、科学普及、物种鉴定等领域发挥作用外,其拍摄或采集时记录的时间、地点、生境等信息也可作为重要的观测数据,有效补充植物标本采集等传统物种信息采集方式在时效性、完备性等方面的不足。此外,分类鉴定的植物图像也可作为计算机视觉技术研究的基础数据,用于开发植物图像智能识别系统等快速鉴定技术。本规范的编制以中国植物图像库(Plant Photo Bank of China, PPBC)标准数据格式及Darwin Core生物多样性信息标准为基础,旨在为植物图像数据提供一个全面、科学的数据规范准则,促进植物科学数据标准的统一和完善,保证数据质量。
浏览与下载链接:https://www.plantplus.cn/cn/standards/14
编辑:付其迪
审核: 李敏、吴慧、曹雅炜