1 编制背景和目的
中国植物物种名录数据是针对中国原产和引入的植物类群进行长期积累和更新的数据,是植物科学数据的重要组成部分。本规范的编制参考物种标准数据格式及生物多样性信息标准,旨在为中国原产和引入的有胚植物物种数据(包含苔藓植物、石松植物、蕨类植物、裸子植物和被子植物)提供一个全面、科学的数据标准和数据质量控制准则,促进植物科学数据标准的统一和完善,保证数据质量。
本规范中科和科以上等级依据近年来广泛应用的系统(石松和蕨类植物的分类系统)、系统(裸子植物的分类系统)、APG IV系统(被子植物的分类系统),科以下等级依据《中国植物志》、《Flora of China》以及近10年来发表的与国产类群相关的分类学修订结果。
2 定义和术语
2.1 分类阶元
分类阶元(Rank)是遵循林奈分类体系框架下的各级分类单元:门(Phylum)、纲(Class)、目(Order)、科(Family)、属(Genus)、种(Species),以及种下等级:亚种(Subspecies)、变种(Variety)、变型(Form)、品种(Cultivar)。
2.2 分类群
分类群(Taxon)是某个生物门类的集合,可以是遵循林奈分类体系的任何阶元,如某个门、某个科、某个种、某个亚种,均可称为“分类群”,复数为Taxa。
2.3 学名
学名(Scientific name)是指分类阶元的科学名称,由拉丁文或拉丁化的其他语言构成,种上等级的学名仅由一个词构成,种级名称由两部分构成,即属名(Genus)和种加词(Epithet),种下等级由两部分以上构成,除属名和种加词外,还有种下等级的标识(如subsp.、var.、f.等)和种下等级的加词。
2.4 中文名
中文名(Chinese name)是指分类阶元的中文名称,种上等级的中文名称以“门”、“纲”、“目”、“科”、“属”等字结尾,以标示其阶元等级,种及种下等级的中文名称以修饰语(有时无修饰语)和属中文名构成。
2.5 命名人
命名人(Author)是发表学名时的作者名称,按照命名法规有标准的缩写要求。
2.6 原始文献
原始文献(Reference)是发表学名时的文献,可以是书籍、期刊等形式,包含文献名称(或其缩写形式)、卷期、页码、年代等信息。
2.7 接受名
接受名(Accepted name)指在经过分类学修订之后,某个种或种下等级的分类群有且仅有一个被认可的学名,即接受名。
2.8 异名
异名(Synonym)在经过分类学修订之后,被认为与某个接受名所指的分类群为同一类群的名称,即为该接受名的异名。
2.9 分布
分布(Distribution)指某个分类群在自然状态下占据的地理区域,在本数据规范中包含它在国外(中国以外的其他国家)和国内(中国境内)的分布。
3 数据内容与数据表结构规范
3.1 数据内容
中国植物物种名录数据的核心内容是7个数据表:植物中文名和学名信息、科及科上等级信息、原始发表文献信息、物种名称与原始发表文献的关联信息、物种国内外分布信息、审核专家信息、物种名称与审核专家的关联信息。数据表的代码和名称简介见表1。
表1 中国植物物种名录数据表信息
序号 |
数据表代码 |
数据表中文名称 |
数据表简介 |
1 |
specieslist_scientificnames |
植物中文名和学名信息表 |
包括物种名称ID、属拉丁名称、属中文名称、种加词、物种中文名、种下加词、种下等级中文名称、种下等级类型、命名人、接受名名称ID、科拉丁名称ID、是否为接受名、属中文名称拼音、物种中文名称拼音、种下等级中文名称拼音、物种学名等字段 |
2 |
specieslist_families |
科及科上等级分类信息表 |
包括分类群名称ID、界拉丁名称、门拉丁名称、纲拉丁名称、目拉丁名称、科拉丁名称、界中文名称、门中文名称、纲中文名称、目中文名称、科中文名称、是否为接受名、界中文名称拼音、门中文名称拼音、纲中文名称拼音、目中文名称拼音和科中文名称拼音等字段 |
3 |
specieslist_references |
原始发表文献信息表 |
包括文献ID、文献发表年代、文献发表详细信息等3个字段 |
4 |
specieslist_referencelinks |
物种名称与原始发表文献的关联信息表 |
包括物种名称ID、文献类型和文献ID等3个字段 |
5 |
specieslist_distribution |
物种的国内外分布信息表 |
包括分布信息ID、物种名称ID、英文分布信息和中文分布信息等4个字段 |
6 |
specieslist_spceialists |
审核专家信息表 |
包括审核专家ID、审核专家英文姓名、审核专家中文姓名、研究机构英文名称、研究机构中文名称、英文通讯地址和中文通讯地址等7个字段 |
7 |
specieslist_specialis_scientificname |
物种名称与审核专家的关联信息表 |
包括物种名称ID和审核专家ID2个字段 |
3.2 数据表结构与字段说明
本规范对数据表字段采用标识、中文名称、英文名称、定义、字段类型、字段单位、注释和字段示例等来进行描述,具体含义简介如下:
(1)标识:用字符串表示的字段标识码。如果该字段在Darwin Core生物多样性信息标准中存在对应的字段,则采用Darwin Core的标准;如果该字段在Darwin Core生物多样性信息标准中不存在对应的字段,则按照Darwin Core编码规则定义该字段标识。
(2)中文名称:字段的中文名称。
(3)英文名称:字段的英文名称,一般用英文全称。
(4)定义:对字段含义的解释。
(5)字段类型:字段所属数据类型,如字符型、数值型、日期型和逻辑型等,为书写方便,用C表示“字符型”,N表示“数值型”,D表示“日期型”,L表示“逻辑型”。
(6)字段单位:部分数值型字段具有单位,比如千米(km)、千克(kg)。
(7)注释:对字段的补充说明、著录格式的建议及其它。
(8)字段示例:给出字段的具体案例。
本表包含物种名称ID、属拉丁名称、属中文名称、种加词、物种中文名、种下加词、种下等级中文名称、种下等级类型、命名人、接受名名称ID、科拉丁名称ID、是否为接受名、属中文名称拼音、物种中文名称拼音、种下等级中文名称拼音、物种学名等16个字段。
本表为物种名录数据的核心数据,每个种及种下单元分配唯一的ID,以保证数据的准确性和不可替代性。字段说明如下:
(1)物种名称ID
标识:scientificNameID
中文名称:物种名称ID
英文名称:Scientific Name ID
定义:物种名称的唯一标识
字段类型:C
字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001
(2)属拉丁名称
标识:genus
中文名称:属拉丁名称
英文名称:Genus
定义:分类单元中属的全称
字段类型:C
字段示例:Ginkgo
(3)属中文名称
标识:genusChineseName
中文名称:属中文名称
英文名称:Genus Chinese Name
定义:分类单元中属名的中文名称
字段类型:C
字段示例:银杏属
(4)种加词
标识:specificEpithet
中文名称:种加词
英文名称:Specific Epithet
定义:学名中的种加词
字段类型:C
字段示例:biloba
(5)物种中文名
标识:vernacularName
中文名称:物种中文名称
英文名称:Vernacular Name
定义:物种的中文名称
字段类型:C
字段示例:硬叶兰
(6)种下加词
标识:infraspecificEpithet
中文名称:种下加词
英文名称:Infraspecific Epithet
定义:拉丁学名种下更低级别的名称加词,包含各种级别
字段类型:C
字段示例:concolor
(7)种下等级中文名称
标识:infraspeciesChineseName
中文名称:种下等级中文名称
英文名称:Infraspecies Chinese Name
定义:种下等级的中文名称
字段类型:C
字段示例:亚种,变种,变型
(8)种下等级类型
标识:taxonRank
中文名称:种下等级类型
英文名称:Taxon Rank
定义:种下等级的类型。
字段类型:C
字段示例:subspecies, varietas, forma
(9)命名人
标识:scientificNameAuthorship
中文名称:命名人
英文名称:Scientific Name Authorship
定义:根据命名法规格式化的学名的作者信息
字段类型:C
字段示例:L.
(10)接受名名称ID
标识:acceptedNameUsageID
中文名称:接受名名称ID
英文名称:Accepted Name Usage ID
定义:物种接受名的唯一标识
字段类型:C
字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001
(11)科拉丁名称ID
标识:familyID
中文名称:科拉丁名称ID
英文名称:Family ID
定义:科拉丁名称的唯一标识
字段类型:C
字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001
(12)是否为接受名
标识:isAcceptedName
中文名称:是否为接受名
英文名称:Is Accepted Name
定义:学名是否为接受名
字段类型:L
注释:值为“1”时表示为接受名
字段示例:1
(13)属中文名称拼音
标识:genusChineseNamePinyin
中文名称:属中文名称拼音
英文名称:Genus Chinese Name Pinyin
定义:分类单元中属名的中文名称的汉语拼音
字段类型:C
字段示例:yín xìng shǔ
(14)物种中文名称拼音
标识:vernacularNamePinyin
中文名称:物种中文名称拼音
英文名称:Vernacular Name Pinyin
定义:物种的中文名称拼音
字段类型:C
字段示例:yìng yè lán
(15)种下等级中文名称拼音
标识:infraspeciesChineseNamePinyin
中文名称:种下等级中文名称拼音
英文名称:Infraspecies Chinese Name Pinyin
定义:种下等级的中文名称的拼音
字段类型:C
字段示例:biàn zhǒng,yà zhǒng
(16)物种学名
标识:scientificName
中文名称:物种学名
英文名称:Scientific Name
定义:使用双名法命名的物种的完整名称,包含命名人
字段类型:C
字段示例:Cymbidium mannii Rchb. f.
本表包含植物名称与原始发表文献的关联信息,有分类群名称ID、界拉丁名称、门拉丁名称、纲拉丁名称、目拉丁名称、科拉丁名称、界中文名称、门中文名称、纲中文名称、目中文名称、科中文名称、是否为接受名、界中文名称拼音、门中文名称拼音、纲中文名称拼音、目中文名称拼音和科中文名称拼音等17个字段。
本表构建属以上等级的分类系统和目录树结构,并通过record_id字段与specieslist_scientificnames表的family_id字段进行关联。字段说明如下:
(1)分类群名称ID
标识:taxonID
中文名称:分类群名称ID
英文名称:Taxon ID
定义:分类阶元的全球唯一标识
字段类型:C
字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001, 32567
(2)界拉丁名称
标识:kingdom
中文名称:界拉丁名称
英文名称:Kingdom
定义:分类单元所属界的完整学名
字段类型:C
字段示例:Plantae
(3)门拉丁名称
标识:phylum
中文名称:门拉丁名称
英文名称:Phylum
定义:分类单元所属门的完整学名
字段类型:C
字段示例:Angiospermae
(4)纲拉丁名称
标识:class
中文名称:纲拉丁名称
英文名称:Class
定义:分类单元所属纲的完整学名
字段类型:C
字段示例:Magnoliopsida
(5)目拉丁名称
标识:order
中文名称:目拉丁名称
英文名称:Order
定义:分类单元所属目的完整学名
字段类型:C
字段示例:Ginkgoales
(6)科拉丁名称
标识:family
中文名称:科拉丁名称
英文名称:Family
定义:分类单元所属科的完整学名
字段类型:C
字段示例:Lythraceae
(7)界中文名称
标识:kingdomChineseName
中文名称:界中文名称
英文名称:Kingdom Chinese Name
定义:分类单元所属界的中文名称
字段类型:C
字段示例:植物界
(8)门中文名称
标识:phylumChineseName
中文名称:门中文名称
英文名称:Phylum Chinese Name
定义:分类阶元门的中文名称
字段类型:C
字段示例:被子植物门
(9)纲中文名称
标识:classChineseName
中文名称:纲中文名称
英文名称:Class Chinese Name
定义:分类单元所属纲的中文名称
字段类型:C
字段示例:木兰纲
(10)目中文名称
标识:orderChineseName
中文名称:目中文名称
英文名称:Order Chinese Name
定义:分类单元所属目的中文名称
字段类型:C
字段示例:银杏目
(11)科中文名称
标识:familyChineseName
中文名称:科中文名称
英文名称:Family Chinese Name
定义:分类单元所属科的中文名称
字段类型:C
字段示例:千屈菜科
(12)是否为接受名
标识:isAcceptedName
中文名称:是否为接受名
英文名称:Is Accepted Name
定义:学名是否为接受名
字段类型:L
注释:值为“1”时表示为接受名
字段示例:1
(13)界中文名称拼音
标识:kingdomChineseNamePinyin
中文名称:界中文名称拼音
英文名称:Kingdom Chinese Name Pinyin
定义:分类单元所属界的中文名称的拼音
字段类型:C
字段示例:zhí wù jiè
(14)门中文名称拼音
标识:phylumChineseNamePinyin
中文名称:门中文名称拼音
英文名称:Phylum Chinese Name Pinyin
定义:分类阶元门的中文名称的拼音
字段类型:C
字段示例:bèi zǐ zhí wù mén
(15)纲中文名称拼音
标识:classChineseNamePinyin
中文名称:纲中文名称拼音
英文名称:Class Chinese Name Pinyin
定义:分类单元所属纲的中文名称拼音
字段类型:C
字段示例:mù lán gāng
(16)目中文名称拼音
标识:orderChineseNamePinyin
中文名称:目中文名称拼音
英文名称:Order Chinese Name Pinyin
定义:分类单元所属目的中文名称的汉语拼音
字段类型:C
字段示例:yín xìng mù
(17)科中文名称拼音
标识:familyChineseNamePinyin
中文名称:科中文名称拼音
英文名称:Family Chinese Name Pinyin
定义:分类单元所属科的中文名称的拼音
字段类型:C
字段示例:qiān qū cài kē
本表包含种及种下分类群的原始发表文献信息,有文献ID、文献发表年代、文献发表详细信息3个字段。本表通过record_id字段与specieslist_referencelinks表的reference_id字段进行关联。字段说明如下:
(1)文献ID
标识:recordID
中文名称:文献ID
英文名称:Record ID
定义:原始发表文献数据的唯一标识
字段类型:C
字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001
(2)文献发表年代
标识:namePublishedInYear
中文名称:文献发表年代
英文名称:Published Year
定义:原始文献发表的年份
字段类型:C
字段示例:1981
(3)文献发表详细信息
标识:namePublishedIn
中文名称:文献发表详细信息
英文名称:Published Information
定义:原始文献发表的详细信息
字段类型:C
字段示例:Hooker's Icon. Pl. 18: t. 1742 (1888)
本表包含物种名称与原始发表文献的关联信息,有物种名称ID、文献类型和文献ID等3个字段。本表通过record_id字段与specieslist_scientificnames表的name_code字段进行关联。字段说明如下:
(1)物种名称ID
标识:scientificNameID
中文名称:物种名称ID
英文名称:Scientific Name ID
定义:物种名称的唯一标识
字段类型:C
字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001
(2)文献类型
标识:referenceType
中文名称:文献类型
英文名称:Reference Type
定义:文献的类型
字段类型:C
字段示例:期刊, 学位论文, 会议论文
(3)文献ID
标识:referenceID
中文名称:文献ID
英文名称:Reference ID
定义:原始发表文献数据的唯一标识
字段类型:C
字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001
本表包含物种在国内外的分布信息,有分布信息ID、物种名称ID、英文分布信息和中文分布信息等4个字段。本表通过record_id字段与specieslist_scientificnames表的name_code字段进行关联。字段说明如下:
(1)分布信息ID
标识:recordID
中文名称:分布信息ID
英文名称:Record ID
定义:分布信息的全球唯一标识
字段类型:C
字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001
(2)物种名称ID
标识:scientificNameID
中文名称:物种名称ID
英文名称:Scientific Name ID
定义:物种名称的唯一标识
字段类型:C
字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001
(3)英文分布信息
标识:distribution
中文名称:英文分布信息
英文名称:Distribution
定义:英文物种分布信息
字段类型:C
字段示例:Anhui province,Zhejiang province
(4)中文分布信息
标识:distributionChinese
中文名称:中文分布信息
英文名称:Chinese Distribution
定义:中文分布地点信息
字段类型:C
字段示例:安徽省,浙江省
本表包含各类群审核专家的信息,有审核专家ID、审核专家英文姓名、审核专家中文姓名、研究机构英文名称、研究机构中文名称、英文通讯地址和中文通讯地址等7个字段。
本表通过record_id字段与specieslist_specialis_scientificname表的specialist_id字段进行关联。字段说明如下:
(1)审核专家ID
标识:specialistID
中文名称:审核专家ID
英文名称:Specialist ID
定义:审核专家的用户账号
字段类型:C
字段示例:user0023
(2)审核专家英文姓名
标识:specialistName
中文名称:审核专家英文姓名
英文名称:Specialist Name
定义:审核专家的英文姓名
字段类型:C
字段示例:Chen Zhiduan
(3)审核专家中文姓名
标识:specialistNameChinese
中文名称:审核专家中文姓名
英文名称:Specialist Chinese Name
定义:审核专家的中文姓名
字段类型:C
字段示例:陈之端
(4)研究机构英文名称
标识:institute
中文名称:研究机构英文名称
英文名称:Institute
定义:审核专家所在研究机构英文名
字段类型:C
字段示例:Institute of Botany, CAS
(5)研究机构中文名称
标识:instituteChinese
中文名称:研究机构中文名称
英文名称:Institute Chinese Name
定义:审核专家所在研究机构中文名
字段类型:C
字段示例:中国科学院植物研究所
(6)英文通讯地址
标识:address
中文名称:英文通讯地址
英文名称:Address
定义:审核专家英文通讯地址
字段类型:C
字段示例:No.20 Nanxincun, Xiangshan, Beijing 100093, China
(7)中文通讯地址
标识:addressChinese
中文名称:英文通讯地址
英文名称:Chinese Address
定义:审核专家中文通讯地址
字段类型:C
字段示例:北京市海淀区香山南辛村20号
本表包含物种名称与审核专家的关联信息,有物种名称ID和审核专家ID两个字段。本表通过name_code字段与specieslist_scientificnames表的name_code字段进行关联,通过specialist_id字段与specieslist_spceialists表的record_id字段进行关联。字段说明如下:
(1)物种名称ID
标识:scientificNameID
中文名称:物种名称ID
英文名称:Scientific Name ID
定义:物种名称的唯一标识符
字段类型:C
字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001
(2)审核专家ID
标识:specialistID
中文名称:审核专家ID
英文名称:Specialist ID
定义:审核专家的用户ID
字段类型:C
字段示例:user0023