在线植物志数据规范
2022/9/27      点击次数:230   

编制背景和目的

中国是世界上植物物种最丰富的国家之一,也是世界上植物志资料比较完备的国家之一,有国家级植物志、地方植物志,如《中国植物志》、Flora of China、《北京植物志》、《小五台山植物志》等。植物志一般依分类系统编排(如恩格勒系统、哈钦松系统、被子植物分类系统等),记载了植物名称(学名、通用名和别名)、文献出处、形态特征、产地、生态习性、地理分布、经济价值等,并有分科、分属和分种检索表,科、属说明和插图等。这些志书数据是植物科学数据重要组成部分,应用非常广泛。但一直以来,有些植物志出版较早,且多为纸书,没有电子版,印刷量少,现在已经断版,广大用户很难找到这些资料。为了便于用户使用,对植物志书进行数字化做成在线植物志是比较理想的方式。

本规范的编制本规范的编制以《中国植物志》及Flora of China全文数字化数据库标准格式及Darwin Core生物多样性信息标准为基础,旨在为植物志书数字化和在线植物志建设提供一个全面、科学的数据标准和数据质量控制准则,促进植物科学数据标准的统一和完善,保证数据质量。本规范也可以作为农业、林业、生态和环境等行业志书数字化建设的参考规范。

定义和术语

2.1 植物志

植物志(Flora)是记载某个国家或某一地区植物种类(植物区系)的分类学专著。

2.2 插图

插图(Illustration)指书中具有直观形象特点的植物墨线图、照片、图表、表解等图表。插图可以作为文字部分的补充,用图示的方法展示植物的识别特征。

2.3 检索表

检索表(Taxa key)是鉴定植物的工具,它广泛应用于各分类阶元的鉴定。检索表的编制是用对比分析和归纳的方法,从不同阶元(目、科、属或种)的特征中选出比较重要、突出、明显而稳定的特征,根据它们之间的相互绝对性状,做成简短的条文,按一定的格式排列而成。检索表的运用和编制,是植物分类工作重要的基础。

数据内容与数据表结构规范

3.1 数据内容

植物志书内容包括物种名称、所属科属、物种描述、分布产地、生境、用途、分类讨论、物种检索表、插图等核心内容。基于此,在线植物志数据包括以下主要核心内容:物种分类阶元信息、物种描述信息、检索表信息、插图信息、文献信息等,简要介绍如下。

物种分类阶元信息:物种的分类阶元、科、属、种名(包括学名、中文名、别名等)等。

物种描述信息:志书中的形态描述、分布产地、生境、海拔、物候期、用途等。

检索表信息:志书中的分科、分属检索表。

插图信息:志书中的墨线图、彩色照片等。

文献信息:志书相关书目信息,包括书名、作者、出版社、出版日期、版本等。

基于上述数据内容,在线植物志数据包括6个数据表(表7-1),分别是物种名称数据表、物种分类阶元数据表、物种描述数据表、物种检索数据表、文件数据表、志书数据表等。每个数据表均有唯一的代码,fl为植物志的英文单词Flora缩写,表示这些表是在线植物志数据库的数据表,后面的字母采用能代表本表数据核心内容的英文单词或缩写表示。

数据表的代码、名称和主要包含内容见表1


表1 在线植物志数据表信息

序号 数据表代码 数据表名称 数据表简介
1 fl_spname 物种名称数据表 包括物种名称ID、分类阶元ID、阶元拉丁名称、父级分类阶元ID、种加词、命名人、物种中文名、接受名名称ID、物种学名、物种中文名称拼音、物种中文名称拼音首字母、添加时间、添加用户ID和备注等字段
2 fl_category 物种分类阶元数据表 包括分类阶元ID、分类阶元编号、阶元拉丁名称缩写、阶元拉丁名称、阶元中文名称、添加时间、添加用户ID等字段
3 fl_spdesc

物种描述数据表

包括物种名称ID、物种学名、描述ID、描述内容、排序号、添加时间、添加用户ID等字段
4 fl_spindex 物种检索表数据表 包括检索表ID、物种学名、锚点、跳转号、原始检索号、跳转到锚点号、描述、转向物种的学名、转向物种的中文名、添加时间、添加用户ID等字段
5 fl_file

文件数据表

包括文件ID、物种名称ID、物种学名、物种中文名、图书ID、图书名称、册卷、页码、PDF文件地址、素描图地址、出版年份、添加时间、添加用户ID、备注等字段
6 fl_book 志书数据表 包括图书ID、图书ISBN号、图书名称、作者、出版社、出版年份、图书版次等字段

3.2 数据表结构与字段说明

3.2.1 物种名称数据表(fl_spname)

物种名称数据表,字段包括物种名称ID、分类阶元ID、阶元拉丁名称、父级分类阶元ID、种加词、命名人、物种中文名、接受名名称ID、物种学名、物种中文名称拼音、物种中文名称拼音首字母、添加时间、添加用户ID和备注等。

1)物种名称ID

标识:scientificNameID

中文名称:物种名称ID

英文名称:Scientific Name ID

定义:物种名称的唯一标识

字段类型:C

字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001

2)分类阶元ID

标识:taxonID

中文名称:分类阶元ID

英文名称:Taxon ID

定义:分类阶元的全球唯一标识

字段类型:C

字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001

3)阶元拉丁名称

标识:taxonLatinName

中文名称:阶元拉丁名称

英文名称:Taxon Latin Name

定义:分类阶元的拉丁名称

字段类型:C

注释:只包括阶元的拉丁名,不包括命名人

字段示例:Isoetes hypsophila

4)父级分类阶元ID

标识:parentNameUsageID

中文名称:父级分类阶元ID

英文名称:Parent Name Usage ID

定义:父级分类阶元的唯一标识

字段类型:C

字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001

5)种加词

标识:specificEpithet

中文名称:种加词

英文名称:Specific Epithet

定义:学名的种加词

字段类型:C

字段示例:biloba

6)命名人

标识:scientificNameAuthorship

中文名称:命名人

英文名称:Scientific Name Authorship

定义:根据命名法规格式化的学名的作者信息

字段类型:C

字段示例:L.

7)物种中文名称

标识:vernacularName

中文名称:物种中文名称

英文名称:Vernacular Name

定义:物种的中文名称

字段类型:C

字段示例:硬叶兰

8)接受名名称ID

标识:acceptedNameUsageID

中文名称:接受名名称ID

英文名称:Accepted Name Usage ID

定义:物种接受名的唯一标识

字段类型:C

字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001

9)物种学名

标识:scientificName

中文名称:物种学名

英文名称:Scientific Name

定义:使用双名法命名的物种的完整名称,包含命名人

字段类型:C

字段示例:Fraxinus chinensis Roxb. subsp. rhynchophylla (Hance) E. Murray

10)物种中文名称拼音

标识:vernacularNamePinyin

中文名称:物种中文名称拼音

英文名称:Vernacular Name Pinyin

定义:物种的中文名称拼音

字段类型:C

字段示例:yìng yè lán

11)物种中文名称拼音首字母

标识:vernacularNamePinyinAbbreviation

中文名称:物种中文名称拼音首字母

英文名称:Vernacular Name Pinyin Abbreviation

定义:物种的中文名称拼音首字母

字段类型:C

字段示例:YYL

12)添加时间

标识:createTime

中文名称:添加时间

英文名称:Create Time

定义:记录的创建时间

字段类型:D

注释:推荐采用ISO 8601 中日期和时间的表示格式

字段示例:2016-06-03T19:23:00

13)添加用户ID

标识:createdBy

中文名称:添加用户ID

英文名称:Created By

定义:记录的添加用户名ID

字段类型:N

字段示例:13

14)备注

标识:eventRemarks

中文名称:备注

英文名称:Event Remarks

定义:物种名称的备注信息

字段类型:C

字段示例:接受名

3.2.2 分类阶元数据表(fl_category)

分类阶元数据表,包括分类阶元ID、分类阶元编号、阶元拉丁名称缩写、阶元拉丁名称、阶元中文名称、添加时间、添加用户ID等字段。

1)分类阶元ID

标识:taxonID

中文名称:分类阶元ID

英文名称:Taxon ID

定义:分类阶元的全球唯一标识

字段类型:C

字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001

2)分类阶元编号

标识:taxonID

中文名称:分类阶元编号

英文名称:Taxon ID

定义:分类阶元的全球唯一标识

字段类型:C

字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001

3)阶元拉丁名称缩写

标识:verbatimTaxonRank

中文名称:阶元拉丁名称缩写

英文名称:Verbatim Taxon Rank

定义:阶元的拉丁名缩写

字段类型:C

字段示例:sp., subsp., var.

4)阶元拉丁名称

标识:taxonLatinName

中文名称:阶元拉丁名称

英文名称:Taxon Latin Name

定义:分类阶元的拉丁名称

字段类型:C

注释:只包括阶元的拉丁名,不包括命名人

字段示例:Isoetes hypsophila

5)阶元中文名称

标识:taxonChineseName

中文名称:阶元中文名称

英文名称:Taxon Chinese Name

定义:分类阶元的中文名称

字段类型:C

字段示例:门,纲,目,科,属

6)添加时间

标识:createTime

中文名称:添加时间

英文名称:Create Time

定义:记录的创建时间

字段类型:D

注释:推荐采用ISO 8601 中日期和时间的表示格式

字段示例:2016-06-03T19:23:00

7)添加用户ID

标识:createdBy

中文名称:添加用户ID

英文名称:Created By

定义:记录的添加用户名ID

字段类型:N

字段示例:12

3.2.3 物种描述数据表(fl_spdesc)

物种描述数据表,记录志书中物种描述的数据。植物描述信息有形态特征、花期果期、产地分布、生境海拔、经济用途、药用价值等内容,但不同植物志图书,甚至同一本书内,并不一定完全具有上述内容,而是只有其中一部分。因此从数据结构上设计了一种灵活组织的数据表,将描述内容拆分成多个部分,每个部分作为一条记录,通过记录包含的物种学名和排序号组织在一起。

数据表字段包括物种名称ID、物种学名、描述ID、描述内容、排序号、添加时间、添加用户ID等字段。

1)物种名称ID

标识:scientificNameID

中文名称:物种名称ID

英文名称:Scientific Name ID

定义:物种名称的唯一标识

字段类型:C

字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001

2)物种学名

标识:scientificName

中文名称:物种学名

英文名称:Scientific Name

定义:使用双名法命名的物种的完整名称,包含命名人

字段类型:C

字段示例:Fraxinus chinensis Roxb. subsp. rhynchophylla (Hance) E. Murray

3)描述ID

标识:descID

中文名称:描述ID

英文名称:Description ID

定义:物种描述记录的唯一标识

字段类型:C

字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001

4)描述内容

标识:desc

中文名称:描述内容

英文名称:Description

定义:物种的形态描述

字段类型:C

字段示例:常绿乔木或灌木,嫩枝通常无毛……

5)排序号

标识:orderNO

中文名称:排序号

英文名称:Order No

定义:排列顺序号

字段类型:C

字段示例:2

6)添加时间

标识:createTime

中文名称:添加时间

英文名称:Create Time

定义:记录的创建时间

字段类型:D

注释:推荐采用ISO 8601 中日期和时间的表示格式

字段示例:2016-06-03T19:23:00

7)添加用户ID

标识:createdBy

中文名称:添加用户ID

英文名称:Created By

定义:记录的添加用户名ID

字段类型:N

字段示例:13

3.2.4 物种检索数据表(fl_spindex)

物种检索数据表,用来构建分属检索表。数据表字段包括检索表ID、物种学名、锚点、跳转号、原始检索号、跳转到锚点号、描述、转向物种的学名、转向物种的中文名、添加时间、添加用户ID等。

1)检索表ID

标识:indexID

中文名称:检索表ID

英文名称:Index ID

定义:物种检索表唯一标识

字段类型:C

字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001

2)物种学名

标识:scientificName

中文名称:物种学名

英文名称:Scientific Name

定义:使用双名法命名的物种的完整名称,包含命名人

字段类型:C

字段示例:Fraxinus chinensis Roxb. subsp. rhynchophylla (Hance) E. Murray

3)锚点

标识:markID

中文名称:锚点

英文名称:Mark ID

定义:检索条目的锚点,用于检索表跳转

字段类型:C

注释:锚点一般是字母或数字写成的顺序号

字段示例:1a

4)跳转号

标识:markNO

中文名称:跳转号

英文名称:Mark No

定义:跳转记录的顺序号

字段类型:N

注释:为整数数字

字段示例:2

5)原始检索号

标识:originIndexID

中文名称:原始检索号

英文名称:Origin Index ID

定义:检索记录的原始检索号码

字段类型:N

字段示例:113

6)跳转到锚点号

标识:gotoID

中文名称:跳转到锚点号

英文名称:Goto ID

定义:跳转到目标的锚点号

字段类型:N

注释:为整数数字

字段示例:113

7)描述

标识:desc

中文名称:描述

英文名称:Description

定义:物种的形态描述

字段类型:C

字段示例:花大,萼齿肉质,长3-10毫米,宿存,果实……

8)转向物种的学名

标识:gotoScientificName

中文名称:转向物种的学名

英文名称:Goto Scientific Name

定义:跳转到目标的物种学名

字段类型:C

字段示例:Descurainia sophia

9)转向物种的中文名称

标识:gotovernacularName

中文名称:转向物种的中文名称

英文名称:Goto Vernacular Name

定义:跳转到目标的物种中文名

字段类型:C

字段示例:播娘蒿

10)添加时间

标识:createTime

中文名称:添加时间

英文名称:Create Time

定义:记录的创建时间

字段类型:D

注释:推荐采用ISO 8601 中日期和时间的表示格式

字段示例:2016-06-03T19:23:00

11)添加用户ID

标识:createdBy

中文名称:添加用户ID

英文名称:Created By

定义:记录的添加用户名ID

字段类型:N

字段示例:13

3.2.5 文件数据表(fl_file)

文件数据表的字段包括文件ID、物种名称ID、物种学名、物种中文名、图书ID、图书名称、册卷、页码、PDF文件地址、素描图地址、出版年份、添加时间、添加用户ID、备注等字段。

1)文件ID

标识:fileID

中文名称:文件ID

英文名称:File ID

定义:文件记录的唯一标识

字段类型:C

字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001

2)物种名称ID

标识:scientificNameID

中文名称:物种名称ID

英文名称:Scientific Name ID

定义:物种名称的唯一标识

字段类型:C

字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001

3)物种学名

标识:scientificName

中文名称:物种学名

英文名称:Scientific Name

定义:使用双名法命名的物种的完整名称,包含命名人

字段类型:C

字段示例:Fraxinus chinensis Roxb. subsp. rhynchophylla (Hance) E. Murray

4)物种中文名

标识:vernacularName

中文名称:物种中文名称

英文名称:Vernacular Name

定义:物种的中文名称

字段类型:C

字段示例:硬叶兰

5)图书ID

标识:bookID

中文名称:图书ID

英文名称:Book ID

定义:图书记录的唯一标识

字段类型:C

字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001

6)图书名称

标识:bookName

中文名称:图书名称

英文名称:Book Name

定义:植物志书的书名

字段类型:C

字段示例:中国植物志

7)卷册

标识:bookVol

中文名称:卷册

英文名称:Book Volume

定义:图书的卷册

字段类型:C

字段示例:10(1),第10卷第1

8)页码

标识:bookPage

中文名称:页码

英文名称:Book Page

定义:所在页码

字段类型:C

字段示例:135

9PDF文件地址

标识:pathway

中文名称:PDF文件地址

英文名称:PDF Pathway

定义:图书PDF文件的存放路径和文件名

字段类型:C

字段示例:10(1)/025.pdf

10)素描图地址

标识:imagepathway

中文名称:素描图地址

英文名称:Image pathway

定义:志书中所描图的存放路径及文件名

字段类型:C

字段示例:10(1)-037

11)出版年份

标识:year

中文名称:出版年份

英文名称:Year

定义:图书出版年份

字段类型:D

字段示例:2008

12)添加时间

标识:createTime

中文名称:添加时间

英文名称:Create Time

定义:记录的创建时间

字段类型:D

注释:推荐采用ISO 8601 中日期和时间的表示格式

字段示例:2016-06-03T19:23:00

13)添加用户ID

标识:createdBy

中文名称:添加用户ID

英文名称:Created By

定义:记录的添加用户名ID

字段类型:N

字段示例:13

14)备注

标识:eventRemarks

中文名称:备注

英文名称:Event Remarks

定义:文件的备注信息

字段类型:C

字段示例:.txt

3.2.6 志书数据表(fl_book)

志书数据表,数据表字段包括图书、图书ISBN号、图书名称、作者、出版社、出版年份、图书版次等。

1)图书ID

标识:bookID

中文名称:图书ID

英文名称:Book ID

定义:图书记录的唯一标识

字段类型:C

字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001

2)图书ISBN

标识:bookISBN

中文名称:ISBN

英文名称:Book ISBN

定义:图书的ISBN号码

字段类型:C

字段示例:9787030075321978-7-03-007532-1

3)图书名称

标识:bookName

中文名称:图书名称

英文名称:Book Name

定义:植物志书的书名

字段类型:C

字段示例:中国植物志

4)作者

标识:author

中文名称:作者

英文名称:Author

定义:作者名称

字段类型:C

字段示例:张三

5)出版社

标识:pubulisher

中文名称:出版社

英文名称:Pubulisher

定义:图书出版社

字段类型:C

字段示例:科学出版社

6)出版年份

标识:year

中文名称:出版年份

英文名称:Year

定义:图书出版年份

字段类型:D

字段示例:2008

7)图书版次

标识:bookVersion

中文名称:图书版次

英文名称:Book Version

定义:图书的版本号

字段类型:C

字段示例:第1

  


2022/11/16 9:24:22