1 编制背景和目的
中国是世界上植物物种最丰富的国家之一,也是世界上植物志资料比较完备的国家之一,有国家级植物志、地方植物志,如《中国植物志》、Flora of China、《北京植物志》、《小五台山植物志》等。植物志一般依分类系统编排(如恩格勒系统、哈钦松系统、被子植物分类系统等),记载了植物名称(学名、通用名和别名)、文献出处、形态特征、产地、生态习性、地理分布、经济价值等,并有分科、分属和分种检索表,科、属说明和插图等。这些志书数据是植物科学数据重要组成部分,应用非常广泛。但一直以来,有些植物志出版较早,且多为纸书,没有电子版,印刷量少,现在已经断版,广大用户很难找到这些资料。为了便于用户使用,对植物志书进行数字化做成在线植物志是比较理想的方式。
本规范的编制本规范的编制以《中国植物志》及Flora of China全文数字化数据库标准格式及Darwin Core生物多样性信息标准为基础,旨在为植物志书数字化和在线植物志建设提供一个全面、科学的数据标准和数据质量控制准则,促进植物科学数据标准的统一和完善,保证数据质量。本规范也可以作为农业、林业、生态和环境等行业志书数字化建设的参考规范。
2 定义和术语
2.1 植物志
植物志(Flora)是记载某个国家或某一地区植物种类(植物区系)的分类学专著。
2.2 插图
插图(Illustration)指书中具有直观形象特点的植物墨线图、照片、图表、表解等图表。插图可以作为文字部分的补充,用图示的方法展示植物的识别特征。
2.3 检索表
检索表(Taxa key)是鉴定植物的工具,它广泛应用于各分类阶元的鉴定。检索表的编制是用对比分析和归纳的方法,从不同阶元(目、科、属或种)的特征中选出比较重要、突出、明显而稳定的特征,根据它们之间的相互绝对性状,做成简短的条文,按一定的格式排列而成。检索表的运用和编制,是植物分类工作重要的基础。
3 数据内容与数据表结构规范
3.1 数据内容
植物志书内容包括物种名称、所属科属、物种描述、分布产地、生境、用途、分类讨论、物种检索表、插图等核心内容。基于此,在线植物志数据包括以下主要核心内容:物种分类阶元信息、物种描述信息、检索表信息、插图信息、文献信息等,简要介绍如下。
物种分类阶元信息:物种的分类阶元、科、属、种名(包括学名、中文名、别名等)等。
物种描述信息:志书中的形态描述、分布产地、生境、海拔、物候期、用途等。
检索表信息:志书中的分科、分属检索表。
插图信息:志书中的墨线图、彩色照片等。
文献信息:志书相关书目信息,包括书名、作者、出版社、出版日期、版本等。
基于上述数据内容,在线植物志数据包括6个数据表(表7-1),分别是物种名称数据表、物种分类阶元数据表、物种描述数据表、物种检索数据表、文件数据表、志书数据表等。每个数据表均有唯一的代码,fl为植物志的英文单词Flora缩写,表示这些表是在线植物志数据库的数据表,后面的字母采用能代表本表数据核心内容的英文单词或缩写表示。
数据表的代码、名称和主要包含内容见表1。
表1 在线植物志数据表信息
序号 | 数据表代码 | 数据表名称 | 数据表简介 |
1 | fl_spname | 物种名称数据表 | 包括物种名称ID、分类阶元ID、阶元拉丁名称、父级分类阶元ID、种加词、命名人、物种中文名、接受名名称ID、物种学名、物种中文名称拼音、物种中文名称拼音首字母、添加时间、添加用户ID和备注等字段 |
2 | fl_category | 物种分类阶元数据表 | 包括分类阶元ID、分类阶元编号、阶元拉丁名称缩写、阶元拉丁名称、阶元中文名称、添加时间、添加用户ID等字段 |
3 | fl_spdesc |
物种描述数据表 |
包括物种名称ID、物种学名、描述ID、描述内容、排序号、添加时间、添加用户ID等字段 |
4 | fl_spindex | 物种检索表数据表 | 包括检索表ID、物种学名、锚点、跳转号、原始检索号、跳转到锚点号、描述、转向物种的学名、转向物种的中文名、添加时间、添加用户ID等字段 |
5 | fl_file |
文件数据表 |
包括文件ID、物种名称ID、物种学名、物种中文名、图书ID、图书名称、册卷、页码、PDF文件地址、素描图地址、出版年份、添加时间、添加用户ID、备注等字段 |
6 | fl_book | 志书数据表 | 包括图书ID、图书ISBN号、图书名称、作者、出版社、出版年份、图书版次等字段 |
3.2 数据表结构与字段说明
3.2.1 物种名称数据表(fl_spname)
物种名称数据表,字段包括物种名称ID、分类阶元ID、阶元拉丁名称、父级分类阶元ID、种加词、命名人、物种中文名、接受名名称ID、物种学名、物种中文名称拼音、物种中文名称拼音首字母、添加时间、添加用户ID和备注等。
(1)物种名称ID
标识:scientificNameID
中文名称:物种名称ID
英文名称:Scientific Name ID
定义:物种名称的唯一标识
字段类型:C
字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001
(2)分类阶元ID
标识:taxonID
中文名称:分类阶元ID
英文名称:Taxon ID
定义:分类阶元的全球唯一标识
字段类型:C
字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001
(3)阶元拉丁名称
标识:taxonLatinName
中文名称:阶元拉丁名称
英文名称:Taxon Latin Name
定义:分类阶元的拉丁名称
字段类型:C
注释:只包括阶元的拉丁名,不包括命名人
字段示例:Isoetes hypsophila
(4)父级分类阶元ID
标识:parentNameUsageID
中文名称:父级分类阶元ID
英文名称:Parent Name Usage ID
定义:父级分类阶元的唯一标识
字段类型:C
字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001
(5)种加词
标识:specificEpithet
中文名称:种加词
英文名称:Specific Epithet
定义:学名的种加词
字段类型:C
字段示例:biloba
(6)命名人
标识:scientificNameAuthorship
中文名称:命名人
英文名称:Scientific Name Authorship
定义:根据命名法规格式化的学名的作者信息
字段类型:C
字段示例:L.
(7)物种中文名称
标识:vernacularName
中文名称:物种中文名称
英文名称:Vernacular Name
定义:物种的中文名称
字段类型:C
字段示例:硬叶兰
(8)接受名名称ID
标识:acceptedNameUsageID
中文名称:接受名名称ID
英文名称:Accepted Name Usage ID
定义:物种接受名的唯一标识
字段类型:C
字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001
(9)物种学名
标识:scientificName
中文名称:物种学名
英文名称:Scientific Name
定义:使用双名法命名的物种的完整名称,包含命名人
字段类型:C
字段示例:Fraxinus chinensis Roxb. subsp. rhynchophylla (Hance) E. Murray
(10)物种中文名称拼音
标识:vernacularNamePinyin
中文名称:物种中文名称拼音
英文名称:Vernacular Name Pinyin
定义:物种的中文名称拼音
字段类型:C
字段示例:yìng yè lán
(11)物种中文名称拼音首字母
标识:vernacularNamePinyinAbbreviation
中文名称:物种中文名称拼音首字母
英文名称:Vernacular Name Pinyin Abbreviation
定义:物种的中文名称拼音首字母
字段类型:C
字段示例:YYL
(12)添加时间
标识:createTime
中文名称:添加时间
英文名称:Create Time
定义:记录的创建时间
字段类型:D
注释:推荐采用ISO 8601 中日期和时间的表示格式
字段示例:2016-06-03T19:23:00
(13)添加用户ID
标识:createdBy
中文名称:添加用户ID
英文名称:Created By
定义:记录的添加用户名ID
字段类型:N
字段示例:13
(14)备注
标识:eventRemarks
中文名称:备注
英文名称:Event Remarks
定义:物种名称的备注信息
字段类型:C
字段示例:接受名
3.2.2 分类阶元数据表(fl_category)
分类阶元数据表,包括分类阶元ID、分类阶元编号、阶元拉丁名称缩写、阶元拉丁名称、阶元中文名称、添加时间、添加用户ID等字段。
(1)分类阶元ID
标识:taxonID
中文名称:分类阶元ID
英文名称:Taxon ID
定义:分类阶元的全球唯一标识
字段类型:C
字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001
(2)分类阶元编号
标识:taxonID
中文名称:分类阶元编号
英文名称:Taxon ID
定义:分类阶元的全球唯一标识
字段类型:C
字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001
(3)阶元拉丁名称缩写
标识:verbatimTaxonRank
中文名称:阶元拉丁名称缩写
英文名称:Verbatim Taxon Rank
定义:阶元的拉丁名缩写
字段类型:C
字段示例:sp., subsp., var.
(4)阶元拉丁名称
标识:taxonLatinName
中文名称:阶元拉丁名称
英文名称:Taxon Latin Name
定义:分类阶元的拉丁名称
字段类型:C
注释:只包括阶元的拉丁名,不包括命名人
字段示例:Isoetes hypsophila
(5)阶元中文名称
标识:taxonChineseName
中文名称:阶元中文名称
英文名称:Taxon Chinese Name
定义:分类阶元的中文名称
字段类型:C
字段示例:门,纲,目,科,属
(6)添加时间
标识:createTime
中文名称:添加时间
英文名称:Create Time
定义:记录的创建时间
字段类型:D
注释:推荐采用ISO 8601 中日期和时间的表示格式
字段示例:2016-06-03T19:23:00
(7)添加用户ID
标识:createdBy
中文名称:添加用户ID
英文名称:Created By
定义:记录的添加用户名ID
字段类型:N
字段示例:12
3.2.3 物种描述数据表(fl_spdesc)
物种描述数据表,记录志书中物种描述的数据。植物描述信息有形态特征、花期果期、产地分布、生境海拔、经济用途、药用价值等内容,但不同植物志图书,甚至同一本书内,并不一定完全具有上述内容,而是只有其中一部分。因此从数据结构上设计了一种灵活组织的数据表,将描述内容拆分成多个部分,每个部分作为一条记录,通过记录包含的物种学名和排序号组织在一起。
数据表字段包括物种名称ID、物种学名、描述ID、描述内容、排序号、添加时间、添加用户ID等字段。
(1)物种名称ID
标识:scientificNameID
中文名称:物种名称ID
英文名称:Scientific Name ID
定义:物种名称的唯一标识
字段类型:C
字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001
(2)物种学名
标识:scientificName
中文名称:物种学名
英文名称:Scientific Name
定义:使用双名法命名的物种的完整名称,包含命名人
字段类型:C
字段示例:Fraxinus chinensis Roxb. subsp. rhynchophylla (Hance) E. Murray
(3)描述ID
标识:descID
中文名称:描述ID
英文名称:Description ID
定义:物种描述记录的唯一标识
字段类型:C
字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001
(4)描述内容
标识:desc
中文名称:描述内容
英文名称:Description
定义:物种的形态描述
字段类型:C
字段示例:常绿乔木或灌木,嫩枝通常无毛……
(5)排序号
标识:orderNO
中文名称:排序号
英文名称:Order No
定义:排列顺序号
字段类型:C
字段示例:2
(6)添加时间
标识:createTime
中文名称:添加时间
英文名称:Create Time
定义:记录的创建时间
字段类型:D
注释:推荐采用ISO 8601 中日期和时间的表示格式
字段示例:2016-06-03T19:23:00
(7)添加用户ID
标识:createdBy
中文名称:添加用户ID
英文名称:Created By
定义:记录的添加用户名ID
字段类型:N
字段示例:13
3.2.4 物种检索数据表(fl_spindex)
物种检索数据表,用来构建分属检索表。数据表字段包括检索表ID、物种学名、锚点、跳转号、原始检索号、跳转到锚点号、描述、转向物种的学名、转向物种的中文名、添加时间、添加用户ID等。
(1)检索表ID
标识:indexID
中文名称:检索表ID
英文名称:Index ID
定义:物种检索表唯一标识
字段类型:C
字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001
(2)物种学名
标识:scientificName
中文名称:物种学名
英文名称:Scientific Name
定义:使用双名法命名的物种的完整名称,包含命名人
字段类型:C
字段示例:Fraxinus chinensis Roxb. subsp. rhynchophylla (Hance) E. Murray
(3)锚点
标识:markID
中文名称:锚点
英文名称:Mark ID
定义:检索条目的锚点,用于检索表跳转
字段类型:C
注释:锚点一般是字母或数字写成的顺序号
字段示例:1,a
(4)跳转号
标识:markNO
中文名称:跳转号
英文名称:Mark No
定义:跳转记录的顺序号
字段类型:N
注释:为整数数字
字段示例:2
(5)原始检索号
标识:originIndexID
中文名称:原始检索号
英文名称:Origin Index ID
定义:检索记录的原始检索号码
字段类型:N
字段示例:1,13
(6)跳转到锚点号
标识:gotoID
中文名称:跳转到锚点号
英文名称:Goto ID
定义:跳转到目标的锚点号
字段类型:N
注释:为整数数字
字段示例:1,13
(7)描述
标识:desc
中文名称:描述
英文名称:Description
定义:物种的形态描述
字段类型:C
字段示例:花大,萼齿肉质,长3-10毫米,宿存,果实……
(8)转向物种的学名
标识:gotoScientificName
中文名称:转向物种的学名
英文名称:Goto Scientific Name
定义:跳转到目标的物种学名
字段类型:C
字段示例:Descurainia sophia
(9)转向物种的中文名称
标识:gotovernacularName
中文名称:转向物种的中文名称
英文名称:Goto Vernacular Name
定义:跳转到目标的物种中文名
字段类型:C
字段示例:播娘蒿
(10)添加时间
标识:createTime
中文名称:添加时间
英文名称:Create Time
定义:记录的创建时间
字段类型:D
注释:推荐采用ISO 8601 中日期和时间的表示格式
字段示例:2016-06-03T19:23:00
(11)添加用户ID
标识:createdBy
中文名称:添加用户ID
英文名称:Created By
定义:记录的添加用户名ID
字段类型:N
字段示例:13
3.2.5 文件数据表(fl_file)
文件数据表的字段包括文件ID、物种名称ID、物种学名、物种中文名、图书ID、图书名称、册卷、页码、PDF文件地址、素描图地址、出版年份、添加时间、添加用户ID、备注等字段。
(1)文件ID
标识:fileID
中文名称:文件ID
英文名称:File ID
定义:文件记录的唯一标识
字段类型:C
字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001
(2)物种名称ID
标识:scientificNameID
中文名称:物种名称ID
英文名称:Scientific Name ID
定义:物种名称的唯一标识
字段类型:C
字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001
(3)物种学名
标识:scientificName
中文名称:物种学名
英文名称:Scientific Name
定义:使用双名法命名的物种的完整名称,包含命名人
字段类型:C
字段示例:Fraxinus chinensis Roxb. subsp. rhynchophylla (Hance) E. Murray
(4)物种中文名
标识:vernacularName
中文名称:物种中文名称
英文名称:Vernacular Name
定义:物种的中文名称
字段类型:C
字段示例:硬叶兰
(5)图书ID
标识:bookID
中文名称:图书ID
英文名称:Book ID
定义:图书记录的唯一标识
字段类型:C
字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001
(6)图书名称
标识:bookName
中文名称:图书名称
英文名称:Book Name
定义:植物志书的书名
字段类型:C
字段示例:中国植物志
(7)卷册
标识:bookVol
中文名称:卷册
英文名称:Book Volume
定义:图书的卷册
字段类型:C
字段示例:10(1),第10卷第1册
(8)页码
标识:bookPage
中文名称:页码
英文名称:Book Page
定义:所在页码
字段类型:C
字段示例:135
(9)PDF文件地址
标识:pathway
中文名称:PDF文件地址
英文名称:PDF Pathway
定义:图书PDF文件的存放路径和文件名
字段类型:C
字段示例:10(1)/025.pdf
(10)素描图地址
标识:imagepathway
中文名称:素描图地址
英文名称:Image pathway
定义:志书中所描图的存放路径及文件名
字段类型:C
字段示例:10(1)-037
(11)出版年份
标识:year
中文名称:出版年份
英文名称:Year
定义:图书出版年份
字段类型:D
字段示例:2008
(12)添加时间
标识:createTime
中文名称:添加时间
英文名称:Create Time
定义:记录的创建时间
字段类型:D
注释:推荐采用ISO 8601 中日期和时间的表示格式
字段示例:2016-06-03T19:23:00
(13)添加用户ID
标识:createdBy
中文名称:添加用户ID
英文名称:Created By
定义:记录的添加用户名ID
字段类型:N
字段示例:13
(14)备注
标识:eventRemarks
中文名称:备注
英文名称:Event Remarks
定义:文件的备注信息
字段类型:C
字段示例:.txt
3.2.6 志书数据表(fl_book)
志书数据表,数据表字段包括图书、图书ISBN号、图书名称、作者、出版社、出版年份、图书版次等。
(1)图书ID
标识:bookID
中文名称:图书ID
英文名称:Book ID
定义:图书记录的唯一标识
字段类型:C
字段示例:8fa58e08-08de-4ac1-b69c-1235340b7001
(2)图书ISBN号
标识:bookISBN
中文名称:ISBN
英文名称:Book ISBN
定义:图书的ISBN号码
字段类型:C
字段示例:9787030075321,978-7-03-007532-1
(3)图书名称
标识:bookName
中文名称:图书名称
英文名称:Book Name
定义:植物志书的书名
字段类型:C
字段示例:中国植物志
(4)作者
标识:author
中文名称:作者
英文名称:Author
定义:作者名称
字段类型:C
字段示例:张三
(5)出版社
标识:pubulisher
中文名称:出版社
英文名称:Pubulisher
定义:图书出版社
字段类型:C
字段示例:科学出版社
(6)出版年份
标识:year
中文名称:出版年份
英文名称:Year
定义:图书出版年份
字段类型:D
字段示例:2008
(7)图书版次
标识:bookVersion
中文名称:图书版次
英文名称:Book Version
定义:图书的版本号
字段类型:C
字段示例:第1版