形态变异普遍存在于生物物种,准确捕捉并全面解析生物形态及其变异,对于理解它们与发育及环境之间的相互联系至关重要。几何形态测量学为多维生物形态的定量分析提供了数学工具,被视为形态测量学领域的重要突破。椭圆傅里叶分析是几何形态测量学中常用的数学分析方法,该方法能够将二维闭合曲线通过数学函数转换为椭圆傅里叶描述子,并以任意小的偏差重构原始形状,能够实现几何形态学由之前的定性分析转变为定量分析,并已在动物学、植物学和临床医学中展现出应用潜力。然而,传统椭圆傅里叶描述子归一化仅能对平移、旋转以及尺寸缩放进行归一化,对于二维曲线的逆转、对称、不同起始点难以获得唯一且可比较的结果,需要大量手动对齐工作,这限制了该方法对高通量、高变异、高维度的生物形态进行自动化分析的能力。
针对此问题,中国科学院植物科学数据中心团队提出了一种椭圆傅里叶描述子完全归一化的数学方法,理论推导并证明该方法在逆转、起始点、对称性等基本轮廓变换下均能获得一致的归一化的结果(图1),完善了椭圆傅里叶描述子归一化理论基础,为大数据时代高通量、自动化图形处理铺平了道路。

图1:椭圆傅里叶描述子完全归一化的全过程,以蓝色线所示的乌龟轮廓为例,逐步实现平移、逆转、缩放、旋转、起始点、对称性等归一化步骤。
为了证明方法的稳定性,团队使用基准数据集对椭圆傅里叶描述子完全归一化方法进行了逐一验证,测试结果表明该方法与理论分析结果一致,具有高度稳定性和鲁棒性(图2)。

图2:椭圆傅里叶描述子归一化不同方法的比较。(a) 六个基准测试数据;(b–e) 乌龟轮廓(P1)的测试结果表明,团队提出的方法在基本轮廓变换下均能获得一致的归一化的结果。
在此基础上,引入了最小欧式距离测度方法,使用完全归一化描述子重构图形并实现不同形状之间的自动对齐,在数学上保证了结果的唯一性和可比性。团队选取了来自86个物种的1338枚植物叶片外围轮廓图形,开展最小距离方法的计算并构建了形态聚类树,发现叶片聚类模式与叶片椭圆度和叶裂程度的变化密切相关(图3),这一不同于系统发育关系的模式可支撑叶片的趋同进化与适应性进化研究。

图3:基于1338枚叶片椭圆傅里叶描述子归一化后重构的轮廓开展最小欧氏距离的计算并使用邻接法聚类,构建了86个植物物种叶片的形态聚类树。该聚类树包含三个主要分支:分支I主要由条形和长圆形叶型组成,分支II则是圆形和心形叶型,分支III进一步分为两个亚支—掌状浅裂-掌状深裂叶亚支与羽状浅裂-羽状深裂叶亚支。
基于上述研究成果,团队开发了便于用户使用的开源工具包ElliShape,并已适配多种应用场景:命令行版本支持自定义参数的批量处理,图形用户界面版本集成了分割模型可实现器官的自动分割,Web版本则提供免安装的便捷访问方式。
该研究构建的定量形态学分析框架提供了一个客观的度量标准来评估形状之间的差异。具体而言,该框架将形态特征系统地编码为可追溯的特征矩阵,从而支持与分子数据集和环境参数的整合,对深入理解生物体与环境相互作用的演化发展具有重要意义。几何形态测量学与机器学习的结合将在整合分类学、生物多样性保护、物种分类和生态系统功能评估中发挥关键作用,推动形态大数据驱动的跨尺度生物学研究。
相关成果于6月5日在线发表于国际学术期刊Methods in Ecology and Evolution。中心执行主任吴慧、工程师杨嘉洁以及植物研究所吴平博士为第一作者,中心主任汪小全研究员和中国科学院声学研究所彭任华研究员为通讯作者,冉进华研究员、齐鲁师范学院李超群副教授参与了相关研究工作。该研究得到中国科学院战略性先导、中国科学院网络安全和信息化专项等项目的资助。
论文链接:
http://doi.org/10.1111/2041-210x.70330
数据集和开源工具下载链接:
https://www.plantplus.cn/doi/10.12282/plantdata.1667
在线工具访问链接:
https://www.plantplus.cn/ElliShape/