基于傅里叶变换红外光谱和化学计量学鉴别精斑种属的方法

文档序号:969500 发布日期:2020-11-03 浏览:1次 >En<

阅读说明:本技术 基于傅里叶变换红外光谱和化学计量学鉴别精斑种属的方法 (Method for identifying fine spot species based on Fourier transform infrared spectroscopy and chemometrics ) 是由 王振原 魏昕 于凯 王功绩 吴迪 刘睿娜 于 2020-06-19 设计创作,主要内容包括:本发明公开了一种基于傅里叶变换红外光谱和化学计量学鉴别精斑种属的方法:收集来自人类和狗、兔、猪、牛、羊五种常见动物的精液样本,将精液样本按照不同载体、形成时间,制备训练集、验证集共计420份精斑样本并进行傅里叶红外光谱检测,利用主成分分析方法对检测的光谱数据结果进行聚类分析,最终使用偏最小二乘法判别分析进行模型的训练和验证。与传统的精斑种属鉴别方法相比,本发明对精斑检材无破坏性,操作简单,可以快速、准确的鉴别精斑的种属来源,有利于案件的快速定性。(The invention discloses a method for identifying fine spot species based on Fourier transform infrared spectroscopy and chemometrics, which comprises the following steps: the method comprises the steps of collecting semen samples from five common animals including human beings, dogs, rabbits, pigs, cattle and sheep, preparing 420 parts of semen samples in total of a training set and a verification set according to different carriers and forming time, carrying out Fourier infrared spectrum detection, carrying out cluster analysis on detected spectrum data results by using a principal component analysis method, and finally carrying out model training and verification by using partial least square discriminant analysis. Compared with the traditional identification method of the species of the fine spots, the method has no damage to the material to be detected of the fine spots, is simple to operate, can quickly and accurately identify the species source of the fine spots, and is favorable for quick qualification of cases.)

基于傅里叶变换红外光谱和化学计量学鉴别精斑种属的方法

技术领域

本发明属于精斑快速、无损检测技术领域,涉及对检案过程收集的物证中的精斑成分定性识别。

背景技术

***是一种生殖体液,***在受到性刺激的情况下射出后,一般会浸润或附着于其他载体上并经干燥形成斑痕。在性犯罪案件或其他涉及有性行为的案件中,该斑痕若持续留存于载体上并于现场或实验室中提取出来,就可以获得最重要、最可靠的标志物之一精斑。精斑不仅可以确证性行为的发生,还可以用于犯罪嫌疑人的认定。在受害者有精神智力障碍、没有目击证人、或受害者已经死亡等性犯罪案件中,***遗留形成的精斑在法医检验和案件侦破等方面的价值尤为重要。

许多成熟的精斑检测方法已经被广泛的应用于实际案件中,为案件的侦查提供线索。但据文献报道,对***酸性磷酸酶(SAP)的推定检测有可能出现假阳性结果。同样的,***特异抗原(PSA)的检测对***没有特异性,可以在许多非***组织和体液中发现(在乳腺癌、肺癌、结肠癌等患者的血清中也可检测出PSA呈阳性的结果)。而大多数用于犯罪现场的商用免疫层析分析测试(例如,RSIDTM和

Figure BDA0002548672090000011

),尽管速度快,但对样本具有破坏性。特别是当精斑样本量非常有限时,其破坏性将影响后续的DNA分析。此外,上述精斑检测分析均无物种特异性,这意味着SAP或PSA均可在其他物种的***中检测到。因此,目前需要一种可重复、精确度高和非破坏性的技术手段来检测精斑证据并区分其种属。

傅里叶变换红外光谱(FTIR)是一种应用广泛的光谱技术。FTIR光谱研究的是中红外区域(约4000-400cm-1)电磁波的吸收谱,该区域的吸收带主要来源于分子振动的基本跃迁,吸收模式具有较强的特征,即不同的化学官能团在被红外光照射后发生能量跃迁的程度不同,从而显现出不同吸收光谱。作为一种免标记和非破坏性的光谱检测技术,FTIR光谱可以显现出对应样品中特定化学官能团的特征峰。相比于相位对比显微镜和共聚焦荧光等其他光谱技术,FTIR光谱利用低能量的光波,使得样品不存在光漂白和电离损伤等问题,特别适用于生物医学领域各种样本的分析,同时样本的光谱特异性以及检测的便捷性,也促进了FTIR在分析化学领域广泛应用。

化学计量学(Chemometrics)又称化学统计学,由瑞典学者Wold在1971年提出,是一门通过统计学或数学方法将建立化学体系的测量值与体系的状态之间联系的学科。近年来,随着分析化学的发展,各种现代化测量仪器层出不穷,获得了大量关于物质化学组成的数据,应用化学计量学的方法可以从中挖掘出有价值的信息。

在法医刑事科学领域中,种属鉴别是法医学调查的一个重要环节,对于精斑而言,无论其形成于何种载体之上,都应进行种属鉴别。目前尚未见到将傅里叶变换红外光谱和化学计量学结合并应用在精斑种属鉴别方面的报道。

发明内容

针对目前难以同时实现快速、准确、无损地鉴别精斑种属的问题,本发明提供了一种基于傅里叶变换红外光谱和化学计量学鉴别精斑种属的方法。

为达到上述目的,本发明采用了以下技术方案:

1)从待鉴别种属的精斑中分离出***样本,采集该***样本的傅里叶变换红外光谱数据;

2)对步骤1)采集的傅里叶变换红外光谱数据,选取该红外光谱数据中的精斑指纹区(1800-900cm-1)数据进行校准;

3)将经过校准的精斑指纹区数据(具体指指纹区内的各个波长点对应的吸收值)输入人类/非人类精斑种属鉴别模型,由该模型输出鉴别结果;其中,所述精斑种属鉴别模型是利用分离自若干个人类和动物精斑的***样本的相应傅里叶变换红外光谱数据(参照步骤1、2获取),并采用偏最小二乘法判别分析建立的。

优选的,所述***样本是通过将精斑从载体上转移到生理盐水中而分离得到的。

优选的,所述傅里叶变换红外光谱数据的采集方法包括以下步骤:对从精斑中分离得到的***样本进行多次傅里叶变换红外光谱分析,然后将多次分析的结果平均,得到对应精斑的傅里叶变换红外光谱数据。

优选的,所述精斑指纹区包括精斑在傅里叶变换红外光谱分析中出现的酰胺Ⅰ、酰胺Ⅱ等蛋白质吸收峰和糖类吸收峰。

优选的,所述校准包括以下步骤:对选取的红外光谱数据进行均值中心变换和标准正态变量变换。

优选的,所述精斑种属鉴别模型的建立中,***样本分离自多个形成时间不同的人类精斑和动物精斑;或者,***样本分离自两类精斑,其中一类是形成时间不同(载体相同)的人类精斑和动物精斑,另一类是载体不同(形成时间相同)的人类精斑和动物精斑。

优选的,所述人类精斑和动物精斑的形成时间为30天以内。

优选的,所述载体的种类根据实际检案情况确定(精斑一般形成于纸巾、内裤等纤维基质或载玻片等玻璃基质的载体上)。

优选的,所述动物选自狗、兔、猪、牛、羊等哺乳动物中的一种或多种。

本发明的有益效果体现在:

本发明利用分离自人类和动物(例如,狗、兔、猪、牛、羊)精斑的***样本,建立可用于推断精斑的种属来源的PLS-DA模型,本发明对精斑检材无破坏性,操作简单,可以快速、准确的鉴别精斑的种属(是否属于人类),有利于根据精斑证据对案件快速定性。

进一步的,本发明对提取自案发现场的精斑样本不需进行任何化学手段的预处理,只需将精斑与生理盐水混合从而分离出***样本,对该***样本可直接测定其傅里叶变换红外光谱,从而避免微量物证的破坏。

进一步的,本发明利用形成时间在30天以内的精斑样本建立种属鉴别模型,其鉴别结果的准确性不受载体(载玻片、纸巾、内裤等)不同的影响,鉴别种属来源的判别能力显著提高;

进一步的,本发明通过增加不同载体精斑作为训练样本,提高了所建立的种属鉴别模型的可靠性,从而使得对于形成时间(例如,30天以上)超过训练样本中精斑形成时间的精斑检材也能够准确的进行种属来源推断。

进一步的,本发明选取的指纹区,可以更有效的利用精斑红外光谱数据的信息(剔除了无效数据),缩短了数据分析时间;同时,保留了与分类模型的推断准确性密切相关的红外光谱数据。

进一步的,本发明针对分离自同一精斑的***样本,利用多次采集的该***样本的多个(平行)傅里叶变换红外光谱数据计算平均光谱,增强了红外光谱采样数据的代表性。

附图说明

图1是本发明实施例中所使用的人类和5种动物各自种属的平均光谱;其中Dog:狗;Goat:羊;Human:人;Bull:牛;Pig:猪;Rabbit:兔。

图2是本发明实施例中不同载体上的精斑样本红外光谱数据的主成分分析聚类结果得分图;其中(a)为以载体为标签显示结果,panties:内裤;microscope slides:载玻片;tissues:纸巾,(b)以种属为标签显示结果。

图3是本发明实施例中不同形成时间的精斑样本红外光谱数据的主成分分析聚类结果得分图;其中不同颜色代表不同种属,不同形状代表不同形成时间。

图4是本发明实施例中构建精斑种属的偏最小二乘法判别分析模型的示意图;其中(a)为训练集构建的模型,(b)为验证集的预测结果;DiscrimY3表示人类与动物的精斑种属推断分界线。

具体实施方式

下面结合附图和实施例对本发明作进一步详细说明。所述实施例仅用于解释本发明,而非对本发明保护范围的限制。

本发明收集来自人类和狗、兔、猪、牛、羊五种常见动物的***样本,将***样本按照不同载体、形成时间,制备精斑样本并进行傅里叶变换红外光谱检测,对检测的光谱数据结果进行聚类分析。聚类分析中,应用主成分分析(PCA)方法将光谱数据结果进行降维处理后观察聚类趋势,根据不同载体和形成时间对精斑种属鉴别的影响,发现精斑的载体不同并不影响精斑种属的聚类趋势,同时发现精斑的不同形成时间(30天内)不影响精斑种属的聚类趋势。根据以上科学发现以及实际建模,本发明提出了一种结合傅里叶变换红外光谱和化学计量学分析鉴别精斑种属来源的方法,使用偏最小二乘法判别分析进行模型的训练和验证,模型的准确度和精确度都达到了100%。

一、精斑样本的制备

收集10名健康成年男性的***样本,以及5种动物(狗,兔,猪,牛,羊)的***样本,人及每种动物各10只。共计获得60份***样本(每份样本70μL)。

考虑到实际案件中,精斑多附着于衣物、纸巾等载体上,且从案发到提取样本的时间不确定,故在本发明中设置了载体(载玻片、纸巾、织物成分为5%氨纶及95%再生纤维素纤维的内裤)和形成时间(10min、8天、16天、21天和30天)这两个参数。每个精斑样本由10μL***样本制备而成。制备过程包括:将***滴加到载体上,然后放置于室内(温度10℃~30℃、湿度25%~75%),尽可能模拟精斑形成的真实环境(一般放置数分钟后即自然干涸)。

二、精斑样本中***成分的提取分离

待***样本放置(条件同上述室内的温度和湿度)达到预设的精斑形成时间(10min、8天、16天、21天和30天)后,用等量(10μL)生理盐水滴加于精斑上,待生理盐水充分和精斑混合之后分情况处理:对载玻片上的***生理盐水混合液(作为***分离样本),直接用移液枪吸取到EP管中,待测;对形成于纸巾和内裤上的精斑,沿精斑边缘剪下载体对应部分,放入无滤过膜的离心柱中,离心(5000转、1分钟)后获得洗脱下来的***分离样本,待测。

三、傅里叶变换红外光谱的采集

使用Thermo公司的Nicolet FTIR-5700型傅里叶红外光谱仪对***分离样本进行光谱学测量,步骤如下:

1、每次采集样本前先采集一张背景谱图(空气),每次采集背景谱图前将衰减全反射(ATR)探头用无水乙醇擦洗干净。

2、打开Thermo公司OMNIC软件,按设置扫描背景和样本,其中,波数范围:4000-900cm-1,扫描32次,分辨率4cm-1,光谱显示为吸光度模式。

3、每次取1μL样本全覆盖ATR探头,待其自然晾干后开始扫描。每个样本扫描3次(即同一样本分别取3个1μL),每次扫描平行采集3张光谱图,即每个样本得9张光谱图;后述数据处理前,使用这9张光谱图的平均光谱数据(每个波长点处取平均)作为对应精斑样本的傅里叶变换红外光谱。截取1800-900cm-1范围内的光谱数据,作为指纹区。

四、光谱数据预处理

用均值中心化(mean centering)的方法,即通过光谱均值中心变换对选取的指纹区图谱进行预处理,预处理中先计算出样本训练集的平均光谱,再用各样本的原始光谱(即三中得到的精斑样本的傅里叶变换红外光谱)减去样本训练集的平均光谱,得到均值中心化光谱数据。再用标准正态变量变换(standard normal variate transformation,SNV)对选取的指纹区(均值中心化光谱数据)进行预处理,得到标准正态光谱数据。

五、光谱数据聚类分析

将经过预处理的训练集样本的光谱数据导入MATLAB中,运用PLS Toolbox 8.6工具进行主成分分析,发现贡献最大区域位于糖类和蛋白质吸收峰,其中猪、牛和羊的精斑对应光谱结果显示,蛋白质(例如,酰胺Ⅰ、酰胺Ⅱ、甲基化蛋白)含量比人类低,但糖类(Carbohydrate)含量远高于人类。而狗和家兔的精斑对应光谱结果显示,其与人类的主要差异来自蛋白质不同(图1)。进一步对不同载体和形成时间的精斑样本的红外光谱数据结果进行主成分分析,发现载体种类和形成时间(30天内)不影响精斑的种属聚类趋势(图2、图3)。

六、建立训练模型并验证

最终利用上述60份***样本制备420份精斑样本,其中训练集336份精斑样本由其中人类和5种动物各自的8份***制备(参见表1),验证集84份精斑样本由剩余份数的***制备。将经过预处理的训练集样本的光谱数据(具体指指纹区内等间隔分布的各个波长点对应的吸收值)导入MATLAB中,从而使用训练集样本建立偏最小二乘法判别分析模型。

表1.训练集分组

建立模型中,每个分类模型都分别独立进行优化,优化主要受潜变量数(latentvariables,LVs)的影响,为最优化各分类模型,针对每个分类模型,利用20折交叉验证(20-fold cross-validations,CV)选取最佳潜变量数为5(LVs从1到20中选取),然后用偏最小二乘法判别分析(Partial least squares discrimination analysis,PLS-DA)建立最优精斑种属来源鉴别PLS-DA模型。

将验证集的数据导入上述PLS-DA模型进行精斑种属预测,将预测结果与实际样本种属进行比较,发现成功判断是否为人类精斑的准确率均为100%(图4),验证了上述PLS-DA模型具有稳健性和准确性。

总之,本发明所建立的结合傅里叶变换红外光谱和化学计量学分析鉴别精斑种属来源的PLS-DA模型,具有精斑样品需求量少、精斑样品预处理无损性、检测样品制备和数据处理简便,以及鉴别速度快、准确性高的优点。

11页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种提高太赫兹波无损检测分辨率的系统及方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!