基于SPSS因子分析和判别分析的祖母绿产地溯源

2024-01-25 12:44鲍珮瑾陈全莉黄惠臻
宝石和宝石学杂志 2023年6期
关键词:祖母绿判别函数碱金属

鲍珮瑾,陈全莉,3,黄惠臻

(1.中国地质大学(武汉)珠宝学院,湖北 武汉 430074; 2.湖北省珠宝工程技术研究中心,湖北 武汉 430074; 3.滇西应用技术大学珠宝学院,云南 腾冲 671000)

宝石学家对宝石产地溯源的研究由来已久,经典的宝石产地在消费者心中有着不可替代的地位,同时也影响着宝石的价格和市场需求。

祖母绿是绿柱石矿物中最为名贵的品种,享有“绿色宝石之王”的美称,它与钻石、红宝石、蓝宝石、金绿宝石并称为“五大宝石”。世界上的祖母绿产地众多,在五大洲均有发现,其中最主要的大区是南美洲和非洲[1]。目前市场上销售的祖母绿大多来自南美洲的哥伦比亚和巴西,非洲的赞比亚,亚洲的巴基斯坦、阿富汗等[2]。其中,哥伦比亚的木佐矿区是最著名的祖母绿矿区,一颗祖母绿若被定为哥伦比亚产区,其价格会高出其它产地祖母绿的30%~40%。

祖母绿属于绿柱石家族,由于致色元素Cr、V、Fe的类质同象替代作用,无色的绿柱石拥有了璀璨的绿色,并称为祖母绿。随着二价、三价离子的进入,一价离子及水分子会进入祖母绿的结构通道中以维持结构整体的电荷平衡[1]。不同产地的祖母绿矿床类型不同,其含有的元素种类和含量也不尽相同。致色元素及碱金属离子含量会直接影响祖母绿的基本宝石学性质和光谱学特征,而微量元素的种类和含量与祖母绿形成时的地质条件和环境息息相关,是连接祖母绿各项性质与产地的桥梁,也是产地判别方法中最有效最可靠的判别依据。这种微量元素大多反映在碱金属元素上,因此可以利用碱金属元素对不同产地的祖母绿进行鉴别。

祖母绿产地鉴别研究历史悠久,目前较为系统的是Sudarat Saeseaw等[2]在2019年提出的一种祖母绿溯源方法——结合紫外-可见光谱、包裹体及微量元素等特征鉴别不同成因祖母绿的产地。在此期间,许多专家学者[2-12]在研究某一产地祖母绿时,都会分析其微量元素上的区别,为祖母绿产地鉴别提供切实依据。

然而,使用单一的微量元素并不能鉴别出不同产地的祖母绿,若使鉴别结果准确可靠,三种以上微量元素种类相结合是必不可少,这就意味往往需要多个投点图综合判断,不仅过程繁琐且范围精确度较低。随着计算机和多元统计方法的发展,数理模型被应用在更广泛的学科上。为了找寻更便捷的区分祖母绿产地的方法,在本文,笔者,选取了前人文献[7]中的9个产地祖母绿的元素数据,利用SPSS对这些元素数据进行分析和建模。使用相关分析做多重共线性诊断,因子分析做相关性辅助,聚类分析和判别分析做产地归类,对来自中国云南麻栗坡、巴基斯坦斯瓦特山谷、马达加斯加马南贾里、阿富汗潘杰希尔山谷、巴西伊塔贝拉、埃塞俄比亚沙基索、赞比亚卡夫布、津巴布韦桑德瓦纳和俄罗斯乌拉尔的9个产地的祖母绿进行产地溯源。

1 数据来源及测试方法

本次分析所使用的元素数据一部分为笔者亲测,另一部分来自前人文献[13-14]。笔者共收集了来自巴基斯坦斯瓦特山谷的15颗祖母绿样品,共测试49个点位。测试仪器为激光剥蚀电感耦合等离子体质谱仪(LA-ICP-MS),由GeolasPro激光剥蚀系统和Agilent 7700 电感耦合等离子体测试系统组成。准分子激光器为COMPexPro 102 ArF 193 nm,光学系统为MicroLas。剥蚀过程中采用氦气做载气、氩气为补偿气以调节灵敏度,剥蚀系统配置有信号平滑装置。本次分析的激光束斑和频率分别为44 μm和5 Hz。不使用内标,采用BHVO-2G、BCR-2G和BIR-1G多种标准物质对元素浓度进行校准。利用Al做归一化元素,用NIST 610玻璃做时间漂移校正。

笔者还选择了9个产地(中国云南麻栗坡、巴基斯坦斯瓦特山谷、马达加斯加马南贾里、阿富汗潘杰希尔山谷、巴西伊塔贝拉、埃塞俄比亚沙基索、赞比亚卡夫布、津巴布韦桑德瓦纳和俄罗斯乌拉尔)的242组祖母绿样品相关数据进行分析。

祖母绿的化学式为Be3Al2(SiO3)6,不同产地祖母母样品的结构和主要化学成分的种类及含量差异较小,但具有不同的成矿环境和成矿流体,导致祖母绿中所含的元素种类和含量不相同,可以此作为产地分析模型的数据输入。祖母绿结构通道中的碱金属离子与其成矿流体及类质同象替代有关,考虑将碱金属离子Li、Na、K、Rb、Cs的含量作为模型输入数据的一部分。同时结合前人文献研究,在数据统计中加入Sc和Ga的含量[5]。部分数据如表1所示。

表1 不同产地祖母绿中碱金属含量数据表

2 相关性和共线性检验

为了达到降维的目的,减少因变量太多造成的信息重复性和模型复杂性,对所获得的7组元素数据进行因子分析,观察能否通过因子分析在数据信息丢失最少的情况下减少变量的个数,消除变量的相关性以便后续更好的开展判别和聚类分析,得出表2[15-16]。

表2 KMO 和巴特利特检验

从KMO和巴特利特检验表中可以看出,KMO值为0.393,小于0.6,表明变量间相关性低。线性回归分析预估数据的多重共线性,结果可与因子分析的结果相互印证。

表3可得,所有变量VIF值均小于5,表明此之间不存在严格的多重共线性,可作为判别模型的输入数据。

表3 系数a

3 判别分析

以Li、Na、K、Ga、Sc、Rb和Cs这7组数据作贝叶斯判别分析,结果如下所示。

表4显示所有变量均通过显著性水平为0.05的检验,表明所有变量对建立判别函数的贡献均显著,因此变量对模型的解释程度较高。

表4 平均值的同等检验

表5与6显示函数1到7均通过显著性水平α为0.05的显著性检验,因此4个典型判别函数对于探寻自变量元素与因变量产地之间关系的作用均显著。

表5 特征值

表7显示了自变量碱金属离子含量与因变量产地之间的关系函数,通过表5和表6可知,前两个判别函数的相关性相对较高,因此判别产地时使用前两个判别函数进行预判。把自变量的数据带入函数1和2,选择距离较近的因变量作为判别的结果。

表6 威尔克 Lambda

表7 典则判别函数系数

表8是根据给出的数据利用判别函数1和2计算出的每个产地组质心的函数值,图1为可视化函数图。由上图可看出,横坐标为典型判别函数1,纵坐标为典型判别函数2,利用此两种典型判别函数算出各个样品值的坐标。图1中9个方框表示每个产地样品的组质心,得出坐标之后根据坐标离中心的远近判断待判样品的产地归属。不同颜色的圆圈代表不同产地,相同颜色的圆圈有一定的聚类效果,但有些点位重叠,从总体上看,此图对产地有很好的区分度。

图1 典型判别函数图

表8 组质心处的函数

表9中判别结果:a.正确地对 95.9% 个原始已分组个案进行了分类;b.仅针对分析中的个案进行交叉验证。在交叉验证中,每个个案都由那些从该个案以外的所有个案派生的函数进行分类;c.正确地对 91.7% 个进行了交叉验证的已分组个案进行了分类。从判别分析结果来看,利用数理模型中的判别分析方法对不同产地祖母绿进行产地溯源的正确率达90%,因此利用此方法对不同产地宝石进行产地溯源是具有可行性的。

表9 预测组成员信息

4 结语

祖母绿作为绿色宝石之王在五大洲均有发现,目前市场上占据主流的产地有哥伦比亚、巴西、赞比亚、俄罗斯、津巴布韦、马达加斯加和巴基斯坦等地。其中排名前几的为哥伦比亚、巴西和赞比亚。Gaston Giuliani和Lee A.Groat经过研究按照地质环境分成两种类型,第一类为构造-岩浆有关,第二类与构造-变质作用有关,由于地质作用的不同,祖母绿中所含的元素种类和含量也不同,可以利用此进行产地判别分析。

利用SPSS对来自9个产地的242组祖母绿样品数据进行产地判别,从因子分析看出,KMO值小于0.6,表明作为变量的7组元素含量之间没有相关性,同时利用线性回归的多重共线性诊断发现变量无明显的多重共线性。因此得出以下结论:判别分析可达到91.2%的较高正确率,证明利用数理模型中的判别模型,以不同产地宝石中的元素作为变量进行产地溯源是具有很大潜力的。

但是仍然有一些问题:(1)样品数据不够大,此结果不能作一般性解释;(2)在祖母绿的众多产地中只选取了9个产地,若加入其它产地的数据,所得结果的正确率可能会降低;(3)只选取了七种元素,具有一定的信息限制。(4)有些产地的祖母绿有缺失值,使用此产地的平均值代替缺失值,具有一定误差。

猜你喜欢
祖母绿判别函数碱金属
Fisher判别法在个人信用风险评估中的应用
祖母绿的产地与选购
游乐设施事故与危险量化判别函数的构建
探究上市公司财务预警的数学模型
《碱金属》疑难问题解析
有关碱金属的计算举隅
德霖,祖母绿都腾飞的羽翼
SDS/DTAB/碱金属氯化盐复配囊泡为模板制备PMMA微球
祖母绿的充填技术
德霖,绘就中国祖母绿都的辉煌