主成分分析的应用研究文献综述

 2022-08-27 09:45:18

主成分分析与应用研究文献综述

摘要:主成分分析(Principal Component Analysis,PCA), 将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法。又称主分量分析。

在实际课题中,为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映这个课题的某些信息。

主成分分析作为基础的数学分析方法,其实际应用十分广泛,比如人口统计学、数量地理学、分子动力学模拟、数学建模、数理分析等学科中均有应用,是一种常用的多变量分析方法。

关键词:主成分分析; 变量; 应用;多变量分析方法

  1. 主成分分析的简介

主成分分析由卡尔bull;皮尔逊于1901年发明,用于分析数据及建立数理模型。其方法主要是通过对协方差矩阵进行特征分解,以得出数据的主成分(即特征向量)与它们的权值(即特征值)。PCA是最简单的以特征量分析多元统计分布的方法。其结果可以理解为对原数据中的方差做出解释:哪一个方向上的数据值对方差的影响最大?换而言之,PCA提供了一种降低数据维度的有效办法;如果分析者在原数据中除掉最小的特征值所对应的成分,那么所得的低维度数据必定是最优化的(也即,这样降低维度必定是失去讯息最少的方法)。主成分分析在分析复杂数据时尤为有用,比如人脸识别等。

  1. 主成分分析现阶段主要理论观点和技术

在经济领域,为全面分析问题,往往提出很多在不同程度上反映问题的指标,用多元统计分析多指标问题时,指标个数太多会增加问题的复杂性,希望指标个数少而得到的信息多。很多情形下,指标间是相关的,可解释为指标反映问题的信息有一定的重叠。主成分分析是对原提出所有指标,建立尽可能少的新指标,使得新指标两两不相关,且新指标在反映问题的信息方面尽可能保持原有信息,新的综合指标称为原来指标的主成分。随着市场竞争的加剧,药品生产和销售企业要想获得竞争优势就必须对产品下一阶段的销售数额有一定的了解,从而合理地指导生产、经营。药品销售预测的精度受到多种因素的影响,如国家宏观经济状况、医药管理政策、同类药品销售上的相互影响、新的治疗手段出现、新药上市等。数据挖掘中用于销售预测的方法较多,如时间序列分析、神经网络、决策树、关联规则挖掘、贝叶斯信任网络等。

在科学领域,随着计算机技术的发展,主成分分析在科学研究中就有广泛的应用,其对于多个指标中主要影响指标的确定,时空资料的降维分解,卫星雷达图像的降维提取信号等方面都具有重要价值和应用前景。高光谱遥感图像的高数据维给图像进一步处理带来了困难,田野等提出了主成分分析的降维方法能有效解决了该困难。K-L (Karhunen-Loeve)变换(主成份分析)是建立在统计特征基础上的多维(如多波段)正交线性变换,它是遥感图像处理中最常用也是最有用的变换算法之一。欧春江利用主成份变换对遥感图像进行数据压缩、图像增强、分类前预处理,发现在遥感影像分类前进行主成份变换,效果往往很好。文汉江等由主成分分析法分别对ERS22和TOPEX/POSEIDON卫星测高数据进行了分析,来研究厄尔尼诺事件与海面高的异常之间的关系。

主成分分析不仅是一种主要的处理遥感图像得到数据的重要手段,在遥感数据和其他实测数据基础上还可以成为一种统计诊断方法来研究实际问题。王海林采用主成分分析方法对共和盆地弃耕地盐渍化状况进行了研究,得到了土壤中盐离子的分布状况和主要的盐分类型、盐碱化形成机理,为进一步合理的治理提供理论依据。魏占雄同样采用主成分分析方法对弃耕地盐渍化状况进行了研究,得到了土壤含盐量及盐离子分布规律情况和该弃耕地盐渍环境的特征因子。刘小菊等选择不同栽植代数的思茅松林,采用主成分分析法来选择土壤养分状态因子来比较土壤养分,结果表明思茅松连栽后土壤肥力出现衰退现象并且随着栽植代数增加土壤肥力下降增快。曹利霞等基于主成分分析的方法分析老年男性肺总量参考值与地理指标的关系,并把这些地理指标利用主成分分析的方法推导出一个线性回归方程。为利用地理指标来制定中国健康老年男性肺总量参考值的标准提供科学依据。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。