
案例5-5:偏最小二乘模型预测区间构造及在分子描述符数据上的应用案例背景符号理论与算法模拟数据与真实数据分析案例小结目录CATALOGUE01案例背景案例背景偏最小二乘回归自主法构造预测区间偏最小二乘回归是第一种用于分析高维数据的统计学习方法,广泛应用于化学计量学、基因组学、神经信息学及计量经济学等科学领域。Denham利用自主法构造PLS模型的预测区间,但过拟合问题导致该方法无法保证真实响应变量的覆盖。Romera提出基于误差正态分布假设的方法。预测不确定性局部线性方法PLS回归算法通常产生预测变量的点估计,但点估计无法回答估计值与响应变量真实值之间的近似程度,因此需要发展可靠性评价或不确定定量方法。ZhangandFearn应用模拟数据研究局部线性的稳定性,Lin等将局部线性方法推广到多响应PLS模型,但代数线性近似方法需强分布假设。预测区间构造方法共形预测推断框架统计学家们发展了几种用于估计预测不确定性的方法,包括枢轴量法和预测分步法,但这些方法基于估计分布,而PLS回归算法的分布性质未完全研究清楚。Vovk等提出共形预测推断框架,通过共形得分函数构造预测区间,不依赖数据产生机制,提供有限样本覆盖保证,解决小样本问题。02符号符号303理论与算法朴素预测区间构造方法Jackknife和jackknife+方法CV+预测区间Thejackknife+-after-bootstrap方法leave-one-bag-out+(LOBO+)预测区间方法方法的性能评价04模拟数据与真实数据分析模拟研究模拟数据产生过程模拟结果查看其他模拟结果查看附录5-5中表格。表格中给出了不同方法在K=1,2,3,4,5,6下的预测区间覆盖率的估计结果。通过线性模型产生模拟数据,参数向量服从均匀分布。自变量维数、相关性和训练样本数影响方法性能,考虑三种因素不同取值的影响。模拟环境经验覆盖概率36种不同的模拟环境通过组合不同因素的值产生。在每种模拟环境下,我们使用相同的方法进行100次重复实验,以计算经验覆盖概率和平均长度。在计算经验覆盖概率时,我们使用了同分布的100个测试样本。这些样本用于评估预测区间的实际覆盖情况,从而得到经验覆盖概率。预测区间覆盖率估计预测区间平均长度在90%置信水平下,比较不同方法产生的预测区间覆盖率的估计结果。结果显示,所有方法在不同维度和样本数下都能保持较好的覆盖率。预测区间的平均长度被计算用于评估预测区间的长度特性。该长度特性是评价预测区间质量的重要指标之一。模拟研究不同方法产生的置信水平为90%的预测区间覆盖率的估计实际数据情况实际数据情况实际数据情况实际数据情况实际数据情况实际数据情况实际数据情况05案例小结案例小结虽然PLS模型被用于许多科学领域,但是大多数的工作主要集中在预测的点估计,关于预测区间的工作很少。由于预测输出的不确定性在评价一个模型预测性能时扮演者重要的角色,因此,本案例将无分布假设的预测推断方法引入到PLS回归中,希望这些方法能够用于对PLS模型的预测性能进行合理的评价。而且,基于leave-one-bag-out方法的一个改进,提出一种名为leave-one-bag-out+(LOBO+)的无分布假设的预测推断方法。通过对大量的模拟数据及3个真实分子描述符号数据的分析可知,与其他高性能方法相比,LOBO+具有更好的性能。THANKSnLVnaivejackknifejackknife+CV+J+aBLOBO+K=10.764?0.0590.894?0.0490.896?0.0510.918?0.0420.898?0.0420.904?0.045K=20.693?0.0730.900?0.0470.904?0.0430.931?0.0380.897?0.0490.910?0.045K=30.657?0.0830.897?0.0510.900?0.0480.942?0.0360.898?0.0490.914?0.045K=40.624?0.0910.893?0.0500.895?0.0510.946?0.0340.899?0.0490.913?0.047K=50.596?0.1150.888?0.0510.894?0.0490.949?0.0360.899?0.0490.913?0.048K=60.575?0.0570.891?0.0500.892?0.0520.955?0.0340.899?0.0500.917?0.045K=70.571?0.1160.890?0.0480.894?0.0510.958?0.0310.898?0.0510.920?0.044K=80.564?0.1160.884?0.0530.898?0.0520.961?0.0290.898?0.0500.923?0
免费下载链接
飞猫云链接地址:https://jmj.cc/s/7br35n
压缩包解压密码:res.99hah.com_mPg2NJATwi
下载方法:如果您不是飞猫云会员,请在下载页面滚动到最下方,点击“非会员下载”,网页跳转后再次滚动到最下方,点击“非会员下载”。
解压软件:Bandizip
- 打开飞猫云链接地址的页面,拖动到最下方,找到“非会员下载”的按钮并点击
- 此时,如果没登录,可能会提醒您注册帐号,随便注册一个帐号并登录
- 再在新打开的下载页面,再次拖动到最下方,找到“网页端 非会员下载”的按钮并点击。
版权声明:本文为转载文章,版权归原作者所有,转载请保留出处!