过度拟合

目录

  1. 1 什么是过度拟合
  2. 2 统计推断
  1. 回归
  2. 机器学习
  1. 后果
  2. 补救措施

    什么是过度拟合

    在统计中,过度拟合是“过于紧密或精确地对应于特定数据集的分析结果,因此可能无法拟合其他数据或可靠地预测未来的观察结果”。一种过度拟合模型是一个统计模型包含多个参数比可以由数据是合理的。过度拟合的本质是在不知不觉中提取了一些残余变化(即噪声),好像该变化代表了基础模型结构一样。

    换句话说,该模型记住了大量示例,而不是学习注意特征。

    当统计模型无法充分捕获数据的基础结构时,就会发生欠拟合。一个欠拟合模型就是将出现在正确指定的模型某些参数或术语缺少的典范。例如,当将线性模型拟合到非线性数据时,会发生拟合不足。这样的模型往往具有较差的预测性能。

    特别是在机器学习中,过度拟合和欠拟合可能会发生。在机器学习中,这种现象有时称为“过度训练”和“训练不足”。

    存在过度拟合的可能性,因为用于选择模型的标准与用于判断模型的适用性的标准不同。例如,可以通过最大化模型在某些训练数据集上的性能来选择模型,但是其适用性可能取决于它在看不见的数据上表现良好的能力;然后,当模型开始“记忆”训练数据而不是“学习”从趋势进行概括时,就会发生过度拟合。

    过度拟合

    作为一个极端的例子,如果参数的数量等于或大于观察值的数量,则模型可以简单地通过完整地记住数据来完美地预测训练数据。但是,这样的模型在进行预测时通常会严重失效。

    过度拟合的可能性不仅取决于参数和数据的数量,还取决于模型结构与数据形状的一致性,以及与预期的噪声或数据误差水平相比模型误差的大小。即使拟合模型没有过多的参数,也可以预期,拟合关系在新数据集上的表现将比在拟合数据集上的表现差(有时会出现这种现象称为收缩)。特别地,确定系数的值将相对于原始数据缩小。

    为了减少过度拟合的机会或过度拟合的数量,可以使用几种技术(例如,模型比较、交叉验证、正则化、提早停止、修剪、贝叶斯先验或辍学)。

    一些技术的基础是(1)显式惩罚过于复杂的模型,或者(2)通过在未用于训练的一组数据上评估其性能来测试模型的概括能力,假定该数据近似于典型的看不见的数据模型会遇到的问题。

    统计推断

    在统计中,统计模型中得出推论,该模型通过某种过程选择伯纳姆&安德森(Burnham&Anderson)在其关于模型选择的引文中认为,为避免过度拟合,我们应坚持“简约原则”。作者还声明以下内容。

    过度拟合的模型…通常在参数估计器中没有偏差,但是估计(和实际)的采样方差不必要地很大(相对于使用更简化的模型可以实现的估计量、估计器的精度很差)。往往会发现错误的处理效果,并且过拟合模型中包含错误的变量。…通过适当地平衡欠拟合和过拟合的误差,可以获得最佳的近似模型。

    当几乎没有可用的理论来指导分析时,过度拟合可能会成为一个严重的问题,部分原因是因为那时倾向于从大量模型中进行选择。《模型选择和模型平均》(2008)一书就是这样写的。

    有了一个数据集,您只需按一下按钮就可以适应数千个模型,但是如何选择最佳模型呢?对于这么多候选模型,过度拟合是一个真正的危险。打哈姆雷特的猴子真的是个好作家吗?

    回归

    在回归分析中,过度拟合经常发生。作为一个极端的例子,如果有p的变量中一个线性回归用p个数据点,所述拟合线可以去精确地通过每一个点。对于logistic回归或Cox比例风险模型,有多种经验法则(例如5–9 、10和10–15—每个独立变量10次观察的准则是被称为“十分之一的规则”)。在选择回归模型的过程中,可以将随机回归函数的均方误差分解为随机噪声,近似偏差和回归函数估计中的方差。偏差-方差折衷通常用于克服过拟合模型。

    使用大量实际上与预测的因变量无关的解释变量,通常会错误地发现某些变量具有统计意义,因此研究人员可能会将其保留在模型中,从而使模型过拟合。这就是所谓的弗里德曼悖论。

    机器学习

    通常,使用一组“训练数据”来训练学习算法:已知输出的示例性情况。目的是当算法在训练期间未遇到的“验证数据”被馈入时,该算法在预测输出时也将表现良好。

    过度拟合是指使用违反Occam剃刀的模型或程序,例如,通过包含比最终最优的参数更多的可调整参数,或通过使用比最终最优的更为复杂的方法。对于可调参数太多的示例,请考虑一个数据集,其中可以通过两个独立变量的线性函数充分预测y的训练数据。这样的函数仅需要三个参数(截距和两个斜率)。用一个新的,更复杂的二次函数或一个新的,更复杂的线性函数替换两个以上的自变量来替换此简单函数会带来风险:Occam的剃刀意味着任何给定的复杂函数都是先验的比任何给定的简单函数都不太可能。如果选择新的,更复杂的功能而不是简单的功能,并且如果训练数据拟合中没有足够大的增益来抵消复杂性的增加,则新的复杂函数将“过度拟合”数据,而复杂的则过度拟合函数对训练数据集外部的验证数据的性能可能会比简单函数差,即使复杂的功能在训练数据集上也表现得更好甚至更好。

    在比较不同类型的模型时,不能仅通过计算每个模型中存在多少参数来衡量复杂性。还必须考虑每个参数的表达能力。例如,将具有m个参数的神经网络(可以跟踪曲线关系)直接与具有n个参数的回归模型进行比较是很重要的。

    在学习时间过长或训练实例很少的情况下,过度拟合尤其可能导致学习者适应训练数据的非常具体的随机特征,而这些随机特征与目标功能没有因果关系。在过度拟合的过程中,训练示例的性能仍然会提高,而看不见数据的性能会变得更差。

    作为一个简单的示例,请考虑零售购买的数据库,其中包括购买的商品,购买者以及购买日期和时间。通过使用购买日期和时间来预测其他属性,可以很容易地构建一个完全适合训练集的模型,但是该模型根本不会推广到新数据,因为过去的时间将不再发生。

    通常,如果一种学习算法在拟合已知数据时更准确(事后知会),而在预测新数据时则不那么准确(事后预测),则相对于一种更简单的学习算法来说过拟合。一个人可以从以下事实中直观地了解过度拟合的事实:过去的所有经验信息可以分为两类:与未来相关的信息和不相关的信息(“噪声”)。在其他所有条件都相同的情况下,准则越难以预测(即不确定性越高),过去的信息中存在的噪声越多,需要忽略。问题在于确定要忽略的部分。可以减少拟合噪声的机会的学习算法称为“健壮”。

    后果

    过度拟合的最明显结果是验证数据集的性能不佳。其他负面后果包括:

    • 与最佳函数相比,过度拟合的函数可能会请求有关验证数据集中每个项目的更多信息;收集这些额外的不需要的数据可能是昂贵的或容易出错的,特别是如果必须通过人工观察和手动数据输入来收集每条单独的信息的话。
    • 比起简单的功能,更复杂,过度拟合的功能可能不太容易移植。在一个极端情况下,单变量线性回归非常方便,以至于必要时甚至可以手动完成。在另一个极端是只能通过完全复制原始建模者的整个设置才能复制模型,从而使重用或科学复制变得困难。

    补救措施

    最佳功能通常需要在更大或全新的数据集上进行验证。但是,有一些方法,例如最小生成树或相关性的生存时间,它们会应用相关系数和时间序列(窗口宽度)之间的相关性。只要窗口宽度足够大,相关系数就会稳定,不再依赖于窗口宽度大小。因此,可以通过计算研究变量之间的相关系数来创建相关矩阵。该矩阵可以在拓扑上表示为复杂的网络,其中可以直观显示变量之间的直接和间接影响。


    过度拟合

    相关推荐

    量子金融

    目录 1 什么是量子金融 2 工具定价的背景 3 量子金融背景 ▪ 量子连续模型 ▪ 量子二项式模型 4 衍生品定价的量子算法什么是量子金融量子金融是一个跨学科的研究领域,运用量子物理学家和经济学家开发的理论和方法来解决金融问题。它是经济物理学的一个分支。 工具定价的背景财务理论主要基于股票期权定价等金融工具定价。金融界面临的许多问题没有已知的分析解决... (继续浏览)

    聚类错觉

    目录 1 聚类错觉 2 聚类错觉的例子 3 类似的偏见 4 可能的原因聚类错觉聚类错觉是错误地考虑不可避免的“条纹”或“簇”,从随机分布小样品中所产生的是非随机的倾向。这种错觉是由于人类倾向于低估少量随机或半随机数据样本中可能出现的变异量而引起的。 聚类错觉的例子该主题的早期作者托马斯·吉洛维奇(Thomas Gilovich)认为,这种影响发生在不同... (继续浏览)

    Vortex指标

    目录 1 Vortex指标 2 灵感 3 描述 4 识别趋势 5 Vortex指标的计算 6 实际应用 7 编码和策略 8 比较研究Vortex指标Vortex指标是Etienne Botes和Douglas Siepman发明的技术指标,用于识别金融市场中新趋势的开始或现有趋势的延续。它发表在2010年1月的《股票和商品技术分析》中。 灵感Vorte... (继续浏览)

    市场时机

    目录 1 什么是股票市场时机 2 关于市场时机可行性的观点分歧 3 市场定时软件和算法 4 移动平均线什么是股票市场时机市场时机是通过尝试预测未来市场价格变动来做出金融资产(通常是股票)的买卖决策的策略。该预测可以基于技术或基本分析得出的市场或经济状况的展望。这是一种基于总体市场前景而不是特定金融资产前景的投资策略。 在有效市场假说是一个假设,即资产价... (继续浏览)

    股票技术分析

    目录 1 股票技术分析 ▪ 概述 2 股票技术分析的特性 3 股票技术分析的原理 ▪ 市场行为使一切都打折 ▪ 价格在趋势中移动 ▪ 历史趋向于重演 4 股票技术分析的行业 5 与其他市场预测方法结合股票技术分析股票技术分析是一种通过研究过去的市场数据(主要是价格和数量)来预测价格走势的分析方法。行为经济学和定量分析使用了许多相同的股票技术分析工具,作为主动... (继续浏览)

    色彩套件

    目录 1 色彩套件 2 技术和规格色彩套件色彩套件,是控制室用于颜色分级 视频在后期制作环境中。 技术和规格视频源可以来自:电视电影、磁带录像机(VTR)、电影胶片扫描仪、虚拟电视电影或直接磁盘记录(DDR)或称为电影链的旧系统。高端广播色彩套件可以使用Da Vinci Systems或Pandora International色彩校正器。如果VTR是... (继续浏览)

    后期制作

    目录 1 后期制作 2 后期制作的流程 3 电视 4 摄影 5 音乐后期制作后期制作是电影制作、视频制作和摄影过程的一部分。后期制作包括拍摄或录制单个节目片段之后发生的所有制作阶段。 传统的(模拟)后期制作已被在非线性编辑系统(NLE)上运行的视频编辑软件所取代。后期制作的流程后期制作由许多不同的过程组成,这些过程归为一个名称。这些通常包括:在电影上拍... (继续浏览)

    电影制作

    目录 1 电影制作 2 电影生产阶段 3 独立电影制作电影制作电影制作,是指制作电影的过程,通常是指打算用于大型戏剧展览的电影。电影制作涉及许多复杂而分散的阶段,包括通过编剧、演员阵容、拍摄、录音、预制作、剪辑以及在最终观众面前放映成品之前对故事,创意或委托的初步构想和一个展览。电影摄制在世界各地的许多地方,涉及经济、社会和政治背景,并使用各种技术和电影技术... (继续浏览)

    亚太电影奖

    目录 1 亚太电影奖 2 活动历史 3 电影类别和奖项 4 其他奖项亚太电影奖亚太电影奖(APSA)是一个国际文化倡议澳大利亚布里斯班市议会,以表彰和推广的电影、演员、导演,以及亚太地区的文化向全球观众和实现的目标教科文组织通过有影响力的电影媒介来促进和保存各自的文化。 活动历史亚太电影奖于2007年首次上演,与教科文组织和国际电影制片人协会联合会FI... (继续浏览)

    宝莱坞

    目录 1 宝莱坞 2 对宝莱坞的影响 3 宝莱坞的影响 ▪ 印度市场 ▪ 海外市场 4 演员和工作人员宝莱坞宝莱坞,前身是孟买电影院,是总部位于孟买的印度印地语电影业(以前是孟买)。该术语是“孟买”和“好莱坞”的Portmanteau。该行业与南印度电影院和其他印度电影产业有关,构成了印度电影院-按制作的故事片数量而言是全球xxx的。2017年,印度电影院生... (继续浏览)

    午餐盒

    目录 1 午餐盒电影 2 《午餐盒》电影情节 3 《午餐盒》票房午餐盒电影《午餐盒》是2013年印度书信浪漫电影,由里特什·巴特拉( Ritesh Batra)执导和导演,由Guneet Monga、 Anurag Kashyap和Arun Rangachari制作。这部电影由DAR电影院、 UTV电影院、 Dharma Productions、 Sikhy... (继续浏览)

    储藏加热器

    目录 1 储藏加热器 2 工作原理 3 储藏加热器的类型 ▪ 高保温储藏加热器 4 储藏加热器的应用 5 与其他供暖系统的比较 ▪ 储藏加热器的优势 ▪ 储藏加热器的缺点储藏加热器储藏加热器是一种电加热器,其存储的热能在晚上或夜间电力时可在较低成本,并根据需要在白天释放的热量。 工作原理存储加热器通常由粘土 砖或其它陶瓷材料、混凝土墙或水的容器。也有特... (继续浏览)

    无火机车

    目录 1 无火机车 2 动力类型 ▪ 蒸汽 ▪ 压缩空气 ▪ 混合动力 3 车轮布置 4 当前使用 ▪ 德国 ▪ 印度尼西亚无火机车无火机车,是一种类型的机车,其用途往复式发动机从的储供电压缩空气或蒸汽,其被填充在间隔从外部源。与传统的蒸汽机车相比,它们具有以下优势:单位成本更低、清洁度更高,并减少了火灾或锅炉爆炸的危险;由于需要补充机车的来源以及油箱提供的... (继续浏览)

    热能储存

    目录 1 热能储存 2 太阳能储存 3 冰基技术 4 低温储能 5 热硅技术热能储存热能储存(TES)可通过多种不同的技术来实现。根据特定的技术,它允许数小时、数天、数月后存储和使用多余的热能,其规模范围可从单个过程、建筑物、多用户建筑物、地区、城镇或地区开始。用法示例是白天和晚上之间的能量需求平衡,将夏季热量存储为冬季取暖,或将冬季寒冷的温度用作夏季空调(... (继续浏览)

    地热供暖

    目录 1 地热供暖 2 地源热泵 3 地热钻探风险地热供暖地热供暖,是将地热能直接用于某些加热应用。自旧石器时代以来,人类一直以这种方式利用地热。2004年,大约有70个国家直接利用了总计270 PJ的地热供暖。截至2007年,全球安装了28 GW的地热供暖能力,满足了全球一次能源消耗的0.07%。因为不需要能量转换,所以热效率很高,但是由于冬天最需要热量,... (继续浏览)

    区域制冷

    目录 1 区域制冷 2 区域制冷的应用 ▪ 芬兰 ▪ 瑞典 ▪ 瑞士 ▪ 加拿大 ▪ 阿拉伯联合酋长国 ▪ 德国区域制冷区域制冷工作原理与区域供热大致相似,因此可以将冷冻水输送到需要制冷的办公室和工厂等建筑物。在冬天,冷却的来源通常是海水,因此与使用电力运行压缩机进行冷却相比,它是一种更便宜的资源。可替代地,可以通过热共享网络提供区域冷却,该热共享网络使电路... (继续浏览)

    区域供热

    目录 1 什么是区域供热 2 供热热源 ▪ 热电联产或简单燃烧产生的区域热量 ▪ 太阳能集中供热 ▪ 区域供热热泵什么是区域供热区域供热,是一种通过隔热管系统分配在集中位置产生的热的系统,用于住宅和商业供热需求,如空间供热和水供热。这些热量通常来自燃烧化石燃料或生物质的热电厂,但也使用仅供热的锅炉站、地热供暖、热泵和中央太阳能供热,以及核能产生的热能发电。与... (继续浏览)

    圆锥角膜

    目录 1 圆锥角膜 2 体征和症状 3 遗传学 4 病理生理学 5 圆锥角膜的诊断 6 预后 ▪ 角膜积水圆锥角膜圆锥角膜(KC)是导致角膜逐渐变薄的眼睛疾病。这可导致视力模糊、复视、近视、不规则散光和光灵敏度导致差的质量的寿命。通常两只眼睛都受影响。在更严重的情况下,在角膜内可能会看到疤痕或圆形。 虽然原因未知,但据认为是由于遗传,环境和激素因素共同... (继续浏览)

    渐进镜片

    目录 1 渐进镜片 2 优势与用途 3 渐进镜片的缺点 4 其它渐进镜片渐进镜片,是矫正视力的镜片中使用的眼镜,以正确的老花眼和其他疾病的住宿。它们的特点是增加了镜片屈光度的梯度,增加了佩戴者对其他屈光不正的矫正。渐变从镜片顶部的配戴者的距离处方开始,并在镜片底部达到xxx加法度或完全读数加法。镜片表面渐进屈光力梯度的长度取决于镜片的设计,最终屈光度在0.7... (继续浏览)

    潜水头盔

    目录 1 潜水头盔 2 潜水头盔的类型 ▪ 标准潜水帽 ▪ 浅水头盔 ▪ 自由流动头盔 3 潜水头盔的安全 4 其他潜水头盔潜水头盔是一个刚性头部外壳和在水下潜水中使用的呼吸气体供应。它们主要由从事水面潜水的专业潜水员佩戴,尽管某些型号可以与潜水设备一起使用。头盔的上部俗称“帽子”或“帽子”,可以通过下部固定到潜水员或潜水服,该下部称为“颈围”、“胸甲”或“... (继续浏览)