离散程度

在统计学里,离散程度(英語:statistical dispersion,scatter,spread)或离散度,又稱统计变异性(statistical variability)[1],简称 變異變差(variation)、变率,是指一个分布随机变量的拉伸或压缩程度[2]习惯上,“离散”常用来描述数据分布[3],而“變異”(指:變異數、方差)更常用来描述随机变量的变异程度[4][需要解释]用以描述离散程度或變異的量主要有方差標準差變異系数四分位距等。

离散程度与集中趋势相对,因此,离散度就是指各个变量值与集中趋势的偏离程度。

衡量编辑

衡量离散程度的值,通常是非负实数:当衡量值取零时,表示分布集中在同一个值上;随着衡量值的增加,随机变量的取值越来越分散。

部分描述离散程度的量是带单位的,并且,这些量的单位与随机变量本身的单位相同。也就是说,如果随机变量的单位是米或秒,则这些量的单位也是米或秒。这些量举例如下:

此外,也有一些无量纲量

另外,还有一些带单位的量,但是他们的单位和随机变量本身的单位不同:

可解释性编辑

变差的可解释性,通常是对于一个随机变量而言的。当观测到随机变量的一些取值(例如训练集中的标签可视作是一个随机变量的一些观测值),需要推断随机变量服从的分布时,就会遇到这个问题。一般而言,推断有限观测值的随机变量服从的分布的过程,即是建立模型的过程。

假设有随机变量 及其服从的真实分布 。则对于该随机变量的观测值,可计算其变差(以方差表示) ;对于分布,亦可计算其变差 。则 是相对该随机变量的可解释變異(英语:explainable variation),其余的部分则是不可解释變異(英语:unexplainable variation)。为了衡量不可解释變異,可引入不可解释變異分数(英语:fraction of unexplainable variation) 。不可解释變異亦称为统计噪声

假设 是模型给出的随机变量的分布。则对于该预测分布,我们可以计算器變異(以方差表示) 。则 是该模型相对该随机变量的已解释變異(英语:explained variation),其余部分则是未解释變異(英语:unexplained variation)。同样,为了衡量未解释變異,可引入未解释變異分数(英语:fraction of unexplained variation)

参考资料编辑

  1. ^ 贺睿杰. 统计活动视角下的高中生统计学习研究[D]. 华东师范大学, 2020.
  2. ^ NIST/SEMATECH e-Handbook of Statistical Methods. 1.3.6.4. Location and Scale Parameters. www.itl.nist.gov. U.S. Department of Commerce. [2022-11-14]. (原始内容存档于2022-11-14). 
  3. ^ 米小琴. 统计计算与分析. 清华大学出版社有限公司. 2004: 68–75. ISBN 9787302064343. 
  4. ^ 安德森. 王峰 , 编. 商务与经济统计. 中信出版社. 2003: 202. ISBN 9787800738753. 
🔥 Top keywords: Baike: 首页Special:搜索美国护照胖猫跳江事件背着善宰跑九龍城寨之圍城塞尔维亚淚之女王逆天奇案2璩静Energy (組合)习近平匈牙利邊佑錫洪若潭命案神耆小子金智媛新生 (网络剧)劉俊謙 (香港)金秀賢 (男演員)支配物种六四事件九龍寨城庆余年郭葦昀徐巧芯Seventeen (組合)猩球崛起:王國誕生陳政忠家族榮耀之繼承者TripleS願榮光歸香港不夠善良的我們李志金惠奫母亲节彭丽媛何塞盧张维为馴鹿寶貝春色寄情人习明泽稻草人論證中华人民共和国中華民國PSG Talon排球少年!!角色列表福建號航空母艦欧洲冠军联赛BOYNEXTDOOR破墓我獨自升級排球少年!!笑看風雲張書偉黃道十二宮怪獸8號香港歌手2024篠崎泫劉偉健與鳳行2024年英雄联盟季中邀请赛BABYMONSTER謝坤達ILLIT葉乃文五月天蕭景鴻虽然不是英雄WIND BREAKER—防風少年—我的婆婆怎麼那麼可愛為美好的世界獻上祝福!日本杰伦·布伦森張員瑛打天下2赵露思猿人爭霸戰:猩凶革命草榴社区IVE (組合)張文傑南斯拉夫葬送的芙莉蓮迷宮飯唐振剛Baike: 分類索引伍允龍芳明館逆天奇案承欢记李到晛毛泽东文化大革命林峯亞歷山大·武契奇耶穌升天節羅毓儀搜查班長1958