如何理解统计学中的“自由度”?
https://www.bilibili.com/video/BV1de4y1p7rf?aid=647941146帮你理解统计学中的自由度。希望大家喜欢。
自由度最早应该是在力学领域发明的,非常直观,后来被推广到了线性代数,叫矩阵的秩,变得抽象起来了。很多学科都要用线代,统计学沿用了力学的说法。实际上自由度跟自由也没啥关系,想要真正理解这个概念还是不要简单类比。好好啃一下高数,线代,结合一点理论力学才能真正理解这个概念。 又回来评论了,讲的真好,现在在学t分布,看了这个视频之后对其中自由度的参数有了一个很直观的理解,不需要看那些看不懂,即使看懂了步骤也不明白其意图的证明,就能明白为什么有时自由度是n,有时又是n-1,最好的学习方式是理解知识背后的含义,而不是推导运算的本身 这个是视频中提到的文章链接。https://journals.sagepub.com/doi/full/10.1177/2515245919882050;
作者重点从教学角度出发讨论自由度的意义。感兴趣的朋友可以阅读。 讲的好呀,和我之前看到的一个视频有相似的地方,但是更全面。
对于买了一个模型参数的概念,比如一开始的10个灯泡寿命估计期望寿命,因为得到了u,根据均值公式,只要知道10个灯泡中间的9个灯泡寿命就会自动确定最后一个灯泡的寿命,所以这个灯泡寿命变得不再“自由”,也就损失了自由度。 “人生就像一个银行,我们学到的知识和技能,就像是存进银行的自由度,每执行一个重要的人生决定,都要花费对应价值的自由度。勤学总是没错的,只有保证人生账户时刻具备充足的自由度余额,才会在重要的人生路口,拥有选择的权利。选的差不可怕,没得选才可怕” 看到36″,我觉得你理解是错的,数据科学追求的恰好不是数据自由,而是对数据的约束。自由度设定了数据集中可以自由变化的部分,是在对数据集生成源做约束和定义。
数据科学目的是研究数据集里的模式,数据如果有模式,就有可能通过参数将其模式表示为参数函数,表示产生数据集函数的最小参数基数量就是自由度。
楼上有网友说这和线性代数有关,是的有关,但是还不抽象。 数据源的参数也可以作为数据空间的最小张成集,这里的参数和线性代数里的向量作用一样。和函数张成基也一样,三个张成集里的对象都是抽象向量的实例。
当借用线性代数和泛函分析里的生成集来理解统计学,或者认识到其中的联系,统计学学习就有意思多了。
无论是学习经典统计学还是贝叶斯统计学,数据集都不是无源之水,始终假象一个数据源,对于后续的研究展开大有裨益。 就是你教给美团怎么用大数据收割用户的是吧 说实话我觉得可以直接解释啊 没有必要用什么银行交易这种语言 感觉反而还绕一圈 可否这样理解:所以如果数据点太少,回归就变成了解方程,对预测没有任何意义了 up真的做到了深入浅出,摒弃复杂的专业术语,把重点放在最核心的思想上,膜拜,太佩服了 完全不同。力学里的自由度和统计里自由度没关系。从物理意义上来说,很难把统计里的自由度理解为自由的运动。。。从数学定义上来说,统计上要求随机变量独立,而线性代数要求不相关,力学上又有点区别,在这个方向上能动就认为有自由度。我举个例子,x和x的平方,就是不独立,但是不相关。 解释的很晦涩 谢谢老师的讲解
页:
[1]