- UID
- 4527
- 注册时间
- 2014-3-28
- 在线时间
- 小时
- 最后登录
- 1970-1-1
- 精华
- 阅读权限
- 60
- 听众
- 收听
|
发表于 2022-12-31 12:21:22
|
显示全部楼层
看到36″,我觉得你理解是错的,数据科学追求的恰好不是数据自由,而是对数据的约束。自由度设定了数据集中可以自由变化的部分,是在对数据集生成源做约束和定义。
数据科学目的是研究数据集里的模式,数据如果有模式,就有可能通过参数将其模式表示为参数函数,表示产生数据集函数的最小参数基数量就是自由度。
楼上有网友说这和线性代数有关,是的有关,但是还不抽象。 数据源的参数也可以作为数据空间的最小张成集,这里的参数和线性代数里的向量作用一样。和函数张成基也一样,三个张成集里的对象都是抽象向量的实例。
当借用线性代数和泛函分析里的生成集来理解统计学,或者认识到其中的联系,统计学学习就有意思多了。
无论是学习经典统计学还是贝叶斯统计学,数据集都不是无源之水,始终假象一个数据源,对于后续的研究展开大有裨益。 |
|