数学中国

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 1425|回复: 5

数据标准化以后标准差为什么恰好是1

[复制链接]
发表于 2022-1-18 17:10 | 显示全部楼层 |阅读模式
对于这种数据,普遍采用的最佳实践是对每 个特征做标准化,即对于输入数据的每个特征(输入数据矩阵中的列),减去特征平均值,再除 以标准差,这样得到的特征平均值为 0,标准差为 1。

——————平均值是0好理解。但是标准差为什么恰好是1呢?
发表于 2022-1-18 21:27 | 显示全部楼层
下面是我过去在《数学中国》发表过的一个帖子,可供参考:



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

点评

谢谢lu老师。看过你的证明后理解了。  发表于 2022-1-19 17:32
回复 支持 1 反对 0

使用道具 举报

发表于 2022-1-18 18:07 | 显示全部楼层
再除 以标准差     N除N (当N不等于0)    结果一定=1
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-1-18 18:25 | 显示全部楼层
lihp2020 发表于 2022-1-18 18:07
再除 以标准差     N除N (当N不等于0)    结果一定=1

有点没跟上你的思路,为什么会出现N/N?

比如100个人的平均身高是1.69,标准差是0.06。
用每个人的身高减去平均值,得到的数据应该是在标准差左右波动。比如
这一组数据再除以本身的标准差。得到的新数据标准差为什么就是1了?

有个新问题蓝色和红色的标准差是同一个标准差?还是说蓝色的标准差是根据0.03,0.09,-0.02…………新计算的标准差?
回复 支持 反对

使用道具 举报

发表于 2022-1-18 20:35 | 显示全部楼层
例子:

一堆数据 放大N倍 标准差 也 放大N倍

一堆数据同时减少增加 一个常数 标准差 是不变的 这个东西 你可用 标准差的定义 化简得到这个结论

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|数学中国 ( 京ICP备05040119号 )

GMT+8, 2024-3-29 02:52 , Processed in 0.068359 second(s), 19 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表