平均値がMSE(or RMSE)を最小化する理由
厳密な証明かはわかりませんが、以下に自分なりの理解をまとめます。MSEの最小化問題はRMSEの最小化問題と解が同じ(?)だと思いますので、MSEの方で検討します。
(記法)
: のベクトル
: のベクトル
: のベクトル
ここで(5)の第3項に注目して
となるので、
となります。
ここで(6)をに関する式とみなすと、が含まれるのは第2項のみとなるため、第2項を最小化するがMSE(or RMSE)を最小化するとなります。
第2項は2乗された値のため、最小値は0であり、第2項が0になるのは、]のときです。
]はの期待値(平均値)のため、「平均値がMSE(or RMSE)を最小化する」と言えます。
(参考資料)
* https://scholar.harvard.edu/files/danielyewmaolim/files/api-208section1.pdf