主成分分析とは、多変量の情報を少数個の主成分と呼ばれる合成変数で記述する方法。情報の縮約や次元圧縮を目的とした手法である。高次元のデータのばらつきが、少数個の主成分からなる低次元空間内で出来るだけ再現できるようにする。したがって主成分の分散最大化と主成分間の無相関化(直行化)が必要である。これは固有値と固有ベクトルを求めることにより実現できる。
100点満点のテストのようにデータの単位が揃っている場合は、分散共分散行列と相関行列のどちらを使って主成分分析をしても良い。単位が揃っていない場合は、相関行列を使って無単位化を行った主成分分析が適切である。