主成分分析とは、データが大量に存在している場合、関係している項目を集めて、より簡単にデータをまとめる分析手法。多変量解析における手法の一つです。
主成分分析とは?
主成分分析とは、変量(変数)がたくさん存在し、それぞれが相互に関係している場合、主成分というより少ない変量(変数)に置き換えてまとめ、データを理解・説明するために行われます。
データ項目が大量にある場合、全てのデータとその項目を一つ一つ見て全体を理解・把握することは不可能に近いので、次元削減やデータの特徴の抽出を行い、データ構造を理解するために、主成分分析が行われます。
ITパスポート試験的には、
- 多くの項目を持つ大量データを分析
- 分析・説明する時に、項目を少数に絞る(次元削減・特徴抽出)
を押さえておけば、主成分分析を問われていることが分かります。
IT関係あるの?
プログラマーやシステムエンジニアが業務を行う上で、主成分分析を行うことは無い…かと思いきや、データベース上に大量データがあり、どの項目(カラム)のデータがどれくらいあるのか等、無意識に主成分分析を行っている、もしくは主成分分析の元ネタになるための作業依頼を受けていることはあります。
ただし、経営陣やプロジェクト運営側が行う主成分分析は、プログラマーやシステムエンジニアが行うことはほぼ無いです。