★線形解析と非線形解析の特徴(パラメータ空間の作成か、パラメータ空間への適合か)
☆線形解析と非線形解析の特徴と差異
分類手法やフィッティング手法において、線形と非線形の差がデータ解析に及ぼす影響は大きく、かつ様々な項目に及ぶので適用に当たっては留意が必要となります。
線形手法と非線形手法を比較した場合、非線形に有利な事項として、分類率、相関/決定係数が確実に線形の場合よりも向上する事です。
一方で、線形手法が有利な事は要因解析がしやすく、またその解析信頼性も高いという事があげられます。さらに、データ解析では常に留意しなければならない過剰適合(over
fitting)や偶然性(chance correlation)の問題が線形解析では発生しにくいということです。また、内挿性は低いのですが、外挿性が高くなるという特徴があります。以上を簡単にまとめると以下のようになります。
項目 線形解析 非線形解析
内挿性 低い(×) 高い(○)
外挿性 高い(○) 低い(×)
偶然性 低い(○) 高い(×)
過剰適合 低い(○) 高い(×)
上記中、グリーンの文字が長所(○)で、赤色の文字が欠点(×)となります。なお、内挿性が高いということは、クラス分類では分類率が高くなり、フィッティングでは相関/決定係数が高くなることを意味します。外挿性が高いという事は、クラス分類とでフィッティングとで、内挿性と外挿性の差が小さいということを意味します。これと逆に外挿性が低いということは内挿と外挿の差が大きくなることを意味します。なお、過剰適合と内挿/外挿性は相互に関連しています。また、この表で記載されている手法の特徴は相対的なものであり、絶対的なものではありません。例えば、非線形解析は外挿性が低いために分類率や相関/決定係数と予測率との差が大きいのですが、線形解析と比較して分類率や相関/決定係数が大きな値を持っていれば、たとえ予測率が大きく下がっても線形解析と比較すればより高い予測率となります。このために、非線形解析が好まれることとなります。
☆線形解析と非線形解析の関係
前記表を見れば、線形解析と非線形解析とは様々な項目で相補関係にあることがわかります。従って、解析目的やその内容に従って線形手法や非線形手法を使い分けすることがベストの選択となります。
現在は流行のように非線形解析が盛んに利用されていますが、非線形解析が線形解析を総ての点で凌駕するのではなく、たがいに長所と欠点を有していることを理解して、自分の目的とした解析で最高のパフォーマンスを実現できるようにすることが大事となります。
データ解析上で、線形手法に加えて非線形手法という選択肢や、可能性が広がったと考えるべきです。
「データ解析実施留意点」TOP
|
|