正則化項の効果のお話

学習データーに適合しすぎると訓練データ以外の未知のデータに対する予測性能(これを汎化性能という)が劣化する過学習の現象が見られる.例えば, 多項式近似の例では, データ数に対して(相対的に)過剰な次数を用意したモデルを導入すると生じやすくなる. これは近似に用いる多項式の係数、すなわち重みベクトルの絶対値、が大きくなる項の存在によって生ずる.

そこで, 最小化する対象 に重みベクトルの大きさに制約を与える項 (正則化項)を付与することがある. 例えば二乗誤差函数の最小化の代わりに

を行う方法がある.

たとえば, の場合

この値が0になることを要請することで

を得る. の空間において同心円上に等高線を引いたとする元々のロス函数の等高線と接する位置で極値をとるようになる.これは重みの ノルムの値を固定した条件下での極値問題を逐次解いていくことになるからである. 正確には KKT 条件による極値問題になる.

See

results matching ""

    No results matching ""