-
標準的な方法
をとってlabelとする
卒論で実装したk-labelsは,argmaxの代わりにtop-kをとるという操作によるもの -
クラス数Kを使った素朴な方法
を満たすものを全てlabelsとする
つまり1/K (一様分布のとき) をthrshldにしており,「どのクラスに属するのかまったく検討がつかない」という状態に相当する
これを少しでも上回る⇒「何も当てがないよりは,多少勘がある」ということ
そうしたクラスを全てlabel化するというモデル -
エントロピーを用いた方法 (提案手法)
エントロピーH(P)は,annの平均的な確信度の「低さ」を表す指標
-H(P)は,annの平均的な確信度の「高さ」を表す指標
H(P)を,「各kがlabelとして採用されるか」のthrshldに使っている
これが低い場合は,すなわち「偏りが大きいようなP(分布)をもつannは自信をもって判断している」ということを反映している
そうでければ初めから偏りなどつけないはず...
さらに直感的にするため,両辺negしてlogもはずす
すなわち,右辺を超えられる確信度pkをもつ全てのkを,labelとして採用する分布Pという全体の様相を考慮した,データサンプルごとの動的thrshld
https://community.inkdrop.app/note/3f435e8dd88123d8f9718d60941246f4/note:rk3Axoxv9