Skip to content

1W1521375/entropy_labelling

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

entropy_labelling

confidential valueをどう選り分けるか?

  1. 標準的な方法
    をとってlabelとする
    卒論で実装したk-labelsは,argmaxの代わりにtop-kをとるという操作によるもの

  2. クラス数Kを使った素朴な方法
    を満たすものを全てlabelsとする
    つまり1/K (一様分布のとき) をthrshldにしており,「どのクラスに属するのかまったく検討がつかない」という状態に相当する
    これを少しでも上回る⇒「何も当てがないよりは,多少勘がある」ということ
    そうしたクラスを全てlabel化するというモデル

  3. エントロピーを用いた方法 (提案手法)
    エントロピーH(P)は,annの平均的な確信度の「低さ」を表す指標
    -H(P)は,annの平均的な確信度の「高さ」を表す指標

pkの自己情報量と,平均との比較

H(P)を,「各kがlabelとして採用されるか」のthrshldに使っている
これが低い場合は,すなわち「偏りが大きいようなP(分布)をもつannは自信をもって判断している」ということを反映している
そうでければ初めから偏りなどつけないはず...

さらに直感的にするため,両辺negしてlogもはずす

すなわち,右辺を超えられる確信度pkをもつ全てのkを,labelとして採用する

分布Pという全体の様相を考慮した,データサンプルごとの動的thrshld

研究に関する記録

https://community.inkdrop.app/note/3f435e8dd88123d8f9718d60941246f4/note:rk3Axoxv9

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published