わいす工場 Kaggle Kaggleトライ -NBME – Score Clinical Patient Notes 1-

Kaggleトライ -NBME – Score Clinical Patient Notes 1-


久々にKaggleトライ。他にもPythonの基礎やDjangoの使い方を学んでいるところですが、やはりKaggleで遊べるようになるという目標を考えると知識不足なりにもkaggleに関わり続けるのはやめてはいけないと思い再度手を伸ばすことにしました。まあすでに1年近く経過してますが、飽きっぽい凡人の挑戦ということで許してもらおうかと。

さて今回取り組むのはNBME( National Board of Medical Examiners®)ということ(?)で、下記のリンク先となります。

https://www.kaggle.com/c/nbme-score-clinical-patient-notes/overview

まあ例によって英語なので、まずは本コンペの目的、データ要件などを整理していくことから始めようと思います

・コンペの目的について
表記が曖昧な患者ノートに記載されているコメントを機械学習によりスコアリングし、臨床スキル向上に貢献する
とのことです。実際kaggleのOverview->descriptionにはもっと具体的に、例えば患者ノートにはどのような記載があるかなども記載されています。しかしDeepL翻訳がすごく便利。。。意味がある文章にとりあえず翻訳してくれるので、ざっくり理解ならコピペするだけでおおよそわかってしまいます。

・コンペの評価について
Evaluationを見てみると、micro-averaged F1 scoreで評価するとのこと。これだけではいまいち何のこっちゃわからないので、Wikipedia先生に聞いてみると下記の通り。
*下記Wikipediaより引用
F値は適合率と再現率から計算される。適合率とは陽性と予測したもののうち(この中には正しく予測できていないものも含まれる)実際に正しく予測できたものの割合で、再現率は全ての陽性のうち実際に陽性であると予測できたものの割合である。
*引用終わり

また予測も評価もスパンで行うため、予測が一部評価に入ってるかどうか、全部入ってるかなどでF1スコアを算出するようです。

概要としてはわかったけど、実際にどのようにデータを処理していくかなどはまたやりながら見ていこうと思います。次回はデータセットの中身を見ていきます。

5/14追記

他のこと色々やってるうちに期限切れ。。。
情けないですがまた次のコンペに取り組んでいきたいと思います。削除しないで残しておく。

コメントを残す

メールアドレスが公開されることはありません。

CAPTCHA


Related Post