【書評】評価指標入門を読ませていただきました

データサイエンス

評価指標入門についてを読んでみたのでその感想を書いてみました。
本の内容が気になっていた方の参考になればと思います。

このページのサマリ

  • この本のターゲット層
  • 書籍の内容
  • 読んで得られた気づき

この本のターゲット層

かなり端的にいうと企業に勤めるデータサイエンティストおよび機械学習エンジニアがメインターゲットです。
書籍には下記のように記述していました

  • 顧客のためにデータ分析を中心としたサービスを適用する受託データ分析/コンサルティング会社のデータサイエンティスト
  • 自社サービスをよくするために機械学習モデルを開発・運用いsているMLエンジニアおよびデータサイエンティスト

大学などでデータサイエンティストを志す学生や大学教員に「ビジネスシーンでデータサイエンスに関わる際によく遭遇する悩みや課題」を把握してもらう、ということにもこの書籍は有用です。
また、数式やコードも交えて解説している部分があるのである程度の事前知識をもっていることが前提となります。

読んで得られた気づき

個人的に一番印象に残っていることは「ビジネス上の指標と機械学習モデル・統計分析の評価指標が直接的に結びついているとは限らないこと」でした。

実務経験がある方は経験したことがあると思うのですが、モデルの精度が良くなったのに売上がよくならない、あろうことかコスト(時間、金銭…etc)だけがかかってしまった、なんてことは非常によくある話です。モデルの精度を表す指標は様々ありますが、それが「どれだけ売上や利益に結びついているか」ということを意識してモデル作成に取り組んでいる人はあまりいないのではないかなあと思います。

特にジュニアクラスのスタッフだとありがちなのが「とりあえず何かしらの一つの指標だけを見てしまって、それで全てを判断してしまう」ということがありがちです。(2値分類で正答率がいいからオッケーだよね、みたいなイメージ)。
ただでさえ複数ある指標を理解し、扱っている問題設計を理解して最適な指標を選択するだけでも容易ではなく、それをビジネス上のKPIへ落とし込むとなると、かなりハードだなあ…とは思いますが、ここができれば市場価値が高い人材になれるのかな?とポジティブにとらえることにしました。

機械学習をビジネスに活かすことの難しさは様々な方が語っています。
ご興味のある方はいくつかリンクを載せていますのでご参考になれば幸いです。

Moe Uchiikeさん(ブレインパッドのデータサイエンティスト)の資料です。
TJOさん(Googleのデータサイエンティスト)の記事です。

最後に

ある程度の前提知識は求められるものの、ビジネスに機械学習を活かすための考え方を得ることができて非常に良い書籍だなと感じました。この記事が書籍購入の後押しになれば幸いです。

Bitly

コメント

タイトルとURLをコピーしました