下町データサイエンティストの日常

下町データサイエンティストの成果物

下町データサイエンティスト 新卒5年目が終わる

はじめに

こんにちは。nino_piraです。
ここ1, 2年間、ブログをあまり更新できていませんでしたが、最近の取り組みを言語化することで、自分を見つめ直す機会になるのでは と思い、久々に長文ブログを書きます。

新卒5年目が終わる

早いもので新卒5年目が終わります。まもなく30歳です。
新卒3年目までは毎年振り返りブログを書いていましたが、転職について記載した新卒3年目振り返りブログを最後に他話題の記事も含め、更新が滞っておりました。

本記事では、「で、転職してから何をしているの?」を振り返り、「最近考えていること」を言語化していきたいと思います。

pira-nino.hatenablog.com

pira-nino.hatenablog.com

pira-nino.hatenablog.com

転職してから何をしているの?

所属は?ざっくり何をやっているの?

  • 前職: 受託分析専門の会社
  • 現職: LINE

組織改変に伴い度々所属組織名が変わっていますが、いまいまでは「Data Sciense Center / DSC Planning Team」というところに属しています。
組織名はちょこちょこ変わっていますが、一貫して「ML / DS PM」的な仕事をしております。
入社したときはML PMとして入社した記憶なのですが、組織のスコープも広がり ML / DS PMとして働いております。 自分のやっていることを大きく2分類すると、「ML的な仕事」と「DS的な仕事」の2つに分類できるので、この観点で説明をします。

細かい話はさておき、何をしているか」は以下の記事をご参照ください。
スライドに関しては、もう少し品質高いスライドが作れたなぁと後悔しているので、軽い気持ちで見ていただければ幸いです。

engineering.linecorp.com

speakerdeck.com

MLのお仕事

主に以下の仕事を担当しています

  • (メイン)特徴量ベクトルのPM
  • (メイン)属性推定のPM
  • (最近着手)某サービスへのML導入のファシリテータ
  • 雑務

属性推定って何?はこちらの資料ご参照ください。特徴量ベクトルについても少し触れられています。 speakerdeck.com

属性推定やいレコメンドシステムもですが、「ML!!ML!!」といった要素だけでなく「システム開発」の要素を強く求められます。超巨大なデータを扱う、様々な部署のデータを扱う、それをMLシステムとして安定して運用させる仕組みづくりが必要であることから、必然的にシステム開発の要素が強くなります。
前職での仕事と一番違うなぁと感じるのは、この「システム運用に重きを置いている点」です。システム運用の重要性について身に沁みる毎日です。

3点目の「某サービスへのML導入のファシリテータ」は受託分析でいうところのプリセールス的なことをしています。
前職での経験もあり、チームの中ではかなり得意な方であると自負しています。受託分析と大きく異なるのは、お客さんはITリテラシーが高い自社の人、かつ、プロダクトに夢を持っている人達なので、いわゆるお客さんとして接する必要がなく、仲間として接することができるので、かなり仕事がしやすいですし、短い時間で本質的な話に入ることができます。 しかしながら既に大きなシステムが動いているところへの提案となるので、なかなか一筋縄ではいきません。自分の提案力と推進力に関する力不足を感じます。

DSのお仕事

LINE Pay分析チームのPMをしています。ずばり、こんな仕事です。(前述添付の資料から抜粋)

具体で言うと、施策の設計をしたり、KPIロジックツリーを書いたり、依頼業務を捌いたり、、、といった感じです。

最近は、データ分析に基づいた意思決定の文化作りに悩んでおります。プロダクト・市場・顧客といった要素を理解していれば、データドリブンではなくお気持ちドリブンでイケテイルアクションを行うことも可能です。結局のところ、「プロダクトでユーザにどんな世界観を見せたいか」という思いが一番大切だと思っています。
なんだったら「データ分析の観点はいいから、もっとお気持ちドリブンで提案考えようぜ」といった感じの データの人間としていかがなものかと思える発言を多くしている気がします。 データ分析に頼りすぎず、データエビデンスをスパイスとして効かせて、何かしらのアクションを打つサイクルを回せる文化を作りたいなぁと思っております。

その他にも以下のような仕事をしています。

  • 分析チーム内部での開発環境の整備のファシリテーション
  • UXリサーチの立ち上げ・企画
  • チョロっとデータマネジメント

上記からも伝わっていると思いますが、MLでの仕事に比べ、DSでの仕事ではプロダクトの深いところに入り込みます。
そうするとプロダクトマネジメントの考え方が必須であることを痛感し、『プロダクトマネジメントのすべて』を改めて読み直しました。プロダクトの4階層の考え方は、かなり有効な知識だと思うので、ご興味がある方はご参照ください。

productzine.jp

www.amazon.co.jp

ふと思い出したのですが、類似書籍として『たった一人の分析から事業は成長する 実践 顧客起点マーケティング』も非常に良い本だったので紹介させていただきます

www.amazon.co.jp

最近思うこと

「お仕事に関する話」と「プライベートに関する話」の2本立てで書きます

お仕事に関する話

同僚のPM、MLエンジニアが優秀

同僚のPMは非常に優秀です。システム開発的な話だけでなく、社会人力が非常に高いなぁと感じます。
エンジニアもとんでもなく優秀です。さすがこの規模の会社のMLチームともなると、すごい人がたくさんいますね。
ちなみに、自分が関わっているML PMが6人くらいで、ML エンジニアが30人くらいです。たったこれだけの人数で相当な数のシステムを回しているのはさすがですね(日々感服します)

ソフトウェア開発難しい

MLの知識は一定程度自信があります。少なくとも他のPMよりもある程度わかっている自信があります。しかし、ソフトウェア開発に関する知識が圧倒的に足りていないです。特にインフラなどのコンピューターサイエンスに関する基礎知識が足りていないなぁと感じております。少なくとも前職で求められていたレベルよりも高いレベルでの知識が必要です。
自分のR&RはエンジニアではなくPMであるので、深いところまで知る必要はありません。しかし、どこまで知っておくべきかの見極めをしつつキャッチアップをしなくては、と日々日々悩んでおります。

PMって何?

PMって何の略語問題です。一般的にはProject ManagerやProduct Managerの略語として扱われると思います。上記の自分のインタビュー記事を見るに、自分はTecnical Program Managerであると思っています。確かに開発寄りの案件のマネジメントを行なっているので、Program ManagerといえばProgram Managerな気もします。
もちろん(特にML案件では)開発系のmanagementをすることが多いとはいうものの、DS案件やMLのプリセールス的な案件ではプロダクトのことも考えることが多いので、100%開発PMかと言われれば、そうではないかも?と思っております。
そんなこんなもあり、「PM? Party Managerの略だと思う」と言っております。
実際、様々なチーム(party)を運用していくファシリテータとしての役割を担っているので、あながち間違いではないと思っております。というわけで、自分は ML / DS Party Managerです(小並)

仕事の減らし方

良かれ悪かれミクロなマネージメントになってしまう / 浮いている仕事やモヤモヤしている事項に正面から切り込んでしまう 傾向があるため、キャパオーバーすることが多々あります。
実際DS業務でのUXリサーチも「定量データだけでは決め手にかける?だったらUXリサーチやろうぜ」と自分が言い出しっぺに、DSなしで、マーケターの人たちと企画を進めております。
結果的に、普段の業務への影響も出るし、UXリサーチの企画自体も「本気出せばもっと加速できるのになぁ」ともどかしさを感じる機会が多々あります。本件は長期的に見ればやるべき仕事だと判断し推進をしていますが、そこそこの数の案件を抱えているので、今後は、もっと「自分がやるべき仕事か?」「どのように他の人に任せれば進むか?」を検討し、練度を上げていく必要があるなぁと感じております。

プロダクトを信じる大切さ

プロダクトベースなビジネスを行う我々としては、プロダクトをユーザに使ってもらうかが非常に重要です。その前段階として「従業員がプロダクトを信じられるか」が非常に重要だと感じております。当たり前の話に聞こえるかもしれませんが、チーム全体にこの意識を共有させることが意外と難しいなぁと感じております。CEOやPdMといったトップレイヤーの人がプロダクトへの愛やビジョンを示すリーダシップによる雰囲気作りや、一従業員がプロダクトと向き合う文化作りは非常に大切だなぁと思う今日この頃です。

ML / DS PMの需要は確実に伸びる

ポジショントークです笑
今後、MLのシステム導入 / データ分析による意思決定がより広まっていくことは確実であると思われます。その状況下において、ビジョンを描くことができ、各種プロセス回せるPMは必要不可欠になります。特に日本においては各種システム化が遅れている / 自社開発が増えていくことが見込まれているので 一層自分のような職種の需要が伸びることは確実だと思います。
「データサイエンティスト / MLエンジニア キャリア ナニモワカラナイ」でしたが、ここ2年弱の経験からキャリアが少し見えてきた気がします。

プライベートに関する話

人生は短い

ここ半年で急に悟りました笑
残り60年程度しかないことに加え、自由なことをできる時間が非常に短いことに気がつきました。
もう少し人生を楽しんでもいいのでは?という思いが強くなってきている今日この頃です。

色々進捗があった

転職をしたり、結婚式をしたり、引っ越しをしたり、、、 30歳手前に色々進捗がありました。結婚式は非常に楽しかったです。

勉強時間が減っている

PMというR&Rに振り切った / 仕事をこなすだけで体力との限界のもあり、勉強に関する時間が明らかに減っています。
よく「勉強していない。本当にまずい!!」という声を聞きますが、幸い自分はそこまでクリティカルに困ってはいないです。とはいうものの勉強量を減らすことは長期的に良くないのは明確なので、ちゃんと目的をもって何かしらの勉強をしたいなぁと思う今日この頃です。インフラとかシステム構築とか勉強しようかなぁ。。。
付随してツイートをする機会が減っています。なんとなくツイッターを見る余力が減っていることに加え、ツイートする価値のあるアウトプットが減っています。
総じてポジティブに捉えればお仕事が充実しているとも捉えられますね。

最後に

色々書きましたが、細かい話を端折ったり、オブラートに包んだ内容になってしまっている自覚はあります。詳しいことはリアルでお会いした時に話させてください。
5年間色々やってきましたが、結局は「データ分析 / MLといった技術を用いていい感じのことをやりたい」という思いを絶やすことなく仕事を続けられてきたことが一番の成果かなぁと思います。
また、同業界のみなさんが頑張っている様子から、かなり刺激を受けております。特に同年代の方々の活躍は自分のモチベーションにつながっております。意見交換も含めご飯にいきましょう!!
最後に。個人的に各社ML / DS PMがどんな仕事をしているかが非常に気になっているので、業界を盛り上げる意図も込めてぜひ座談会なりイベントをやりませんか?興味ある方いましたらご連絡ください!!

最後までお読み頂きありがとうございました!!

評価指標入門 読書感想文

はじめに

お久しぶりです。nino_piraです。
ブログは更新していませんでしたが、元気です。 某タカヤナギ氏に「献本欲しいならブログを書いてくれ」とのことで献本を頂いたので、ブログのリハビリも兼ねて感想文を書きます。
本の内容については既に色々な方がブログにまとめてくださっているので、個人の感想文を書きます

gihyo.jp

ビジネスとデータサイエンス / 機械学習

一般的な企業に属する我々は利益貢献することを求められています。そして我々は、データサイエンスや機械学習といったツールを通し利益貢献を生業とする仕事をしている。
本書の1章では利益貢献としての定量的指標であるKPIとデータサイエンスアプローチの関係の一般論や事例を交えた罠について記載されている。

個人的には、評価とは?を考える際に「何と比較して評価するかのか」について改めて意識を強くしようという気づきがあった。
例えば「良い」「悪い」といった単語を使う際には、何に対しどれくらい良くなったかを明示することの重要性を再確認しました。
もちろん普段から意識は持っているものの、忘れがちになるので注意ですね。

次に、いわゆる目的関数の最適化とビジネスの評価指標・KPIとの関係について。
ビジネスにデータサイエンス・機械学習を真に活かすと言う意味では目的関数の改善と評価指標・KPIの改善が正の相関係数を持つように案件を設計すべきというお約束は、もはや広く知れ渡っていると認識しています。
本書籍では「データサイエンスとビジネスKPIの関係に齟齬がないとうにしよう」という事例としてクーポン発行の意思決定に関する問題を事例に罠について紹介されています。"施策デザインのための機械学習入門"にも記載のあった課題設定と同じですね。

gihyo.jp

2章以降では回帰や分類の評価指標について、実例・コードともに書いてある。正直、さらっと読み飛ばしました。

で、この本は誰向けなのか?

個人的には面白いなぁと思って読むことができたが、正直「目から鱗」と思える内容はあまりなかったです。
いわゆるビジネスとデータサイエンス / 機械学習の関係の「あるある」を上手いこと言語化した書籍だと思います。言語化していること自体は流石です。

では、誰に何を感じ取って欲しい本なのか?
私のようなデータサイエンス / 機械学習のプロとして働く人にとっては上記のように「あるある」と思える内容である。
一方、数式やコードがある程度書かれているため、ビジネス寄りの人には、ちょっと内容として難しいのかなぁとは思います。
この手の本の企画が非常に難しそうだなぁと勝手ながら思ってしまった。

その他

個人的には、オフラインテスト / オンラインテストのズレについても書いてほしかったなぁと思いました。
データサイエンス / 機械学習 のあるあるだと思うのですが、オフラインテストとオンラインテストのズレで苦しんでいる方は多いのではないかと思います。例えば既存レコメンド枠の置き換えのタスクを考えると、レコメンドアルゴリズムが変わったのでUXが変わってしまい、結果的にオフラインテストとオンラインテストで変わってしまうという事例が考えられます。
この事例はまさにビジネス評価指標に対する事前見積もりの(数値的にも認識的にも)ズレが起きている事例だと思います。「事前にこれくらい儲かると思っていたのに、現実は違った」ということでお悩みの方は多いのではないでしょうか? ということで、オフラインテスト / オンラインテストのズレについて書いて欲しかったなぁという感想です。 対策としては ユーザビリティテストをすることやスモールなABテストをしてみるということでしょうかね。ABテストの設計もデータサイエンティストの腕の見せ所ですね。

また、本書はところどころに作者のタカヤナギ=サン節が効いており、つい「クスっ」と笑ってしまう記載が散りばめられていて、楽しく本を読み進めることができました。

最後に

目から鱗というほどではないが、改めて普段の仕事の意識を高める本としては良い本だと思います。
ぜひ皆様もご一読ください。