下町データサイエンティストの日常

下町データサイエンティストの成果物

Python

B'zの歌詞をPythonと機械学習で分析してみた 〜Word 2 Vec編〜

1. 本Part概要 こんにちは。pira_ninoです。 早速のお知らせなのですが、本編から超絶優秀な友人のtaijest君も編集に加わってもらっています。これに伴いブログのタイトルも若干変更しました。 さて本題に戻ります。 前PartではB'zの歌詞を「LDA」を用いた曲…

B'zの歌詞をPythonと機械学習で分析してみた 〜LDA番外編〜

1. 本Part概要 こんにちは。pira_ninoです。 先日、30周年ライブであるPleasureツアー@横浜に行って「やっぱB'z最高」な最近です。 ライブについて語り出すと長いので、本編へ。 前回のLDA編では皆様のおかげで週間11位というブログ初心者には恐れ多い反響を…

B'zの歌詞をPythonと機械学習で分析してみた 〜LDA編〜

1. 本Part概要 前PartではB'zの歌詞を「TF-IDF」を用いた分析を行いました。 本Partではトピックモデルの一つである「LDA」を用いた分析についてお話しします。 pira-nino.hatenablog.com 2. LDAとは 2.1 LDAのイメージ 先に簡単な説明をしてしまいます。 LD…

B'zの歌詞をPythonと機械学習で分析してみた 〜TF-IDF編〜

1. 本Part概要 前Partでは、「歌詞データの前処理」についてお話ししました。 本Partではようやく分析の本編に入り「TF-IDFを用いた分析」についてお話ししていきます。 pira-nino.hatenablog.com 2. 文書データの分析 いわゆる文書データの一般的な分析観点…

B'zの歌詞をPythonと機械学習で分析してみた 〜前処理編〜

1. 本Part概要 前Partでは「歌詞データの入手」と「前処理の必要性」について話しました。 本Partでは「実際にどのような前処理をしたか」について話していきます。 pira-nino.hatenablog.com 2. 前処理の概要 先に今回行った前処理の流れについて書かせて頂…

B'zの歌詞をPythonと機械学習で分析してみた 〜データ入手編〜

1. 本Part概要 こんにちは。pira-ninoです。 本Partでは、B'zの「歌詞データの入手」について書かさせて頂きます。 分析の概要については、「イントロ編」を参照してください。 pira-nino.hatenablog.com 2. 歌詞データの入手 前Part(分析結果の公開について…

B'zの歌詞をPythonと機械学習で分析してみた 〜分析結果の公開について〜

1. 本Part概要 こんにちは。pira-ninoです。 前Partでは、B'zの歌詞の分析をするに至った経緯と分析概要について書きました。 pira-nino.hatenablog.com 本Partでは「データ入手と前処理」について書きたいところなのですが、その前にどうしても書かないとい…

B'zの歌詞をPythonと機械学習で分析してみた 〜イントロ編〜

1. 自己紹介 はじめましてpira-ninoです。 2018年4月に某社にデータサイエンティストとして新卒入社したピチピチの新米社員です。 学生時代は様々な企業のデータを機械学習を使って色々な提案をしてました。(単にパッケージを使うだけでなく、モデルの改良も…