下町データサイエンティストの日常

下町データサイエンティストの成果物

2018-07-28から1日間の記事一覧

B'zの歌詞をPythonと機械学習で分析してみた 〜TF-IDF編〜

1. 本Part概要 前Partでは、「歌詞データの前処理」についてお話ししました。 本Partではようやく分析の本編に入り「TF-IDFを用いた分析」についてお話ししていきます。 pira-nino.hatenablog.com 2. 文書データの分析 いわゆる文書データの一般的な分析観点…

B'zの歌詞をPythonと機械学習で分析してみた 〜前処理編〜

1. 本Part概要 前Partでは「歌詞データの入手」と「前処理の必要性」について話しました。 本Partでは「実際にどのような前処理をしたか」について話していきます。 pira-nino.hatenablog.com 2. 前処理の概要 先に今回行った前処理の流れについて書かせて頂…