Rでサダメトリクス

ひとりアドベントカレンダーおよびさだまさし×ITアドベントカレンダー14日目。

本記事ではサダメトリクスに取り組みます

さだまさし×ITアドベントカレンダーは一見色物のようなタイトルでありながら非常にレベルの高いアドベントカレンダーです。
多くの人がさだまさし、通称まっさんの偉大な才能を電脳の世界で再現したい、そんな想いが伝わってきました。
残念ながら私にはとてもそんな技術力が無い。
しかしそんな自分にもできることはあるはずだ、ということで私はまっさんに関する情報の定量化(サダメトリクス)に取り組むことでお茶を濁したいと思います。

私とさだまさし、それは解夏

さて、このアドベントカレンダーに参加されている皆さんそれぞれにまっさんとの思い出があると思います。
私にとってそれは解夏です。
解夏はまっさんの小説で、10年くらい前に大沢たかお主演で映画化しています。
私は映画の方を観たのですが、今でも映画の一シーンがフラッシュバックするくらい強烈な印象を残した作品です。
男性だったら一度観てほしい映画ですね。年末年始の休みでぜひ観てほしい。

正直なところ解夏と関白宣言と秋桜くらいしか知らない

で、このカレンダーに参加しておきながら難なのですが、私はさだまさしについて胸を張って知っているとは言えません。
関白宣言は有名曲なのでさすがに知っています。
あと、山口百恵が好きだったので秋桜はよく聴いていたのですが、最近これがさだまさし作詞作曲だったと聞いて驚いているくらいです。
コンサートも4000回以上行われているというのに、1度も行ったことがない。
これはまずい。ということで2016年はコンサートに行こうと決意しました。

さだまさしの500曲から何を予習するべきかセットリストから学ぶ

かといって今コンサートに行ってもただ地蔵になるだけです。予習が必要。
しかしさだまさしの曲は500曲を超えるといわれ、闇雲に聴いても効率が悪い。
ということでコンサートのセットリストの傾向を調べそれを今回の記事にしたいと思います。

データと方法

データは某所のユーザ投稿セットリスト(1985年〜2015年)を利用しました。
さだまさし単独のものに絞っています。
参考までに今回用いたコードは以下のgistに掲載しています。詳しくはそちらをご覧ください。
https://gist.github.com/dichika/f5a1a143932286d70600
なお、特に注意書きがない限り各コンサートツアーごとに、1つのセットリストをランダムサンプリングした結果を用いています。
これはコンサートツアーではセットリストがほぼ同じものになると予想され、コンサートツアーの回数によって曲の頻度にバイアスがかかることを防ぐためです。
それでは結果をみてみましょう。

何曲予習すべきか

1回のコンサートあたり何曲歌われるかをまず押さえます。
開催年ごとにコンサートあたりの曲数を箱髭図で示した結果が以下です。
だいたい20曲弱予習しておけば良さそうです。

どの曲が最も歌われているか

ここ10年間の定番曲は何なのか、頻度順でみたものが以下になります。
上記で20曲予習が必要なことがわかったのでトップ20を示しています。
2005年以降の10年間で44ツアーあったうち、36ツアーで北の国からが歌われています。

順位 曲名 歌われたツアー数 全ツアー数に占める割合
1 北の国から 36 81.8
2 案山子 34 77.3
3 主人公 27 61.4
4 風に立つライオン 24 54.5
5 秋桜 21 47.7
6 精霊流し 21 47.7
7 道化師のソネット 20 45.5
8 修二会 16 36.4
9 Birthday 15 34.1
10 いのちの理由 13 29.5
11 片恋 13 29.5
12 防人の詩 13 29.5
13 人生の贈り物 〜他に望むものはない〜 12 27.3
14 関白宣言 12 27.3
15 落日 10 22.7
16 まほろ 9 20.5
17 無縁坂 8 18.2
18 おむすびクリスマス 7 15.9
19 セロ弾きのゴーシュ 7 15.9
20 天然色の化石 7 15.9

2013年に行われた「さだまさし国民投票」のトップ10あたりが入ってくるかと思いきや、「奇跡〜大きな愛のように〜」「つゆのあとさき」等が抜けていますね。
あまりコンサートでは歌われないか、この分析が間違っているかどちらかでしょう。

最初に歌われるのは案山子

2005年以降の10年間で最初に歌われた曲を集計した結果が以下です。
案山子が4分の1のツアーで最初に歌われています。

順位 曲名 歌われたツアー数 全ツアー数に占める割合
1 案山子 11 25.0
2 あなたが好きです 3 6.8
3 きみのふるさと 2 4.5
4 主人公 2 4.5
5 修二会 2 4.5

最後に歌われるのは修二会

同様に、最後に歌われる曲を集計した結果が以下です。
アンコールは除いています。

順位 曲名 歌われたツアー数 全ツアー数に占める割合
1 修二会 7 15.9
2 主人公 5 11.4
3 落日 4 9.1
4 風に立つライオン 4 9.1
5 遙かなるクリスマス 3 6.8

アンコールはだいたい1曲

アンコールはどれくらい歌ってもらえるものとして心構えをしたら良いでしょう?
セットリストよりアンコールで歌われた曲数を集計し箱髭図で可視化したのが以下の結果です。

多くは1曲、長くても3曲のようです。
しかし以下のまっさんのインタビューを読む限り、ちょっとこの結果は眉唾ですね。
セットリストが有志の手で入力されるものである以上、本編ではないアンコールについてはあまり正確でない記述である可能性があるかとも予想されます。

アンコールでよく歌われる曲は風に立つライオン

参考までにアンコールでよく歌われる曲を集計したのが以下の結果です。
アンコールはコンサートごとに変わる可能性が高いので、ツアーごとにサンプリングした結果を使わず、全コンサートを対象に集計しています。
風に立つライオンと主人公が多いですね。

順位 曲名 歌われたコンサート数
1 風に立つライオン 86
2 主人公 60
3 いのちの理由 21
4 君は歌うことが出来る 20
5 虹〜ヒーロー〜 19

関白宣言の後に関白失脚が歌われるとは限らない

最後に2005年以降の各セットリストの曲順から、ある曲の直後にどんな曲が来やすいかを集計し、有向グラフで表現したのが以下の図です。

最初と最後にそれぞれ歌われやすい案山子と修二会には赤と青で着色しています。
またエッジは3回以上のコンサートツアーで出現した組み合わせにのみ張っています。
意外だったのは関白宣言の直後に関白失脚が歌われるとは限らず、むしろ逆の場合があるということでした。なるほどなあ。

最後に、サダメトリクスの今後

以上がユーザ投稿のセットリストデータから私が得た知見です。
データの信頼性などの問題はあるものの、分析を通して、コンサートに向けた次の一歩がみえた気がします。
さだまさしの膨大な足跡はとてもじゃありませんが定量化し尽くすことはできません。
今後も有志の手でサダメトリクスは続いていくでしょう。
それでは長くなりましたがこの辺で。
enjoy!!!