タカラジェンヌ一覧を作成するためにスクリプトを書いた話

投稿者: | 2016年2月20日

約2年ぶりだが、唐突にblogを更新しようと思う。
大体、暮れが押し迫ってくると、「1年あっという間だったな」と思うものだが、昨年末はその感覚が全くなかった。

何故か。

実は昨年の7月頃に宝塚に興味を持ったのだが、そのせいで宝塚のことを全然知らなかった1年前が遠い昔のように感じていたのではないかと思い至った。

 

きっかけは運動会

7月頃に、劇団新感線の「五右衛門VS轟天」の予習として、過去作を調べていたところ「天海祐希」がファンから「ゆりちゃん」と呼ばれていることに気が付いた。「宝塚は愛称で呼ぶんだなー」と思って、色々調べている内に、宝塚で10年に一度開催される大運動会の存在を知り、そこで何かが私の琴線に触れた。

宝塚歌劇大運動会とは、綱引きや玉入れをしたり、選抜メンバーでリレーをしたり、応援合戦でソーラン節を踊ったり、本当に中学や高校でやるような運動会だ。
ゆるい気持ちでやっていたならば見られたものじゃないが、本気で自分の組を勝たせようと頑張って、泣きじゃくったりしているのが感動的だった。

昔からくだらないことを大真面目にやっているのに弱い。

そしてそれをやっているのが、スタイル抜群の美女ばかりだという事実。
入場行進で各組のパフォーマンスがあるのだが、宙組のパフォーマンスが以前勤務先のイベントで偶然観ていた「銀河英雄伝説@TAKARAZUKA」だということにも心惹かれた。

私の人生に、他人の運動会のDVDを購入する日が来るとは。
分からないものだ。

普通ならばそこから劇場に通うものなのかもしれないが、チケットの入手方法がよく分からないので、映像作品や専門誌を見て、タカラジェンヌの顔と名前を覚える作業にはまっている。宝塚は現在102周年目なので、現時点で101期分のタカラジェンヌがいる。覚えても覚えても終わりが見えないのが楽しい。

前述の通り「愛称」で呼び合う文化があるのだが、「愛称」は本名に由来するものが多く、「芸名」との関連がないので、名前を2個覚えるのと同じ労力がかかる。また、最初の内は舞台化粧がみんな同じ顔に見えるし、難易度が高いのだが、むしろそこが燃えるのだ。


 

で、本題

これまで全然知らなかったタカラジェンヌの名前を大量に覚えたので、何人覚えたのか数えてみようと思った。

Wikipediaに入団の期ごとに「宝塚歌劇団n期生」というページがあるので、それを自動取得してCSVファイルに出力するスクリプトを書いて、名簿を作成した。
それをざっと眺め、名前を見て顔が思い浮かぶ人に丸を付けていったところ、255人に丸がついた。その内、23人は以前から知っていた人だったので除くと、約半年間で日常生活に関係ない人の名前を232個を覚えたことになる。これが多いのか少ないのか分からないが、ちょっとした達成感がある。

これを読んでいるみなさんも知っているタカラジェンヌを数えたくなってきたことだろう。分かってますよ。
タカラジェンヌ一覧抽出スクリプトをgithubで公開したので、ご自由にお使いください。

https://github.com/ymda/takarazuka-list-generator

コードを実行すると、↓こんな感じのファイルが出来ます。

芸名 読み仮名 誕生日 出身地 出身校 芸名の由来 愛称 役柄 退団年 備考

データはWikipediaのAPIから取得した。wikitableをCSVに変換するときに、要素中の脚注とかリンクとかを消さないと区切りがずれるのが面倒で、結構試行錯誤した。途中、「Webページを直接スクレイピングした方が楽なのでは」とも思ったが、APIを用意しているサイトをスクレイピングするのは「清く正しく美しく」ない気がしたので我慢。
また、基本的には「宝塚歌劇団n期生」のnを1からカウントアップしていくのだが、7期と8期だけ「宝塚歌劇団7・8期生」となっているので置き換えが必要だった。これは「7・8期生問題」と呼ばれている。私の中で。7・8期生は詳細な期が分からないので、便宜上7期生として扱っている。

それ以外も、基本Wikipedia情報なので、信頼性はご自分で判断していただきたい。

もっといい方法がありそうな気もするけど、とりあえず目的は果たしたので、良しとする。
レンタルサーバでcron起動する都合上Rubyを選択したが、あんまり経験のない言語なので自信はない。人の目に触れてブラッシュアップされていくことを期待して公開したので、ツッコミ大歓迎です。他力本願!
あと、Wikipedia側の表の構造が変えられると動きがおかしくなるんで、その時はお知らせいただきたい。対応できるものはしたいと思います。

何なら、直して Pull Request 送ってくれてもいいんですよ。


タカラジェンヌ一覧を作成するためにスクリプトを書いた話」への2件のフィードバック

  1. ピンバック: 宝塚の芸名の頻出文字ランキングを作った話 | ymda blog

  2. ピンバック: 宝塚の芸名を入力しやすくする辞書ツール – ymda blog

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です