2013/11/14

素人だけどニコニコデータ研究会行ってきた 感想レポート3 Med_KUさん/toritorixさん/川畑泰子さん


こんにちは!前回、前々回と引き続き、ニコニコデータ研究会レポートです!
もう世間でデータ研について書いている方はいなくなりまして、第一回レポートでの石井晃先生がいっていらしたTwitterは突発的に盛り上がるが、ブログでは話題が続くというのにぴったり当てはまっているなと感じているところです(笑)

では!たった五分でデータを語り、カオスなLT発表続きです!

まずは
Med_KUさん 関西弁の軽快な方でした。

この方も、ニコニコ動画のビッグデータである、ニコニコデータセットを使われていて、さまざまなVOCALOID(以下ボカロ)の同一動画内での共演数を時系列的に分析していくことでボカロがどのように盛り上がってきたのかを調べたそうです。
そこで、主に初音ミクを中心として分析されました。

そもそもですが、実は初音ミクが初めてのボカロではないんです。MEIKOが2004年に発売され、更に海外製のローラというものもあって、一次ブームだったそうです。でも、今ほどではなく、一気にボカロ人気になったのが
2007年初音ミク登場後。そこからまず、MEIKOとコラボさせたものがでてきて、その後の鏡音リンレンや巡音ルカなど公式キャラクターが増えて、どんどんコラボされていきました。また、UTAUと呼ばれる、ユーザーが個人でも作れるVOCALOIDみたいなものがありまして、それとコラボさせていくのも増えたそうです。

そして今までの分析の結果、UTAUの人気に陰りがでてきて投稿動画の減少傾向がみられたそうです。
そしてこれも、根性マイニングだそうです すごい。

Med_KUさんの使われたツール Rとpython
ーーー
toritorixさんは一風変わったお話で、

データ好きの人をどうやって呼んだらいいのかというお話です。
データサイエンティストと、呼べる人について論理的に考えた結果、有名学会誌に論文が載るくらいの人なのではないか。という結論になったそうで、
「俺たちはデータサイエンティストではなかった」という衝撃を会場に与えられていまして、会場が笑いに包まれたり、深刻な香りもしたり、なんだかよくわからない空気になりました。
toritorixさんいわく、データ研究会登壇者のようなベイズの定義を知ってたり、R(統計解析向けのプログラミング言語及びその開発実行環境)おまかせ!な人達は、データエンジニアと呼ぶにふさわしいという結論だそうです。
又、世の中に○○アナリストという肩書を持った人がいますが、大概信用できない。うさんくさいから気を付けて!というのが余談でした(いや、本題なのか??笑

ーーー
最終的に来場者投票をダブルスコアでダントツ一位だった川畑泰子さん
は、大学で研究されている、toritorixさん流でいくと、未来のデータサイエンティストです。
ちょっとテーマが面白くて、
江戸の川柳と浮世絵を根性マイニング路線で分析したそうです。
具体的には、江戸時代の歌舞伎は、浮世絵や川柳によって広告されたり、口コミのように広まったりしたそうなのですが、それらの広告や、役者番付、来場者数などをなんとほぼ目視で分析したそうです。 神です。

助六かめしゃん


具体的な分析方法ですが、
川柳の場合、まずすべて打ち込んだそうです。
しかしたいへんなのはここから。歌舞伎役者はまず中村屋!などの屋号もありますし、そのほかにもあだ名や隠語がいくつもあったりします。それもすべてピックアップして数えたそうです。すごい...
そしてそんなんじゃないのが浮世絵。 
浮世絵のなかでも、背景、柄、認可のあるなしや、文字の内容までもすべてチェックして別物として数えたそうです。
川柳、浮世絵など総データ数はなんと何万点にもなったそうです。

そして分かったことが、
演目の初公演では、役者の人気より、ストーリーの良しあしが江戸時代の人には重要だったそうです。シビアですね。

今丁度歌舞伎座で配役を変えて二か月連続で仮名手本忠臣蔵という演目がやっているのですが、11月の公演は公演期間中でも普通にチケットが取れたのですが、12月の花形俳優(若手)や、有名俳優も出るほうではチケット発売日にほぼ完売だったそうで、分析とは条件は違いますが、現代の方が役者で演目を選ぶ人がおおいのかなと思いました。

そして、川畑さんは基調講演をしてくださった石井晃先生と研究していらっしゃるそうで、石井先生の数理モデルを使ったら、江戸時代の客員動数も予測できたそうです。

川畑さんは、解析した沢山の川柳や浮世絵のデータを、キーワード画像検索ですぐだしてこられるような、タイムスリップ画像検索をつくりたいそうです。
出来たら使いたい!!

実は私、このごろ歌舞伎がマイブームでして、一幕見という安く短時間見られるやつに何回か行っていてそれもありすっごくこのお話が面白かったです。実はこのニコニコデータ研究会は歌舞伎座タワーで行われていたのですが、演目が見られなくて残念とおもっていたら、まさかこんなお話が聞けるとは思っていませんでした。


資料は早稲田演劇博物館など、国内外のさまざまな場所のもので、実際に足を運んだそうです。ほんとうにすごい。


☆画像は、私が好きな演目、助六所縁江戸桜の助六より、助六かめしゃんです!
かめしゃんサイトはこちら!

前々回の石井晃先生基調講演は こちら!

前回の筑波大学図書館メディア研究科/nobiさん/ありらいおんさんは こちら! 

当日様子がtogetterにまとまっています。
ニコニコ学会β 第3回データ研究会 まとめ - Togetter
http://togetter.com/li/588735

当日の生放送はこちらから。視聴期限は1週間です。
http://live.nicovideo.jp/watch/lv158628405

次回は、LTのつづきをレポートします!是非見てね!

---
ブログランキング参加中です! ぜひぽちっとお願いします


0 件のコメント:

コメントを投稿