VLDB09報告会で聞いた話
先週のことですが,VLDB報告会というのに行ってみました.
残念だったのは,「キラーアプリケーションはどんなものがありますか?温度とか明るさとか取って何ができますか?」と聞かれて,現状ではキラーアプリケーションというものはなく,火災検知だとか侵入者検知に利用できる,というような答えだったこと.
次は川口先生の無線LAN情報や加速度情報を集めている話.いろいろデータを集めて,実際にサービスにつなげている点が面白かった.
あとはVLDB2009の話.
VLDB2009
論文
発表スライド(一部)
論文の紹介は VLDB2009勉強会であったので(参加してないから分からない)今回はキーノートやパネルディスカッションなど参加しなければ分からない部分の説明でした.
keynote1
Cloud Data Serving: key-value stores to DBMSs
Raghu Ramakrishnan
この人の他の会議でのkeynoteと資料を見ることができます.
- Data Serving in the cloud
http://www.bigredbits.com/?p=175
http://www.cs.cornell.edu/projects/ladis2009/program.htm#keynote1
- Cloud Computing at Yahoo
http://www.cse.iitb.ac.in/~comad/2008/keynoteSpeakers.html
上に挙げた他のkeynoteと同じ話ということで,その資料を見ればいいそうです.
たぶんyahooのクラウドとDBの話.
スライドのComparison MatrixというページがいろいろなDBの比較がまとまっていました.
聞いたことがある名前と思ったら,勉強のために読んでいるDB本の著者でした.
keynote2
Bringing Database Research to Computer Games and Simulations
Johannes Gehrke
コンピューターゲームにDBの技術を利用したらとてもよかったという話?自分は興味がなかったのであまり聞いていなかったが,面白いkeynoteだったらしい.
パネルディスカッション
How Best to Build Web-Scale Data Managers?
ウェブのようなスケールが必要とされる分野において利用されるデータ管理技術が,これまでDB屋が研究してきたものではなく,他のところで発表されていることに対して,議論しましょう,という感じなのか.RDBMS vs MapReduce以下適当に抽出.
・なぜDBを使わずKVS?スケールさせるためにはACIDを犠牲にするしかないのか
・Google規模,ではなくもっと小さい規模のtwitterのようなサービスの規模でもその規模でもDBがスケールしないのが問題
・webでDBが使われなくなってきており,RDBの問題を認めてなくてはならない.我々はRDB中毒.
・ACIDやトランザクションがいるかいらないか,は用途による.アプリケーションが負担する部分を増やしていくことでスケールするシステムが作れる
・パラレルDBは無限にスケールすべきだが,スケールしない
・SQLは分散を意識していない.だからSQLでなくてもいいのでは.REST的なAPIがあればいいんじゃないか
・やっぱりトランザクションはいるよ.データを問い合わせるのにMapReduce書かなきゃならないなんて面倒
などなど.面白かった.
HadoopDB
そのあと少し論文の紹介があったけど,自分が聞きたかったこれだけ紹介.HadoopのスケーラビリティとパラレルDBのパフォーマンスのいいとこ取りをすれば,いいものができるはず!という感じ.
パラレルDBの方がパフォーマンスがいいというのはSIGMOD2009の A comparison of approaches to large-scale data analysisで発表されていて,同じ人たちがHadoopDBを作ってベンチマークしてみた,という発表.
スライドはDetailed Program | VLDB 2009にあるので,それを見ればなんとなく分かります.評価は微妙かも・・・という感じ.
その他メモ
Hive:HadoopのSQLラッパーVertica: カラムストアのクラウドエディション?
MonetDB: カラムストアDB.10年前のVLDBで発表されて,今回10-year Award(10年前に発表されて,その後影響を与えた論文)に選ばれた.
大島さんの発表は面白く聞けてよかったです.
Tweet
Tags: db, hadoop, kvs
