Cloudera World Tokyo 2013に行ってきました

Cloudera World Tokyo 2013行ってきました

http://www.cloudera.co.jp/jpevents/cwt2013/index.html

で、聴講したセミナーの報告会を社内で行いました。

僕が聴いてきたのは以下の二つ。(本当は朝から行きたかった!)

  • セミナー1:Amebaにおけるログ解析基盤Patriotの活用事例

  • セミナー2:並列分散処理を利用したインターネット選挙データ分析のご紹介

    • 株式会社ブレインパッドアナリティクスサービス部
    • ゼネラル・マネージャー 佐藤 洋行氏
    • ※資料みつからず

まず、Amebaのログ分析の規模感と実際のアーキテクチャについて聞いた。 へー、1000Hostsに対してaggrigator10台かーとか、GHEとJenkins使ってるのねーとか。 弊社でも何かしらログ分析基盤導入したら良いんじゃないかなと考えているので参考になった。

次にブレインパッドのネット選挙の話は、始めに「Hadoopの話ではありません!」と宣言したように、Hadoopを使おうか考慮して結局使わなかった話だった。分析するにあたって、データ調達元から頂いたHTMLデータが予想より大量で(予想:数十GB->現実:数十TB)アイルランドのAWSからどうやってローカルに持ってくるんだよ!って苦労した話が悲壮感たっぷりだった。あまり、それをどう分析したかというところにはツッコまなかったので少し拍子抜けだった。

帰り掛けに寄った展示スペースでは、Tableauのデモが綺麗で面白かった(そして営業がしっかりしてた。後追いのメールやEightを使った名刺交換など)。ただ、使いこなせないだろうな感凄い。スタンフォード大の研究所発で、今年11月に日本法人立ち上がったばかりらしい。

一緒に行ったFさんによると、昔参加したときよりBI側の展示や公演も増えて最近の潮流を感じるそうな。

Fさんは3回もオライリーガチャをやってた。子供が動物本好きなんだってさ。 僕は一回やってThink Statsの魚と良く分からない猿と、良く分からないアナコンダのキーホルダーを手に入れた。

Fさんはアクセンチュアの講演が良かったって言ってた。センサーデータを分析する取り組みが面白かったとのこと。あと、引用していた印象的だった言葉。

"Invest the infrastructure.

DataFirst, question later.

Store first, structure later.”

Jeffrey Hammerbacher - SINAInnovation 2012.11.12

最後に、イベントに負けず会場だった雅叙園は素晴らしい場所だった。 こんなところで結婚式あげたいものですね。

f:id:wonderthinkanswer:20131114223356j:plain