今月23日、IBMが様々なデータをユーザがPOSTし、それを色々な形式で視覚化しながら分析、発見を共有しあうソーシャルサービスを開始しました。
データはテキスト形式で、例えばExcelから普通にコピペするだけでも大丈夫です。
既に幾つもの面白いデータが上がっていますが、ざっと見た感じではアカデミックな議論が沸騰しているようなデータは、まだ無さそうでした。
しかし、Javaベースでサクサク動くグラフモジュールはさすがIBM。
その場で座標軸をFlipしたり、エリアチャートで差分をインタラクティブに見られたりと、「何かを発見できそうな」気にさせてくれます。(実際はデータマイニングはグラフを眺めているだけで出来るものではないですし、現時点でアップロードされているデータフォーマットも数値と率が同軸に混在していたり、トータル行が付いていたりと「お試し」的な甘いものが多いようですが)

例えば「炭酸水の呼び名分布」というデータがあったので見てみます。
ソータと呼ぶかポップと呼ぶか、あるいはコークか。州ごとに回答数が入ったデータを元に、地図上に色分けしたりバブルチャートで見てみたりできます。
「北部、中部、南部できれいに分かれるなぁ」とか「Missouriは激戦区だなぁ」とかがわかるくらいですが、もしかすると炭酸水メーカーはこれを見て「3種類のボトルを作り、適切な州に出荷しよう」と思ったりできるのかもしれません。(この例は既に当然そうしているでしょうが)
これが「感想の羅列」を抜けていくことができれば、「データ」を軸にした新しいソーシャルネットワークの形として認知されていくかもしれません。
とりあえずIBMとしては、データ分析を広く一般に委託する「クラウド・ソーシング」の実験として立ち上げたサイトということですので、エンジニアや学生が多角的な分析手法を高めあう場として参集してくれれば思惑通りといったところでしょうか。


コメント