覚え書き

あっちへふらふら、こっちへふらふらしがちなので一旦整理。

処理の流れ

データ取得:もらってくる、webから取得
データハンドリング・統計処理:R(大規模データの場合はサンプリング、またはHadoop等の分散処理を考慮)
可視化:R、HTML、openFrameworks(Cinder?)

今後やるべきこと

  1. パーサの使い方習得(RのXMLパッケージは使いづらいので他のものを検討)
  2. 可視化の幅を広げる→分析とアプリとで分けて考える
  3. 文書データを扱う場合の統計処理・可視化手順の確立