2011-07-07 覚え書き あっちへふらふら、こっちへふらふらしがちなので一旦整理。 処理の流れ データ取得:もらってくる、webから取得 データハンドリング・統計処理:R(大規模データの場合はサンプリング、またはHadoop等の分散処理を考慮) 可視化:R、HTML、openFrameworks(Cinder?) 今後やるべきこと パーサの使い方習得(RのXMLパッケージは使いづらいので他のものを検討) 可視化の幅を広げる→分析とアプリとで分けて考える 文書データを扱う場合の統計処理・可視化手順の確立