第11回R勉強会@東京(Tokyo.R#11)を開催しました。
第11回R勉強会@東京(Tokyo.R#11)を開催しました!
Rによるデータサイエンス第?部 第6章 自己組織化マップ
発表者 : @bob3bob3さん
Tokyo r 11_self_organizing_map
View more presentations from Bob#3.
- 要は、脳内メーカー(?)
- 大規模データ向け
- 主成分分析や因子分析に比べて、何が変わってくるのかが良く分からない
ggplot2:パッケージ製作者(Wickamさん)の話を聞いて
発表者 : @aad34210さん
ggplot2 110129
View more presentations from aad34210.
- こんな人向け
- デフォルトのplotでは物足りない
- 簡単にきれいなグラフ描きたい
- 基本的な使い方
- ggplot
- qplot
- グラフの重ねがき
- ggplotの場合 : ~+ geo_jitter() + geom_boxplot()のように連結していけばよい
- qplotの場合 : geom = c("jitter", "boxplot")のようにc()で追加
caretパッケージの紹介
発表者 : @dichikaさん
Tokyo r11caret
View more presentations from dichika.
caret便利!
RにおけるHPC 並列計算編
発表者 : @sfchaosさん
R-hpc-1 TokyoR#11
View more presentations from sfchaos.
- High Performance Computing(高性能計算)
- メリット
- 複数のCPUを用いて計算することにより、計算時間を削減できる
- 大規模なデータを管理、分析出来る
- Rの標準機能だけを用いて、大規模データを扱うのはほとんど不可能
- Rの問題 : 速くない!マルチコアを活用できない!オンメモリ!32bit!
- snowパッケージ
- foreachパッケージ
Rで始めるテキストマイニング
発表資料は後で上げます
- マイニング : 面白いことを言う
- テキストマイニングの概要・利点
- ブログや掲示板など定型化されていないものをデータとして収集できる
- 分析できるデータの範囲が大幅に拡大
- データ収集車のフィルタがかかっていない生の声
- パーソナリティを取得し、ターゲティング可能
- 8割くらいでパーソナリティ取得可能
- 活用方法
- 日本の全言語学者を震撼させた「モーニング娘。問題」
- 日本の全言語学者を震撼させている「りりかるなのは問題」