第21回Tokyo.Rを開催しました!

2012/3/10に、第21回Tokyo.Rを開催しました!

@aad34210: 続・はじめてのR (30分)

R言語の初心者向けの発表。
プログラミングの基本である条件分岐とループから、
R言語の基本機能であるグラフ作成、そして統計解析という盛り沢山な内容でした!

@holidayworking: Rによるデータサイエンス第16章 集団学習 (30分)

アンサンブル学習のアルゴリズムをcaretパッケージを使って比較

  • バギング
  • ブースティング
  • ランダムフォレスト

⇒ ランダムフォレストが1番精度が高かった!

@Hiro_macchan: 観察データのバイアス調整 (30分)

Rを使って観察データのバイアスを調整した上で因果効果を推計する方法についての発表
回帰分析と傾向スコアは、”強く無視出来る割り当て条件”を仮定してるので、この仮定が崩れると
正しく推計出来ない
⇒ 操作変数を用いた推計



ちなみに、因果効果については、自分も過去に発表してるので、ついでに紹介しておきます

@horihorio: RでGARCHモデル (30分)

突発的な変動と、その後の「荒れ」が続き、誤差項が「独立かつ同一の分布」でない
=> 分散にも時系列構造を導入

GARCHモデルは分散を推定するのでマイナスになってはいけない。
正規分布以外では最尤推定量は間違っている。

時系列データを扱う時は、まず単位根検定を行う

@yokkuns: Uplift Modelling (15分)

  • 質疑応答
    • 相互作用は何と何の相互作用
      • 介入効果とグループ効果の相互作用。
        • 対照群の介入効果を0、Lグループのグループ効果を0と置いて定式化している
    • 傾向スコアとの違い
      • 傾向スコアは、 欠測モデルで、処置群での平均と - もし処置群が介入されていなかった場合の平均を共変量を用いて推定して、介入効果を推定するモデル
      • uplift modellingは、(Rグループでの処置群と対照群の差) - (Lグループでの処置群と対照群の差)を最大化するように2群に分類するモデル

@bob3bob3: RでPSM分析 (10分)

atg: オタク的な標準偏差 (10分)

@teramonagi 菩薩でもわかる!Rで動かすExcelアドインの作り方 (10分)

菩薩の説明

メリット

  • 管理者権限なしでOK
  • 作成物の配布が楽

デメリット

  • いずれかの.NET系言語かけないとつらい
  • データフレームとか渡せない?

@wdkz: R嫌いな人に強引にRを使わせる(10分)

  • Rコマンダーの使い方やカスタマイズ方法
    • Rcmdr
  • Webアプリ作っちゃう
    • Rook
    • rApacheの方が良いかも

@millionsmile : 二部グラフを使ったソーシャルネットワーク (10分)

テロリストネットワークが分かる2部グラフ

  • どこの集会にいたかなど

@sleipnir002: Rで音声を再生(10分)

次回

次回は、4/28に開催予定です!
LT募集中なので、是非!