第17回R勉強会@東京(#TokyoR)を開催しました!

第17回R勉強会@東京(#TokyoR)を開催しました!

以下、メモです。

発表枠

@teramonagi: Rによるデータサイエンス第12章「時系列」 (30分程度)

概要 : テキスト「Rによるデータサイエンス」に沿ってRでの時系列の扱い方を解説します。

  • メモ
    • ラグ処理 : lag関数
    • 差分処理 : diff関数
    • 時系列で使う統計量
      • 平均
      • 自己共分散
      • 自己相関
    • 自己相関のplot
      • act(UKgas, ci=0.9)
      • ci : 信頼区間
      • 青の点線を超えていると、自己相関があると言って良いということ
    • 自己相関をなくす処理 = ラグ処理
    • 相互共分散、相互相関ccf
    • スペクトル分析 = 周期性の解析
      • 基本的な概念 : 周波数で物事を考える。波の重ね合わせで物を見る
      • ピリオドグラム : spec.pgram(y, log="no")
    • expand.grid(p,d,q) で全組み合わせを計算してくれる
    • GARCHモデル
      • Not 時系列自体 But 分散 のモデル
    • 成分の分解
      • 観測値 = トレンド + 周期変動 + 残差
@holidayworking Rで解く最適化問題 – 線型計画問題編 – (30分)

概要 : 「最適化法」を参考書にして最適化問題をRでやってみようと思います。第一段は最適化問題の基礎と線型計画問題について説明します。

  • 最適化問題とは 
    • 与えられた制約条件の元で、ある目的関数を最小化にする解を求める問題
  • 最適化問題の答え
    • 実行不可能
    • 実行可能 - 非有界
    • 実行可能 - 最適解が存在

数式が多かったので、メモが間に合わず・・・


@kos59125: 近似ベイズ計算でカジュアルなベイズ推定(20–30分)

概要 : 近似ベイズ計算を用いると複雑なモデルでも簡単にベイズ推定が行えます。その手法と実例を紹介します。

  • 観察データを得る事で、事象が起こるであろうという信念は変化する
  • 尤度計算が面倒くさい => 近似ベイズ計算
  • 近似ベイズ計算
    • 尤度を直接計算せずに、近似することで複雑な計算を回避
  • カーネル密度推定(Retangular Kernel)
  • 集団遺伝学
    • 集団における遺伝的組成の変化を研究する学問領域
    • コアレセント理論
    • 全ての対立遺伝子は、単一の祖先対立遺伝子に由来
@yokkuns: Rで学ぶ傾向スコア解析入門 (30分)

概要: 因果推論とか傾向スコア解析とかその辺の話題についてやってみたいと思います。
参考文献: 調査観察データの統計科学

@mangantempy: サーバ異常検知入門 (30分)

概要 :サーバーの負荷を統計的に分析してみようと思います。実際の観測値を時系列モデルに当てはめてグラフに描画する方法などを解説します。

  • アラートがあがってからじゃ、大体遅い => 監視して、統計的手法で事前に検知出来ないか?
  • ディスク容量が、あと何分であふれるかを予測
  • 日付が、2011-09-24(今日)!
@yuuukioii  Rによる計量経済学入門(20分)

概要 : ロジット分析を計量経済学的観点からやってみたいと思います。

  • 計量経済学とは
    • 計量経済学 : 「経済モデル」が現実に沿ったモデルんかを証明するためのツール
    • 統計学の延長上にある。ほとんど統計学と同じ
  • 計量経済学の流れ
    • 1.経済モデルを立てる
    • 2.実際のデータを使って統計的に「推定」「検定」
    • 3.経済予測や政策評価、政策の策定
  • ロジットとは
    • 分析対象が数値データではない時
    • 「車を購入するかどうかの決定要因」
  • ロジット
    • 二項ロジット
    • 多項ロジット
  • Conditional logit : 条件付きロジット
    • 選択肢jに依存
  • Mixed logit: 混合ロジット
    • 個人iと選択肢jに依存
  • Mixed logit: 様々な制約を取り払った最もgeneralizeされたロジット
  • ロジットモデルの制約
    • 全ての選択肢の効用の係数は識別出来ない
    • 識別出来るのは差のみ

LT枠

@dichika: TokyoR等の軌跡(5分)

概要: 私たちのこれからを考えるためにも今までどのような発表があったのか整理したいと思います。

Tokyor17
View more presentations from dichika

@tsutatsuta: Rで富士山を描いてみた(5-10分)

概要: x, y, z 軸で表せるデータ(3次元のベクトル)を,image,scatterplot3d,persp関数などを用いてグラフ化する方法について.せっかくなので富士山をグラフ化してみます.


@wakuteka: Tsukuba.Rの軌跡(5分)

Tsukuba.Rが、メンバーの就職で最近出来ていないので、近い人一緒にやりましょう!

飛び入りLT

@gepuro: ログ解析

クラスタリングしたよ!