第22回Tokyo.Rを開催しました

4/28に第22回Tokyo.Rを開催しました!

- http://atnd.org/events/26386

内容

まだ資料が出そろってないので、とりあえず自分のやつだけ載っけておきます。

懇親会とかで話してて気付いたんですが、傾向スコアとUplift Modellingが切る軸とか図が似てる&自分の説明不足で混乱させしまってる感があるので、次回はそこら辺を整理した内容で発表しようかな〜と思っています。

次回

次回は、5/26に開催予定です!
今日(4/29)の時点で、もう50名を超える登録があり、すごくビックリしています!

興味のある方は、是非ご参加ください!

CentOS 5.7にemacs23.4をインストール

@a_bickyが、EmacsのPigメジャーモードを公開してくれたので、早速使ってみたら、以下のようなエラーが出た

Symbol's function definition is void: syntax-ppss

syntax-ppssってのが空との事だが、どうやらCentOSでデフォルトで提供されているEmacsのバージョンが低いのが原因らしい。

いろいろ不満もあったので、emacs23.4をいれる事にした

$ sudo yum remove emacs-common emacs-21.4
$ wget ftp://ftp.gnu.org/pub/gnu/emacs/emacs-23.4.tar.gz
$ tar zxvf emacs-23.4.tar.gz
$ cd emacs-23.4
$ ./configure --without-x
$ make
$ sudo make install

これで、無事pig-latin-modeを使えるようになった

第21回Tokyo.Rを開催しました!

2012/3/10に、第21回Tokyo.Rを開催しました!

@aad34210: 続・はじめてのR (30分)

R言語の初心者向けの発表。
プログラミングの基本である条件分岐とループから、
R言語の基本機能であるグラフ作成、そして統計解析という盛り沢山な内容でした!

@holidayworking: Rによるデータサイエンス第16章 集団学習 (30分)

アンサンブル学習のアルゴリズムをcaretパッケージを使って比較

  • バギング
  • ブースティング
  • ランダムフォレスト

⇒ ランダムフォレストが1番精度が高かった!

@Hiro_macchan: 観察データのバイアス調整 (30分)

Rを使って観察データのバイアスを調整した上で因果効果を推計する方法についての発表
回帰分析と傾向スコアは、”強く無視出来る割り当て条件”を仮定してるので、この仮定が崩れると
正しく推計出来ない
⇒ 操作変数を用いた推計



ちなみに、因果効果については、自分も過去に発表してるので、ついでに紹介しておきます

@horihorio: RでGARCHモデル (30分)

突発的な変動と、その後の「荒れ」が続き、誤差項が「独立かつ同一の分布」でない
=> 分散にも時系列構造を導入

GARCHモデルは分散を推定するのでマイナスになってはいけない。
正規分布以外では最尤推定量は間違っている。

時系列データを扱う時は、まず単位根検定を行う

@yokkuns: Uplift Modelling (15分)

  • 質疑応答
    • 相互作用は何と何の相互作用
      • 介入効果とグループ効果の相互作用。
        • 対照群の介入効果を0、Lグループのグループ効果を0と置いて定式化している
    • 傾向スコアとの違い
      • 傾向スコアは、 欠測モデルで、処置群での平均と - もし処置群が介入されていなかった場合の平均を共変量を用いて推定して、介入効果を推定するモデル
      • uplift modellingは、(Rグループでの処置群と対照群の差) - (Lグループでの処置群と対照群の差)を最大化するように2群に分類するモデル

@bob3bob3: RでPSM分析 (10分)

atg: オタク的な標準偏差 (10分)

@teramonagi 菩薩でもわかる!Rで動かすExcelアドインの作り方 (10分)

菩薩の説明

メリット

  • 管理者権限なしでOK
  • 作成物の配布が楽

デメリット

  • いずれかの.NET系言語かけないとつらい
  • データフレームとか渡せない?

@wdkz: R嫌いな人に強引にRを使わせる(10分)

  • Rコマンダーの使い方やカスタマイズ方法
    • Rcmdr
  • Webアプリ作っちゃう
    • Rook
    • rApacheの方が良いかも

@millionsmile : 二部グラフを使ったソーシャルネットワーク (10分)

テロリストネットワークが分かる2部グラフ

  • どこの集会にいたかなど

@sleipnir002: Rで音声を再生(10分)

次回

次回は、4/28に開催予定です!
LT募集中なので、是非!

Uplift Modelling: 費用対効果の最大化を目的とした最新のデータマイニング手法

ざっくりとまとめてみた

Rで楽に実装する方法が無いか調べてるんですが、既存のものでは難しそう。。。
もう少し調べてなければ、頑張ってパッケージ化したいと思います!

[ECCUBE][メモ]EC CUBE構築メモ

ふと思い立って、EC CUBEを構築してみたのでメモ。
(最近全然出来てないですが、実は、コミッターだったりします)

データベースの設定

まずはデータベースの設定。
今使っている環境は、個人用のmysqlを動かしているため、tmysqlというコマンドになっています。(tmysql)

$ tmysql -u root -p

mysql> create database sample_shop default character set utf8;
mysql> quit;

パッケージの展開

EC-CUBEダウンロード | ECサイト構築・リニューアルは「ECオープンプラットフォームEC-CUBE」から最新版をダウンロード

$ mkdir sample_shop
$ cd sample_shop/
$  mv ~/tmp/eccube-2.11.4.zip .
$ unzip eccube-2.11.4.zip

データベースへの接続部分の修正

上に書いたように、自分の環境は、mysqlの設定が特殊なため、ちょっと修正する必要がある。
なので、該当箇所を探して修正する
(通常は、こんなことしなくても大丈夫です)

  • とりあえず、grep
$ cd eccube-2.11.4
$ grep -n -r "mysql_connect" *
data/module/MDB2/Driver/mysql.php:529:        $connect_function = $persistent ? 'mysql_pconnect' : 'mysql_connect';
  • data/module/MDB2/Driver/mysql.phpで、mysqlへの接続をしてるようなので、このファイルを編集
$  cd data/
$  emacs module/MDB2/Driver/mysql.php
  • diff
@@ -501,6 +501,7 @@
       }

       $params = array();
+        /*
       if ($this->dsn['protocol'] && $this->dsn['protocol'] == 'unix') {
           $params[0] = ':' . $this->dsn['socket'];
       } else {
@@ -510,6 +511,8 @@
               $params[0].= ':' . $this->dsn['port'];
           }
       }
+        */
+        $params[0] = 'localhost:/home/yokkuns/tmp/mysql.sock';
       $params[] = $username ? $username : null;
       $params[] = $password ? $password : null;
       if (!$persistent) {

あとは、通常通りブラウザからアクセスして、インストーラー通りに進めるだけ。

install/index.phpの削除

インストールが終わると、install/index.phpを消せと言われるので、削除する。
自分は、一応、バックアップで残すようにしてるけど、普通に削除でオッケー。

$ cd ../html/install
$  mv index.php ~/backup/eccube/install/bk_index.php

確認

以上で、こんな感じで出来上がる。
ショッピングカートもデフォルトで実装されており、デザイン変えて、商品登録すれば、そのまま使えそう。

http://gyazo.com/02b0b948aaac9ba3d8f835af465d5a75.png

おまけ

メールテンプレートの設定

会計の方法として、デフォルトで銀行振込が用意されているものの、
管理画面で口座を設定する箇所がなかったので、メールテンプレートをいじってみた

$ cd data/Smarty/templates/default/mail_templates/
$ emacs order_mail.tpl
  • diff
@@ -93,4 +93,13 @@
今回加算される予定のポイント <!--{$arrOrder.add_point|default:0|number_format}--> pt
現在の所持ポイント <!--{$arrCustomer.point|default:0|number_format}--> pt
<!--{/if}-->
+
+<!--{if $arrOrder.payment_method == "銀行振込" }-->
+ hogehoge銀行
+ 普通口座
+ 口座番号:12345
+ 口座名義:fugafuga
+<!--{/if}-->
+
<!--{$tpl_footer}-->

第4回複雑ネットワーク勉強会

第4回複雑ネットワーク勉強会のメモ

WSモデルの解析

  • Lが厳密には定義出来ない
    • 空間について連続近似を行う
    • 頂点が輪の上に連続的に分布していると見なす事で、空間微分が使え、計算が易しくなる
単位時間に輪の上を枝一本分の長さだけ進むインクを考える
  • N_r(t)が減る速度
    • \frac{dN_r(t)}{dt} = -2 B(t)\frac{\langle k \rangle}{2}
  • 近道の数
    • N\langle k \rangle p/2
  • 近道の端点は、2倍なので
    • N\langle k \rangle p
  • 端点の密度
    • N\langle k\rangle p/N = \langle k \rangle p
  • 単位時間に1つの区間が近道に会う確率
    • \langle k \rangle p \times \langle k \rangle
      • \langle k \rangleをかけているのは何故?
        • ⇒ 単位時間あたりのスピードみたいなもの。k=2のとき、左右に、\langle k \rangle / 2進むので、合わせて\langle k \rangle
  • 渡った先の頂点にまだインクが到達していない確率
    • N_r(t)/N
  • B(r)個の区間のそれぞれでおこっているので、ステップ2によって単位時間に増える区間数は
    • \langle k \rangle^2p\times(N_r(t)/N) \times B(t)
  • ギャップの大きさxの分布P(x)は整数0とN_r(t)の間に等確率でばらまいたB(t)-1個のしきりのうち、最も小さいしきりの位置に等しい
    • ⇒ ↓

http://a8.sphotos.ak.fbcdn.net/hphotos-ak-ash4/428665_10150536506618093_601323092_9227085_119593811_n.jpg

millon's time「二部グラフの基礎と応用」

2012年抱負

明けましておめでとうございます!
今年最初のエントリは、今年の抱負です。

去年は、個人的な目標として転職を考えていて、5月の段階で達成して、その後は目の前の事でいっぱいいっぱいになり、先の事が全然見れてなかったような気がします。
なので、今年は、1年通して続きそうなものにしたいと思います。

1.朝型の生活

一昨年は、5時くらいに起きて、朝走るという生活をしてたんですが、去年は終電とかに帰ったりするなど、夜型になってしまいました。
結果的に家族との時間が取れていなかったり、プライベートでの連絡がおろそかになったという反省があるので、今年は朝型に戻したいと思います。

2.アウトプットの質を上げる

これは、別にレベルの高い事をするとかではなくて、アウトプットするまでの準備をしっかりすると言うことです。
去年は、仕事、プライベート共に、見積もりが甘過ぎて、準備不足のままアウトプットするという事が多発したので、今年はそれを改善していきたいと思います。

3.家計簿をつける

去年は、よく分からない出費が多くて金欠になる事が多発したので、今年こそは、ちゃんと付けたいです。
月一くらいで、何か分析してみようかなぁ〜

4.英語

今まで、抱負や目標として持つことは避けてきたんですが、エンジニアは、英語から逃げられないことを去年痛感しました。
今年は少しでも上達するために、これを抱負に加えたいと思います。
目標は、とりあえず、TOEIC 200点アップです。

勉強会等

アウトプットと少し被るんですが、去年は、会場で資料を完成させるなど、準備不足感がやばかったので、今年はそんな事にならないように、計画的に行動したいと思います!


それでは、今年もよろしくお願い致します!