TokyoRの第36回R勉強会に行ってきました

珍しく勉強会参加報告。
これ -> http://atnd.org/events/47713

統計解析に特化した言語なので発表内容もその方面に偏るわけだが、
とは言ってもいろんなドメインがあって、手法もそのぶんいろいろあるので
よく聞く話から今まで全く知らなかったことまでいろいろ聞けて面白いものだ

あと、難しい話はしないので詳しく知りたい方はslideshareを見てください

というわけで内容まとめるよ

10分で分かるR言語入門 ver2.6

Rの文法やCRAN、お役立ちサイトなどの紹介
タイトルから分かるようにこれからRを始める人に向けた内容だった

10分しか話してない(実際の発表時間は計ってませんw)ので導入といった感じ

Rによるやさしい統計学 「第20章 検定力分析によるサンプルサイズの決定」

銀座で働くデータサイエンティスト( http://tjo.hatenablog.com/ )として有名なTJOさんの話

対立仮説が真であるときにどのくらいの確率で採用されるのかから始まり、

鉛筆の平均サイズが0.1mm違うってのに有意差があったとして、変えることにコストを払うだけの価値があるのか?
ってのを導入として例に上げ、Effective sizeというどの程度効果があるのかについてと、
どのくらいの効果を期待してるならどのくらいのサンプルが必要かってお話でした

knitrパッケージではじめる「R MarkdownでReproducible Research」

RPubsにも
http://rpubs.com/teramonagi/TokyoR36_Basic
http://rpubs.com/teramonagi/TokyoR36_Advanced

R Markdawnは
RStudioでおなじみknitrを使ってMarkdonwの中にRのコードをいれてそのままHTMLでレポートをかけちゃう
便利なやつ

詳しい機能紹介がされているのでRでコード書いてそのままレポートにしたいぜって方や
分析内容をまとめるてる途中で「あ、これ間違ってた。数値出し直さないと」ってことがよくある人は
読んでおくと幸せになれると思います。

あとMS Wordやtexでの提出が求められている場合の対処法も書かれているので、それらが好きな人は気をつけてくださいw

変態にRを与えた結果がこれだよ...9 RでSPADEとSNEを使って次元削減と可視化

坊主頭の変態が京都から来てなんか話してる・・・
とまずは書いておいたほうがいい気がしたので先に書いておく

相変わらずこの人は題材が面白い

SPADEが木構造のようなものを使った分類で、SNEはクラスタリングのようなもの?
内容は結構難しい話だったのでその場ではちゃんと理解できず・・・ちゃんとスライド見直して理解します。

あと、ニート卒業おめでとうございます。
本も楽しみにしてます。

EasyHTMLReport

R Markdownで作ったレポートをそのままメールで送れるライブラリを作った話
これでもうwordなんて必要なくなる!
さらにsimpleHTMLReportを使えばデータを関数に渡すだけでMarkdownすら書かなくて良くなる!

メールで報告おkな環境なら世の中がとても楽になる逸品かと

Rで学ぶ離散選択モデル

まさかの資料作成間に合わずw
後ほどちゃんとしたものを上げるとのことでしたので見つけたら追記します。

内容としては回帰分析の基礎的なことを説明した後、
mlogitパッケージで多項ロジットモデルをおこなう話でした。

ゲームパラメータの決定方法

ここからはLT大会での内容となります。

発表資料見つからず...

ゲーム中の強いレアモンスター2種類とそいつを倒す強さになるのにどの程度の課金が想定されるか
というのを例題

課金されればされるほどいいんだけどレアモンスター出しすぎるとゲームバランスが崩壊するので
シンプレックス法というのを用いて出現させる的の最大数などの制約がある状態で
課金額を最大にするには各レアモンスターの出現数をどう割り振ればいいかを求める話

linprogというパッケージでシンプレックス法を利用できるらしい

Rで見るサーモンの価格周期性

輪廻を続ける鮭の養殖業会に対して我々はなにか打つ手は無いのか

経済学のことは中学時代に習った需要と供給の曲線くらいしか分からないので、詳しいところまでは理解できなかったが、
そのような状態で価格分析する操作変数なるものを使うらしい

Rと確率分布

いろんな確率分布の紹介
分布同士の関連図が印象的

ZDNetでデータサイエンティスト講座を連載中とのこと
http://japan.zdnet.com/business-application/sp_14data_scientist/

Rで部分空間法

部分空間法というものをライブラリを使わずにRで実装した話
KaggleにあるDigit Recognizerをやってみるも結果はかんばしく無かったとのこと

パラメータチューニングなどはちゃんとやってないとのことだったので、
その辺をしっかりやると結果がどうなるのかが気になるところ

dplyrパッケージ徹底解説

検索結果のトップはこちら -> http://d.hatena.ne.jp/dichika/20140103/p1
発表内容のパッケージは予想外すぎてワロタw

RStanで作る人工データ

発表資料見つからず...

なぜ人工データを作るのかはたのしいからだそうですw
Stanというのを使って人工データを作る話なのですが、Stanを使ったことが無い(というかこの発表で初めて聞いた)ので
あまり理解できず・・・

MCMC法を使って独立ではないランダムサンプリングをするらしい

おしまい

以上となります。

総じておもったことはどうしても分析対象のドメイン知識が必要となる分野なので
やはり好きでやってることは強いなということでした。