ジョンとヨーコのイマジン日記

想像してください。「あなたはぼくをプラグマティストだと言うかもしれない」と歌う、逆イマジンです。

R

SQLiteのためのメモ(Rユーザーであり、かつMacユーザーである人向け)

R

SQLiteは小規模なデータに適したデータベースとされる。 長所:始めるのが簡単 短所:大規模なデータに向かない どの程度までが小規模なデータなのかはよくわからないが、SQLiteでなにか困ることがあれば、そのとき代替(MySQL, PostgreSQL, Google BigQuery…

検定いらずのABテスト:ポアソン分布とベータ分布によるサンプルサイズ設計

R

多くのABテストではクリック数やコンバージョン数などのカウントデータを比較します。ABテストで問題になるのが、 どのくらい差があれば、十分「Bのほうが良さそう」と判断できるのか どのくらいのデータ(クリック数やコンバージョン数)がたまるまでまてば…

トピックモデル(GaP; Gamma-Poisson Model)の ELBO の導出

R

ここでは [math/0604410] Discrete Component Analysis の Gamma-Poisson モデル(GaP)の ELBO (evidence lower bound) を導出する。まず、行列の分解がトピックモデルの一種として解釈できること説明する。次に、モデルのパラメータ推定方法について述べる…

区間打ち切りデータの最尤推定のシミュレーション:JuliaとR

Julia です。 @time using Optim @time using Distributions @time using StatsFuns function make_dat_gamma0(n,a,b) t = rand(Gamma(a,b),n) E_len = rand(Exponential(),n) u = rand(n) E_R = t - E_len .* (1.0.-u) E_L = t + E_len .* u E_L, E_R end f…

変分ベイズで RFM 指標から顧客生涯価値を計算してみる

R

モデルと尤度 RFM 指標から将来の購買回数を予測する Pareto / NBD モデルから派生したモデルに BG / NBD モデルがあります。Pareto / NBD モデルより計算がかんたんです。モデル: 顧客の購買はレート の定常ポアソン過程に従う 顧客の購買のたびに確率 で…

ggplot2でヒストグラムを箱ひげ図風に並べてプロットするパッケージggbrickを書いている

R

これです:GitHub - abikoushi/ggbrick: An R package for brick plotggtetrisって名前にしようかと思ったんだけど、もうある(GitHub - EmilHvitfeldt/ggtetris: Create Tetris Chart Visualizations in R)みたいなので、ggbrickにしました。brickはレンガ…

藤原香織、渡辺澄夫(2006)ベイズ尤度比検定による変化点検出のシミュレーション

R

これです:http://watanabe-www.math.dis.titech.ac.jp/users/fujiwara/doc/fujiwara_ibis2006.ppt.pdfこの研究成果は論文化されているようですが, オープンアクセスではないみたいです:https://search.ieice.org/bin/summary.php?id=j91-d_4_889&category=…

ggplot2 で floating bar chart を書く R のパッケージ ggfloatbar を作っている

R

GitHub - abikoushi/ggfloatbar: Floating bar chart on ggplot2です。インストールは devtools::install_github("abikoushi/ggfloatbar") でたぶんいけます。たぶんまだ不具合とかあると思うし、説明とかぜんぜん書いてないです。なにか要望とか意見、感想…