Statistics

-Python- 共分散,相関係数

Pythonのnumpyのnp.covやnp.corrcoefを使い,データから標本共分散,標本相関係数を求める例のメモです. 関数には, データの次元 x データ数 のサイズのデータ行列を入力します. >>> import numpy as np >>> from sklearn.datasets import load_iris >>> …

期待値と分散

Pythonでは,確率分布からデータを生成するための関数 np.random や scipy.stats として提供されています. サンプルの生成で使うのは,以下のような関数です. 正規分布 np.random.normal(loc = 0.0, scale = 1.0, size = None) オプションのlocは期待値,s…

-Python- サイコロ投げ

等確率で出るサイコロの目をPythonで再現するには,ランダムに要素を取り出す関数 np.random.choice を用います. >>> import numpy as np >>> np.random.choice(np.arange(1, 7), 10) array([5, 6, 3, 2, 1, 4, 3, 3, 2, 2]) >>> np.arange(1, 7) は,標本…

-R- Windows10にRStudioをインストール

WIndows10にRStudioをインストールした際のメモです. まずは,CRANからRStudioのインストーラーをダウンロードします. "Download R for Windows" を選択して,その後,base > Download R 3.6.0 for Windows (3.6.0は現時点でのバージョン)をクリックする…

-R- Jupyter NotebookでRを使う

以前に,Homebrew経由でRをインストールする記事を投稿しました. 今回は,RをJupyter Notebookで使えるようにするための手順のメモです. まずは,ターミナルからRを起動します. $ r 続いて,IRkernelのページにある手順に従って必要になるパッケージをイ…

wekaのインストール

Wekaはニュージーランドのワイカト大学で開発された機械学習,データマイニング用フリーソフトウェアです(関連書籍Data Mining, Fourth Edition: Practical Machine Learning Tools and Techniques ). 以下は,Wekaをインストールした際のメモです.Weka…

-Python- 順列,組合せ

順列,組合せの計算例を以下に示します. 計算例は,REPLで実行しています. 順列 1, 2, 3 の3つのすべての並べ方は, 通りとなります. 順列を求める時には,itertoolsのpermutationsを利用します. >>> import itertools >>> seq = (1, 2, 3) >>> list(ite…

二項分布

Pythonで二項分布のグラぷをプロットすることを考えてみます. 二項分布の確率質量関数は となるので,以下のように実装してみます. xlist = pd.Series([comb(float(M), x) * mu ** x * (1 - mu) ** (float(M) - x)\ for x in range(0, mu+1)]) グラフにプ…