Numpy

-Python- 主成分分析

主成分分析に関するメモです. 主成分分析を行うには scikit-learn パッケージを使用して,sklearn.decomposition の PCA でインスタンスを生成します. 以下の例では,Davis データを用いて主成分分析を行っています. Davisデータ(Davis.csv)はJupyter N…

-Python- 交差検証法によるテスト誤差の推定

K重交差検証法によってテスト誤差を推定する際のメモです. K重交差検証法の計算プロセスは以下のようになります. 学習方法と損失:チューニングパラメータをもつアルゴリズム,損失 入力:データ 入力データを要素数がほぼ等しいK個のグループに分割する.…

損失関数,トレーニング誤差,テスト誤差

データ数を20,10組のデータセットに対してトレーニング誤差をプロットした際の実装例のメモです. まずはパッケージを読み込みます. >>> import numpy as np >>> import matplotlib.pyplot as plt >>> import scipy.stats >>> パラメータ範囲を設定します…

-Python- 共分散,相関係数

Pythonのnumpyのnp.covやnp.corrcoefを使い,データから標本共分散,標本相関係数を求める例のメモです. 関数には, データの次元 x データ数 のサイズのデータ行列を入力します. >>> import numpy as np >>> from sklearn.datasets import load_iris >>> …

期待値と分散

Pythonでは,確率分布からデータを生成するための関数 np.random や scipy.stats として提供されています. サンプルの生成で使うのは,以下のような関数です. 正規分布 np.random.normal(loc = 0.0, scale = 1.0, size = None) オプションのlocは期待値,s…

-Python- サイコロ投げ

等確率で出るサイコロの目をPythonで再現するには,ランダムに要素を取り出す関数 np.random.choice を用います. >>> import numpy as np >>> np.random.choice(np.arange(1, 7), 10) array([5, 6, 3, 2, 1, 4, 3, 3, 2, 2]) >>> np.arange(1, 7) は,標本…

-Python vs Julia- 配列についてについての比較

Python言語とJulia言語の比較を行った際のメモです. 今回は,配列についての比較です.比較を行った環境はPythonはver 3.6.6,Juliaは ver 1.1.0です.比較はREPLで行い,プロンプトが" >>> "となっているものはPythonでの実施で," Julia> "となっているも…