NumPy:配列の基礎
NumPy は数値計算のための基盤ライブラリであり,多次元配列(NumPy配列 (ndarray))とそれに対する高速な演算を提供する.
Phase 2 以降のシミュレーションは,リストの代わりに ndarray を用いて配列全体をまとめて操作する.
慣例として np という別名で読み込む.
import numpy as npndarray の作成¶
np.array にリストを渡すと ndarray が作られる.多重リストを渡せば多次元配列になる.
a = np.array([1, 2, 3])
b = np.array([6, 3.3, 1])
C = np.array([[1, 5, 6], [7, 8, 9], [4, 2, 3]])
D = np.array([[2.3, 4, 7.2], [7, 9, 1], [11, 2, 9]])
print("a:", a)
print("C:\n", C)a: [1 2 3]
C:
[[1 5 6]
[7 8 9]
[4 2 3]]
数学の慣例にならい,ベクトル(1次元配列)は小文字,行列(2次元配列)は大文字で表すことが多い.
属性¶
配列の形状・次元・要素の型は属性として参照できる.
# 形状(各次元の要素数)
print("a.shape:", a.shape)
print("C.shape:", C.shape)
# 次元数
print("b.ndim:", b.ndim)
print("D.ndim:", D.ndim)
# 要素の型
print("a.dtype:", a.dtype)
print("D.dtype:", D.dtype)a.shape: (3,)
C.shape: (3, 3)
b.ndim: 1
D.ndim: 2
a.dtype: int64
D.dtype: float64
astype で要素の型を変換(キャスト)できる.
e = a.astype(float)
F = D.astype(int)
print("e:", e)
print("F:\n", F)e: [1. 2. 3.]
F:
[[ 2 4 7]
[ 7 9 1]
[11 2 9]]
要素ごとの演算¶
同じ形状どうしの四則演算は,対応する要素ごとに計算される.
print("a + b:", a + b)
print("b - a:", b - a)
print("a * b:", a * b)
print("C + D:\n", C + D)a + b: [7. 5.3 4. ]
b - a: [ 5. 1.3 -2. ]
a * b: [6. 6.6 3. ]
C + D:
[[ 3.3 9. 13.2]
[14. 17. 10. ]
[15. 4. 12. ]]
ブロードキャスト¶
形状が異なる配列どうしの演算では,小さい方の配列が自動的に引き伸ばされて計算される.これをブロードキャスト (broadcasting)という.
# スカラーとの演算(スカラーが全要素に作用する)
print("3 * a:", 3 * a)
print("a ** 2:", a**2)
# 1次元配列と2次元配列(行ベクトルが各行に作用する)
print("a + C:\n", a + C)
print("C / a:\n", C / a)3 * a: [3 6 9]
a ** 2: [1 4 9]
a + C:
[[ 2 7 9]
[ 8 10 12]
[ 5 4 6]]
C / a:
[[1. 2.5 2. ]
[7. 4. 3. ]
[4. 1. 1. ]]
数学関数(ユニバーサル関数)¶
NumPy の数学関数は配列の各要素に作用する.スカラーにも配列にも同じ関数が使える.
# 指数・対数・平方根
print("np.exp(a):", np.exp(a))
print("np.log(b):", np.log(b))
print("np.sqrt(b):", np.sqrt(b))
# 三角関数と円周率 np.pi
print("np.sin(np.pi / 2):", np.sin(np.pi / 2))
print("np.cos(a):", np.cos(a))np.exp(a): [ 2.71828183 7.3890561 20.08553692]
np.log(b): [1.79175947 1.19392247 0. ]
np.sqrt(b): [2.44948974 1.81659021 1. ]
np.sin(np.pi / 2): 1.0
np.cos(a): [ 0.54030231 -0.41614684 -0.9899925 ]
配列の生成¶
要素を1つずつ書かずに,規則的な配列を生成する関数がある.
# 0 埋め・1 埋め(形状を指定)
Z = np.zeros([3, 4])
ones = np.ones(5)
print("Z:\n", Z)
print("ones:", ones)
# 等差数列
print("np.arange(0, 10, 2):", np.arange(0, 10, 2)) # 0 から 10 未満を 2 刻み
# 区間を等分する数列(端点を含む)
print("np.linspace(0, 1, 5):", np.linspace(0, 1, 5)) # 0 から 1 を 5 点Z:
[[0. 0. 0. 0.]
[0. 0. 0. 0.]
[0. 0. 0. 0.]]
ones: [1. 1. 1. 1. 1.]
np.arange(0, 10, 2): [0 2 4 6 8]
np.linspace(0, 1, 5): [0. 0.25 0.5 0.75 1. ]
arange は刻み幅を,linspace は点の個数を指定する.曲線を滑らかに描くときは linspace が便利である.
集約・統計¶
配列全体を要約する関数がある.関数形式(np.sum(a))とメソッド形式(a.sum())の両方が使える.
print("np.sum(b):", np.sum(b))
print("b.mean():", b.mean())
print("np.max(a):", np.max(a))
print("np.min(C):", np.min(C))
print("np.median(b):", np.median(b))
print("np.std(D):", np.std(D))np.sum(b): 10.3
b.mean(): 3.4333333333333336
np.max(a): 3
np.min(C): 1
np.median(b): 3.3
np.std(D): 3.3973846149975753
axis を指定すると,特定の方向にだけ集約できる(2次元配列で axis=0 は列方向,axis=1 は行方向).
print("C:\n", C)
print("列ごとの和 C.sum(axis=0):", C.sum(axis=0))
print("行ごとの和 C.sum(axis=1):", C.sum(axis=1))C:
[[1 5 6]
[7 8 9]
[4 2 3]]
列ごとの和 C.sum(axis=0): [12 15 18]
行ごとの和 C.sum(axis=1): [12 24 9]
コピーと参照¶
配列の代入(=)は中身を複製せず,同じ配列を指す別名を作るだけである.
一方を書き換えるともう一方も変わってしまうため,独立した複製が必要なときは np.copy を使う.
シミュレーションで「現在の状態」を記録に残す場面で重要になる.
x = np.array([1, 2, 3])
# 参照(同じ配列を共有する)
y = x
y[0] = 99
print("参照: x =", x) # x も変わってしまう
# コピー(独立した複製)
x = np.array([1, 2, 3])
z = np.copy(x)
z[0] = 99
print("コピー: x =", x, ", z =", z) # x は変わらない参照: x = [99 2 3]
コピー: x = [1 2 3] , z = [99 2 3]