第15回:機械学習入門(演習)#

学籍番号:…

氏名:…


必要なライブラリのimportとデータのダウンロード#

以下のセルで演習に必要なライブラリのimportとデータをダウンロードしています.初めに実行してください.

import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

from matplotlib import rcParams
rcParams['font.family'] = 'sans-serif'
rcParams['font.sans-serif'] = ['Hiragino Sans', 'Yu Gothic', 'Meirio', 'Takao', 'IPAexGothic', 'IPAPGothic', 'VL PGothic', 'Noto Sans CJK JP']
!mkdir data
!wget -P data https://raw.githubusercontent.com/ground-zero-programming/zero-pro2024-public/main/docs/15/data/data_N.npy
!wget -P data https://raw.githubusercontent.com/ground-zero-programming/zero-pro2024-public/main/docs/15/data/target_N.npy

!wget -P data https://raw.githubusercontent.com/ground-zero-programming/zero-pro2024-public/main/docs/15/data/data_noise_scale.npy
!wget -P data https://raw.githubusercontent.com/ground-zero-programming/zero-pro2024-public/main/docs/15/data/target_noise_scale.npy

!wget -P data https://raw.githubusercontent.com/ground-zero-programming/zero-pro2024-public/main/docs/15/data/data_a.npy
!wget -P data https://raw.githubusercontent.com/ground-zero-programming/zero-pro2024-public/main/docs/15/data/target_a.npy

!wget -P data https://raw.githubusercontent.com/ground-zero-programming/zero-pro2024-public/main/docs/15/data/data_b.npy
!wget -P data https://raw.githubusercontent.com/ground-zero-programming/zero-pro2024-public/main/docs/15/data/target_b.npy
mkdir: data: File exists
zsh:1: command not found: wget
zsh:1: command not found: wget
zsh:1: command not found: wget
zsh:1: command not found: wget
zsh:1: command not found: wget
zsh:1: command not found: wget
zsh:1: command not found: wget
zsh:1: command not found: wget

演習1: 線形回帰#

演習1-1: データの読み込みと可視化#

以下に示すようにデータ数 N,ノイズの大きさ noise_scale,データを生成するときの関数の傾きと切片 abのパラメータを講義資料から変更したデータを用意した.

  1. データ数 N を変更したデータのパス

    • X: ‘data/data_N.npy’

    • y: ‘data/target_N.npy’

  2. ノイズの大きさ noise_scale を変更したデータのパス

    • X: ‘data/data_noise_scale.npy’

    • y: ‘data/target_noise_scale.npy’

  3. データを生成するときの関数の傾き a を変更したデータのパス

    • X: ‘data/data_a.npy’

    • y: ‘data/target_a.npy’

  4. データを生成するときの関数の切片 b を変更したデータのパス

    • X: ‘data/data_b.npy’

    • y: ‘data/target_b.npy’

どれか一つで良いので np.load関数を使って読み込み,読み込んだデータを可視化せよ.

# 解答用セル

演習1-2: 線形回帰#

読み込んだデータを使って線形回帰を実行せよ.また得られた傾きと切片を元に結果を可視化せよ.

# 解答用セル

発展演習1: Numpyの操作#

発展演習1-1: ベクトルの定義#

Numpyを用いて以下に示すベクトル \(\mathbf{a},\mathbf{b}\) を定義して.shapeでベクトルの形状を以下の目標出力に従って出力せよ.

\[\begin{split} \mathbf{a}=\begin{bmatrix} 1 \\ 2 \\ 3 \\ 4 \end{bmatrix}, \mathbf{b}=\begin{bmatrix} 5 \\ 6 \\ 7 \\ 8 \end{bmatrix} \end{split}\]

目標出力

a.shape: (4, 1), b.shape: (4, 1)
# 解答用セル

発展演習1-2: ベクトルの内積#

定義したベクトル \(\mathbf{a},\mathbf{b}\) の内積 \(\mathbf{a}^\top \mathbf{b}\)Numpyを用いて計算せよ.

# 解答用セル

発展演習1-3: Numpyを用いない実装#

演習1-1,1-2をNumpyを用いずリストと繰り返し文のみを使って実装せよ.

# 解答用セル

発展演習1-4: 行列の定義#

Numpyを用いて以下に示す行列 \(\mathbf{A},\mathbf{B}\) を定義し,.shapeで行列の形状を以下の目標出力に従って出力せよ.

\[\begin{split} \mathbf{A}=\begin{bmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \\ \end{bmatrix}, \mathbf{B}=\begin{bmatrix} 1 & 2 \\ 3 & 4 \\ 5 & 6 \\ \end{bmatrix} \end{split}\]

目標出力

A.shape: (2, 3), B.shape: (3, 2)
# 解答用セル

発展演習1-5: 行列の積#

定義した行列 \(\mathbf{A},\mathbf{B}\) の積 \(\mathbf{A}\mathbf{B}\)Numpyを用いて計算せよ.

# 解答用セル

発展演習1-6: 固有値計算#

以下の行列 \(\mathbf{C}\) の固有値と固有ベクトルを計算せよ.ただし,Numpy, Sympy, Scipy,…など利用するライブラリや計算方法は自由で良い.講義中で固有値計算の話題に触れていないので各自利用するライブラリのリファレンス等を参考に取り組むこと.

\[\begin{split} \mathbf{C}=\begin{bmatrix} 3 & 0 \\ 1 & 2 \\ \end{bmatrix} \end{split}\]
# 解答用セル

発展演習2: 線形回帰#

講義で扱った線形回帰は \(y=ax+b\) という線形のモデルを仮定してデータを当てはめる.利用する入出力のペア \((x,y)\)\(y=ax+b\) ではなく二次関数 \(y=ax^2+bx+c\) から生成されるときどのような結果となるかPythonのプログラミングを通して検証せよ.ただし,パラメータN, noise_scale, a, b, cは自由に設定して良い.

# 解答用セル

発展演習3: 多項式回帰#

発展演習2で作成した二次関数から生成されるデータに対して多項式回帰というアルゴリズムを考える.二次の多項式回帰は,線形回帰

\[ y = ax + b \]

から,変数 \(x\) について

\[ y = ax^2 + bx + c \]

という二次関数を使って回帰を行う.

scikit-learnにおける多項式回帰の実装方法について調べ,発展演習2で作成したデータに対して多項式回帰を実装せよ.

ヒント:多項式回帰は PolynomialFeatures を使うと実現できる.

# 解答用セル