RNN ã«è¨ˆç®—å•é¡Œã‚’è§£ã‹ã›ã‚‹ - æŠ€è¡“ã‚’ã‹ã˜ã‚‹çŒ«

white-azalea.hatenablog.jp

ã“ã®è¾ºã®ç¶šãã€‚
å‚è€ƒã¯

ã¯ã˜ã‚ã¦ã®ãƒ‡ã‚£ãƒ¼ãƒ—ãƒ©ãƒ¼ãƒ‹ãƒ³ã‚°2ã€€Pythonã§å®Ÿè£…ã™ã‚‹å†å¸°åž‹ãƒ‹ãƒ¥ãƒ¼ãƒ©ãƒ«ãƒãƒƒãƒˆãƒ¯ãƒ¼ã‚¯ï¼ŒVAEï¼ŒGAN

ä½œè€…:æˆ‘å¦» å¹¸é•·
SBã‚¯ãƒªã‚¨ã‚¤ãƒ†ã‚£ãƒ–

å®Ÿè£…ã—ãŸã‚ã‚Œã“ã‚Œã¯å¾Œè¿°

RNN ãŒæ™‚ç³»åˆ—ãƒ‡ãƒ¼ã‚¿ã‹ã‚‰æ¬¡ã®å€¤ã‚’äºˆæ¸¬ã™ã‚‹ã‚‚ã®ãªã‚‰ã°ã€ã€Œæ™‚ç³»åˆ—ãƒ‡ãƒ¼ã‚¿ï¼è¶³ã—ç®—ã™ã‚‹ã¹ãäºŒã¤ã®ãƒ“ãƒƒãƒˆåˆ—ã‚’æŒ‡å®šã€äºˆæ¸¬ã—ãŸã„å€¤ï¼è¶³ã—ãŸçµæžœã®ãƒ“ãƒƒãƒˆåˆ—ã€ã§å¦ç¿’ã•ã›ã‚Œã°ã€ç¢ºã‹ã«è¨ˆç®—å™¨ã‚’ä½œæˆã™ã‚‹ã“ã¨ã¯å¯èƒ½ã‹ã‚‚ã—ã‚Œãªã„ã€‚
ã“ã®ä½¿ã„æ–¹ã¯æ€ã„ã¤ãã¾ã›ã‚“ã§ã—ãŸã€‚

ã“ã‚Œã€æ¬¡å…ƒæ•°å¢—ã‚„ã›ã°ãã‚Œã ã‘ã§ã‹ãªã‚Šè¤‡é›‘ãªåˆ¤å®šã¨ã‹å‡ºã›ãã†ãªæ°—ãŒã—ã¾ã™ã€‚
ä¾‹ãˆã°å…¥åŠ›ç³»çµ±ã‚’å¢—ã‚„ã—ã¦ã€ã‚ªãƒšãƒ¬ãƒ¼ã‚¿ã‚’æŒ‡å®šã—ã¦ã¿ã‚‹ã¨ã‹â€¦

å¼•æ•°ã®çŠ¶æ…‹äºŒã¤ï¼ˆæ™‚ç³»åˆ—ãƒ‡ãƒ¼ã‚¿äºŒã¤ï¼‰ã‹ã‚‰ã®ã¿çµæžœãŒå°Žãå‡ºã•ã‚Œã‚‹å‰æãŒã‚ã‚Šã€2 å›žç›®ä»¥é™ã®å¦ç¿’ã§å‰å›žã¾ã§ã®å‹¾é…ã‚’æŒã£ã¦ã„ã‚‹ã¨æ£å¸¸ã«æ©Ÿèƒ½ã—ãªã„ã®ã§ã€ reset_sum_grad ã§å¦ç¿’ã‚’ãƒªã‚»ãƒƒãƒˆã—ã¦ã‚‹ã€‚

ãªã‚‹ã»ã©ãªã£ã¦æ„Ÿã˜

    def reset_sum_grad(self):
        self.grad_w = np.zeros_like(self.w)
        self.grad_b = np.zeros_like(self.b)

å®Ÿè£…ã®æœ¬ç·¨ã¯ã“ã‚“ãªæ„Ÿã˜ã€‚
å‡ºåŠ›å±¤ã¨ RNN ãƒ¬ã‚¤ãƒ¤ãƒ¼ã ãŒã€å‡ºåŠ›å±¤ã¯ã‚·ã‚°ãƒ¢ã‚¤ãƒ‰é–¢æ•°ã¦ã ã‘ã§ã€ä¸é–“å±¤ã®å®Ÿè£…ã¯å‰å›žã®ãƒ‘ã‚¯ãƒªã€‚

eta      = 0.1  # å¦ç¿’ä¿‚æ•°
n_learn = 5001  # å¦ç¿’å›žæ•°
interval = 500  # çµŒéŽã®è¡¨ç¤ºé–“éš”

class OutputLayer:
    def __init__(self, n_upper, n):
        self.w = np.random.randn(n_upper, n) / np.sqrt(n_upper)
        self.b = np.zeros(n)
    
    def activate_func(self, u):
        # sigmoid function
        return 1 / (1 + np.exp(-u))
    
    def diff_func(self, grad_y, y):
        # differencial sigmoid
        return grad_y * (1 - y) * y
    
    def forward(self, x):
        self.x = x
        u = np.dot(x, self.w) + self.b
        self.y = self.activate_func(u)
        return self.y
    
    def backward(self, x, y, t):
        delta = self.diff_func(y - t, y)
        self.grad_w = np.dot(x.T, delta)
        self.grad_b = np.sum(delta, axis=0)
        self.grad_x = np.dot(delta, self.w.T)
        return self.grad_x

    def reset_sum_grad(self):
        self.grad_w = np.zeros_like(self.w)
        self.grad_b = np.zeros_like(self.b)
    
    def update(self, eta):
        self.w -= eta * self.grad_w
        self.b -= eta * self.grad_b

class RnnBaseLayer:
    def __init__(self, n_upper, n):
        self.w = np.random.randn(n_upper, n) / np.sqrt(n_upper)
        self.v = np.random.randn(n, n) / np.sqrt(n)
        self.b = np.zeros(n)
    
    def forward(self, x, prev_y):
        u = np.dot(x, self.w) + np.dot(prev_y, self.v) + self.b
        self.y = np.tanh(u)
        return self.y
    
    def backward(self, x, y, prev_y, grad_y):
        delta = grad_y * (1 - y**2)

        self.grad_w += np.dot(x.T, delta)
        self.grad_v += np.dot(prev_y.T, delta)
        self.grad_b += np.sum(delta, axis=0)

        self.grad_x = np.dot(delta, self.w.T)
        self.grad_prev_y = np.dot(delta, self.v.T)
        return self.grad_prev_y

    def reset_sum_grad(self):
        self.grad_w = np.zeros_like(self.w)
        self.grad_v = np.zeros_like(self.v)
        self.grad_b = np.zeros_like(self.b)

    def update(self, eta):
        self.w -= eta * self.grad_w
        self.v -= eta * self.grad_v
        self.b -= eta * self.grad_b

ã“ã“ã«é£Ÿã‚ã›ã‚‹å¦ç¿’ãƒ‡ãƒ¼ã‚¿ã ã‘ã©ã€ã“ã‚Œã§å¦ç¿’ã•ã›ãŸã®ã¯ã€2é€²æ•°ã®è¶³ã—ç®—è¨“ç·´ã€‚
ã“ã®æ™‚ã®å¦ç¿’ãƒ‡ãƒ¼ã‚¿ã®å½¢çŠ¶ã¯

n_time = 8   # æ™‚ç³»åˆ—ã®æ•°(ä»Šå›žã¯æœ€å¤§ãƒ“ãƒƒãƒˆæ•°)
n_in   = 2   # å…¥åŠ›å±¤ãƒ‹ãƒ¥ãƒ¼ãƒãƒ³æ•°(äºŒã¤ã®å€¤ã‚’è¶³ã—åˆã‚ã›ã‚‹ç›®çš„ãªã®ã§)
n_mid  = 32  # ä¸é–“å±¤ãƒ‹ãƒ¥ãƒ¼ãƒãƒ³æ•°(é©å½“)
n_out  = 1   # å‡ºåŠ›å±¤ãƒ‹ãƒ¥ãƒ¼ãƒãƒ³æ•°(çœŸå®Ÿã¯ã„ã¤ã‚‚ä¸€ã¤ï¼)

max_num = 2**n_time  # = 256
binaries = np.zeros((max_num, n_time), dtype=int)
for i in range(max_num):
    num10 = i
    for j in range(n_time):
        pow2 = 2 ** (n_time - 1 - j)
        binaries[i, j] = num10 // pow2
        num10 %= pow2

ã“ã‚“ãªæ„Ÿã˜ã«æ›¸ã„ã¦ã„ã¾ã™ãŒã€binaries ã®ä¸èº«ã¯

[0 0 0 0 0 0 0 0]
[0 0 0 0 0 0 0 1]
[0 0 0 0 0 0 1 0]
[0 0 0 0 0 0 1 1]
...
[1 1 1 1 1 1 1 1]

ã¨ã€256 è¡Œ 8 åˆ—ã®ãƒ“ãƒƒãƒˆåˆ—ã€‚
ã“ã®è¡Œåˆ—ã¯å…ˆé ã‹ã‚‰ 0, 1, 2, 3, ... ã¨ç¶šã„ã¦ã„ã‚‹ã®ã§ã€32 ã®å€¤ã¯ã‚¤ãƒ³ãƒ‡ãƒƒã‚¯ã‚¹ 32 ã«å½“ãŸã‚‹ã€‚

è¶³ã—åˆã‚ã›ã‚‹äºŒã¤ã®å€¤ã¯ MAX(256) ã‚’ 2 ã§å‰²ã£ãŸå€¤(ã“ã‚Œã§ 128 ä»¥ä¸‹ã®å€¤äºŒã¤ã«åŒ–ã‘ã‚‹)

    num1 = np.random.randint(max_num//2)
    num2 = np.random.randint(max_num//2)

    # ã“ã‚Œã‚’ãƒ“ãƒƒãƒˆé…åˆ—ã«ç½®ãæ›ãˆã¦
    x1= binaries[num1]
    x2= binaries[num2]

    # å¼•æ•°ã®å½¢çŠ¶ã«ã¾ã¨ã‚ã‚‹
    x_in = np.zeros((1, n_time, n_in))
    x_in[0, :, 0] = x1
    x_in[0, :, 1] = x2
    x_in  = np.flip(x_in, axis=1)

å½¢çŠ¶çš„ã«ã¯ã“ã‚“ãªæ„Ÿã˜

13 ã¨ 33 ã®ä¾‹

[[[1. 1.]
  [0. 0.]
  [1. 0.]
  [1. 0.]
  [0. 0.]
  [0. 1.]
  [0. 0.]
  [0. 0.]]]

13 + 33 = 46 = b00101110 ã¨ãªã‚‹ã®ã§ã€

    # çµæžœãƒ‡ãƒ¼ã‚¿
    t = binaries[num1+num2]
    t_in = t.reshape(1, n_time, n_out)
    t_in = np.flip(t_in , axis=1)

ã‚³ãƒ¬ã®çµæžœã¯

[[[0],
  [1],
  [1],
  [1],
  [0],
  [1],
  [0],
  [0]]]

ã“ã‚Œã‚’é£Ÿã‚ã›ã¦ã‚·ã‚°ãƒ¢ã‚¤ãƒ‰é–¢æ•°å‡ºåŠ›ï¼ˆMAX =1ï¼‰ã§ã€0.5 ã‚’é–¾å€¤ã« 01 åˆ¤å®šã—ã¦å¦ç¿’ã•ã›ã¦ã„ãã¨ã„ã†æ§˜å¼ã€‚

å¦ç¿’éƒ¨åˆ†ã®å…¨ä½“åƒã¯ã“ã‚“ãªæ„Ÿã˜

rnnLayer = RnnBaseLayer(n_in, n_mid)
outputLayer = OutputLayer(n_mid, n_out)

def train(x_mb, t_mb):
    y_rnn = np.zeros((len(x_mb), n_time+1, n_mid))
    y_out = np.zeros((len(x_mb), n_time, n_out))

    # Forward propergation
    y_prev = y_rnn[:, 0, :]
    for i in range(n_time):
        # RNN layer
        x = x_mb[:, i, :]
        y = rnnLayer.forward(x, y_prev)
        y_rnn[:, i + 1, :] = y
        y_prev = y

        # output layer
        y_out[:, i, :] = outputLayer.forward(y)
    
    # back propergation
    outputLayer.reset_sum_grad()
    rnnLayer.reset_sum_grad()
    grad_y = 0
    for i in reversed(range(n_time)):
        # output layer
        x = y_rnn[:, i+1, :]
        y = y_out[:, i, :]
        t = t_mb[:, i, :]
        grad_x_out = outputLayer.backward(x, y, t)

        # Rnn layer
        x = x_mb[:, i, :]
        y = y_rnn[:, i+1, :]
        y_prev = y_rnn[:, i, :]
        grad_y = rnnLayer.backward(x, y, y_prev, grad_y + grad_x_out)

    # update
    rnnLayer.update(eta)
    outputLayer.update(eta)
    return y_out

def get_error(y, t):
    return 1.0/2.0*np.sum(np.square(y - t))

for i in range(n_learn):
    # ãƒ©ãƒ³ãƒ€ãƒ ãªã‚¤ãƒ³ãƒ‡ãƒƒã‚¯ã‚¹ã‚’ä½œæˆ
    num1 = np.random.randint(max_num//2)
    num2 = np.random.randint(max_num//2)

    # ã“ã‚Œã‚’ãƒ“ãƒƒãƒˆé…åˆ—ã«ç½®ãæ›ãˆã¦
    x1= binaries[num1]
    x2= binaries[num2]

    # å¼•æ•°ã®å½¢çŠ¶ã«ã¾ã¨ã‚ã‚‹
    x_in = np.zeros((1, n_time, n_in))
    x_in[0, :, 0] = x1
    x_in[0, :, 1] = x2
    x_in  = np.flip(x_in, axis=1)

    # çµæžœãƒ‡ãƒ¼ã‚¿
    t = binaries[num1+num2]
    t_in = t.reshape(1, n_time, n_out)
    t_in = np.flip(t_in , axis=1)

    # å¦ç¿’
    y_out = train(x_in, t_in)
    y = np.flip(y_out, axis=1).reshape(-1)

    error = get_error(y_out, t_in)

    if i % interval == 0:
        y2 = np.where(y<0.5, 0, 1)
        y10 = 0
        for j in range(len(y)):
            pow2 = 2 ** (n_time-1-j)
            y10 += y2[j] * pow2

        print("learn count:", i)
        print("error rate:", error)
        c = "Success : " if (y2 == t).all() else "Failure : "
        print(c + str(num1) + " + " + str(num2) + " = " + str(y10))
        print("========================")