Python中关于numpy灵活定义神经网络结构的实例

黄舟

发布时间：2017-08-20 10:39:14

2290人浏览过

来源于php中文网

原创

这篇文章主要介绍了python基于numpy灵活定义神经网络结构的方法,结合实例形式分析了神经网络结构的原理及python具体实现方法,涉及python使用numpy扩展进行数学运算的相关操作技巧,需要的朋友可以参考下

本文实例讲述了Python基于numpy灵活定义神经网络结构的方法。分享给大家供大家参考，具体如下：

用numpy可以灵活定义神经网络结构，还可以应用numpy强大的矩阵运算功能！

一、用法

1）. 定义一个三层神经网络：

立即学习“Python免费学习笔记（深入）”；

'''&#31034;&#20363;&#19968;'''
nn = NeuralNetworks([3,4,2]) # &#23450;&#20041;&#31070;&#32463;&#32593;&#32476;
nn.fit(X,y) # &#25311;&#21512;
print(nn.predict(X)) #&#39044;&#27979;

说明：
　　输入层节点数目：3
　　隐藏层节点数目：4
　　输出层节点数目：2

传声港

AI驱动的综合媒体服务平台，提供 “媒体发稿 + 自媒体宣发 + 效果监测” 一站式服务

下载

2）.定义一个五层神经网络：

'''&#31034;&#20363;&#20108;'''
nn = NeuralNetworks([3,5,7,4,2]) # &#23450;&#20041;&#31070;&#32463;&#32593;&#32476;
nn.fit(X,y) # &#25311;&#21512;
print(nn.predict(X)) #&#39044;&#27979;

说明：
　　输入层节点数目：3
　　隐藏层1节点数目：5
　　隐藏层2节点数目：7
　　隐藏层3节点数目：4
　　输出层节点数目：2

二、实现

如下实现方式为本人（@hhh5460）原创。 要点： dtype=object

import numpy as np
class NeuralNetworks(object):
  ''''''
  def __init__(self, n_layers=None, active_type=None, n_iter=10000, error=0.05, alpha=0.5, lamda=0.4):
    '''&#25645;&#24314;&#31070;&#32463;&#32593;&#32476;&#26694;&#26550;'''
    # &#21508;&#23618;&#33410;&#28857;&#25968;&#30446; (&#21521;&#37327;)
    self.n = np.array(n_layers) # 'n_layers&#24517;&#39035;&#20026;list&#31867;&#22411;&#65292;&#22914;&#65306;[3,4,2] &#25110; n_layers=[3,4,2]'
    self.size = self.n.size # &#23618;&#30340;&#24635;&#25968;
    # &#23618; (&#21521;&#37327;)
    self.z = np.empty(self.size, dtype=object) # &#20808;&#21344;&#20301;(&#32622;&#31354;)&#65292;dtype=object &#65281;&#22914;&#19979;&#30342;&#28982;
    self.a = np.empty(self.size, dtype=object)
    self.data_a = np.empty(self.size, dtype=object)
    # &#20559;&#32622; (&#21521;&#37327;)
    self.b = np.empty(self.size, dtype=object)
    self.delta_b = np.empty(self.size, dtype=object)
    # &#26435; (&#30697;&#38453;)
    self.w = np.empty(self.size, dtype=object)
    self.delta_w = np.empty(self.size, dtype=object)
    # &#22635;&#20805;
    for i in range(self.size):
      self.a[i] = np.zeros(self.n[i]) # &#20840;&#38646;
      self.z[i] = np.zeros(self.n[i]) # &#20840;&#38646;
      self.data_a[i] = np.zeros(self.n[i]) # &#20840;&#38646;
      if i < self.size - 1:
        self.b[i] = np.ones(self.n[i+1])  # &#20840;&#19968;
        self.delta_b[i] = np.zeros(self.n[i+1]) # &#20840;&#38646;
        mu, sigma = 0, 0.1 # &#22343;&#20540;&#12289;&#26041;&#24046;
        self.w[i] = np.random.normal(mu, sigma, (self.n[i], self.n[i+1])) # # &#27491;&#24577;&#20998;&#24067;&#38543;&#26426;&#21270;
        self.delta_w[i] = np.zeros((self.n[i], self.n[i+1])) # &#20840;&#38646;

下面完整代码是我学习斯坦福机器学习教程，完全自己敲出来的：

import numpy as np
'''
&#21442;&#32771;&#65306;http://ufldl.stanford.edu/wiki/index.php/%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C
'''
class NeuralNetworks(object):
  ''''''
  def __init__(self, n_layers=None, active_type=None, n_iter=10000, error=0.05, alpha=0.5, lamda=0.4):
    '''&#25645;&#24314;&#31070;&#32463;&#32593;&#32476;&#26694;&#26550;'''
    self.n_iter = n_iter # &#36845;&#20195;&#27425;&#25968;
    self.error = error # &#20801;&#35768;&#26368;&#22823;&#35823;&#24046;
    self.alpha = alpha # &#23398;&#20064;&#36895;&#29575;
    self.lamda = lamda # &#34928;&#20943;&#22240;&#23376; # &#27492;&#22788;&#25925;&#24847;&#25340;&#20889;&#38169;&#35823;&#65281;
    if n_layers is None:
      raise '&#21508;&#23618;&#30340;&#33410;&#28857;&#25968;&#30446;&#24517;&#39035;&#35774;&#32622;&#65281;'
    elif not isinstance(n_layers, list):
      raise 'n_layers&#24517;&#39035;&#20026;list&#31867;&#22411;&#65292;&#22914;&#65306;[3,4,2] &#25110; n_layers=[3,4,2]'
    # &#33410;&#28857;&#25968;&#30446; (&#21521;&#37327;)
    self.n = np.array(n_layers)
    self.size = self.n.size # &#23618;&#30340;&#24635;&#25968;
    # &#23618; (&#21521;&#37327;)
    self.a = np.empty(self.size, dtype=object) # &#20808;&#21344;&#20301;(&#32622;&#31354;)&#65292;dtype=object &#65281;&#22914;&#19979;&#30342;&#28982;
    self.z = np.empty(self.size, dtype=object)
    # &#20559;&#32622; (&#21521;&#37327;)
    self.b = np.empty(self.size, dtype=object)
    self.delta_b = np.empty(self.size, dtype=object)
    # &#26435; (&#30697;&#38453;)
    self.w = np.empty(self.size, dtype=object)
    self.delta_w = np.empty(self.size, dtype=object)
    # &#27531;&#24046; (&#21521;&#37327;)
    self.data_a = np.empty(self.size, dtype=object)
    # &#22635;&#20805;
    for i in range(self.size):
      self.a[i] = np.zeros(self.n[i]) # &#20840;&#38646;
      self.z[i] = np.zeros(self.n[i]) # &#20840;&#38646;
      self.data_a[i] = np.zeros(self.n[i]) # &#20840;&#38646;
      if i < self.size - 1:
        self.b[i] = np.ones(self.n[i+1])  # &#20840;&#19968;
        self.delta_b[i] = np.zeros(self.n[i+1]) # &#20840;&#38646;
        mu, sigma = 0, 0.1 # &#22343;&#20540;&#12289;&#26041;&#24046;
        self.w[i] = np.random.normal(mu, sigma, (self.n[i], self.n[i+1])) # # &#27491;&#24577;&#20998;&#24067;&#38543;&#26426;&#21270;
        self.delta_w[i] = np.zeros((self.n[i], self.n[i+1])) # &#20840;&#38646;
    # &#28608;&#27963;&#20989;&#25968;
    self.active_functions = {
      'sigmoid': self.sigmoid,
      'tanh': self.tanh,
      'radb': self.radb,
      'line': self.line,
    }
    # &#28608;&#27963;&#20989;&#25968;&#30340;&#23548;&#20989;&#25968;
    self.derivative_functions = {
      'sigmoid': self.sigmoid_d,
      'tanh': self.tanh_d,
      'radb': self.radb_d,
      'line': self.line_d,
    }
    if active_type is None:
      self.active_type = ['sigmoid'] * (self.size - 1) # &#40664;&#35748;&#28608;&#27963;&#20989;&#25968;&#31867;&#22411;
    else:
      self.active_type = active_type
  def sigmoid(self, z):
    if np.max(z) > 600:
      z[z.argmax()] = 600
    return 1.0 / (1.0 + np.exp(-z))
  def tanh(self, z):
    return (np.exp(z) - np.exp(-z)) / (np.exp(z) + np.exp(-z))
  def radb(self, z):
    return np.exp(-z * z)
  def line(self, z):
    return z
  def sigmoid_d(self, z):
    return z * (1.0 - z)
  def tanh_d(self, z):
    return 1.0 - z * z
  def radb_d(self, z):
    return -2.0 * z * np.exp(-z * z)
  def line_d(self, z):
    return np.ones(z.size) # &#20840;&#19968;
  def forward(self, x):
    '''&#27491;&#21521;&#20256;&#25773;&#65288;&#22312;&#32447;&#65289;''' 
    # &#29992;&#26679;&#26412; x &#36208;&#19968;&#36941;&#65292;&#21047;&#26032;&#25152;&#26377; z, a
    self.a[0] = x
    for i in range(self.size - 1):
      self.z[i+1] = np.dot(self.a[i], self.w[i]) + self.b[i] 
      self.a[i+1] = self.active_functions[self.active_type[i]](self.z[i+1]) # &#21152;&#20102;&#28608;&#27963;&#20989;&#25968;
  def err(self, X, Y):
    '''&#35823;&#24046;'''
    last = self.size-1
    err = 0.0
    for x, y in zip(X, Y):
      self.forward(x)
      err += 0.5 * np.sum((self.a[last] - y)**2)
    err /= X.shape[0]
    err += sum([np.sum(w) for w in self.w[:last]**2])
    return err
  def backward(self, y):
    '''&#21453;&#21521;&#20256;&#25773;&#65288;&#22312;&#32447;&#65289;'''
    last = self.size - 1
    # &#29992;&#26679;&#26412; y &#36208;&#19968;&#36941;&#65292;&#21047;&#26032;&#25152;&#26377;delta_w, delta_b
    self.data_a[last] = -(y - self.a[last]) * self.derivative_functions[self.active_type[last-1]](self.z[last]) # &#21152;&#20102;&#28608;&#27963;&#20989;&#25968;&#30340;&#23548;&#20989;&#25968;
    for i in range(last-1, 1, -1):
      self.data_a[i] = np.dot(self.w[i], self.data_a[i+1]) * self.derivative_functions[self.active_type[i-1]](self.z[i]) # &#21152;&#20102;&#28608;&#27963;&#20989;&#25968;&#30340;&#23548;&#20989;&#25968;
      # &#35745;&#31639;&#20559;&#23548;
      p_w = np.outer(self.a[i], self.data_a[i+1]) # &#22806;&#31215;&#65281;&#24863;&#35874; numpy &#30340;&#24378;&#22823;&#65281;
      p_b = self.data_a[i+1]
      # &#26356;&#26032; delta_w, delta_w
      self.delta_w[i] = self.delta_w[i] + p_w
      self.delta_b[i] = self.delta_b[i] + p_b
  def update(self, n_samples):
    '''&#26356;&#26032;&#26435;&#37325;&#21442;&#25968;'''
    last = self.size - 1
    for i in range(last):
      self.w[i] -= self.alpha * ((1/n_samples) * self.delta_w[i] + self.lamda * self.w[i])
      self.b[i] -= self.alpha * ((1/n_samples) * self.delta_b[i])
  def fit(self, X, Y):
    '''&#25311;&#21512;'''
    for i in range(self.n_iter):
      # &#29992;&#25152;&#26377;&#26679;&#26412;&#65292;&#20381;&#27425;
      for x, y in zip(X, Y):
        self.forward(x) # &#21069;&#21521;&#65292;&#26356;&#26032; a, z;
        self.backward(y) # &#21518;&#21521;&#65292;&#26356;&#26032; delta_w, delta_b
      # &#28982;&#21518;&#65292;&#26356;&#26032; w, b
      self.update(len(X))
      # &#35745;&#31639;&#35823;&#24046;
      err = self.err(X, Y)
      if err < self.error:
        break
      # &#25972;&#21315;&#27425;&#26174;&#31034;&#35823;&#24046;&#65288;&#21542;&#21017;&#22826;&#26080;&#32842;&#65281;&#65289;
      if i % 1000 == 0:
        print('iter: {}, error: {}'.format(i, err))
  def predict(self, X):
    '''&#39044;&#27979;'''
    last = self.size - 1
    res = []
    for x in X:
      self.forward(x)
      res.append(self.a[last])
    return np.array(res)
if __name__ == '__main__':
  nn = NeuralNetworks([2,3,4,3,1], n_iter=5000, alpha=0.4, lamda=0.3, error=0.06) # &#23450;&#20041;&#31070;&#32463;&#32593;&#32476;
  X = np.array([[0.,0.], # &#20934;&#22791;&#25968;&#25454;
         [0.,1.],
         [1.,0.],
         [1.,1.]])
  y = np.array([0,1,1,0])
  nn.fit(X,y)     # &#25311;&#21512;
  print(nn.predict(X)) # &#39044;&#27979;

Python异步并发请求调度：实现服务器动态负载均衡与持续任务吞吐

如何用函数式编程方法判断 Python 列表中所有元素是否相等

何时应使用对象引用而非复制？——Python中b = a的合理应用场景详解

如何在 Python 中实现多值到单值的反向映射

如何用函数式编程风格在 Python 中判断列表所有元素是否相等