我们知道深度神经网络的本质是输入端数据和输出端数据的一种高维非线性拟合,如何更好的理解它,下面尝试拟合一个正弦函数,本文可以通过简单设置节点数,实现任意隐藏层数的拟合。
基于pytorch的深度神经网络实战,无论任务多么复杂,都可以将其拆分成必要的几个模块来进行理解。
1)构建数据集,包括输入,对应的标签y
2) 构建神经网络模型,一般基于nn.Module继承一个net类,必须的是__init__函数和forward函数。__init__构造函数包括创建该类是必须的参数,比如输入节点数,隐藏层节点数,输出节点数。forward函数则定义了整个网络的前向传播过程,类似于一个Sequential。
3)实例化上步创建的类。
4)定义损失函数(判别准则),比如均方误差,交叉熵等
5)定义优化器(optim:SGD,adam,adadelta等),设置学习率
6)开始训练。开始训练是一个从0到设定的epoch的循环,循环期间,根据loss,不断迭代和更新网络权重参数。
无论多么复杂的网络,基于pytorch的深度神经网络都包括6个模块,训练阶段包括5个步骤,本文只通过拟合一个正弦函数来说明加深理解。
废话少说,直接上代码:
from torch.utils.data import DataLoader from torch.utils.data import TensorDataset import torch.nn as nn import numpy as np import torch # 准备数据 x=np.linspace(-2*np.pi,2*np.pi,400) y=np.sin(x) # 将数据做成数据集的模样 X=np.expand_dims(x,axis=1) Y=y.reshape(400,-1) # 使用批训练方式 dataset=TensorDataset(torch.tensor(X,dtype=torch.float),torch.tensor(Y,dtype=torch.float)) dataloader=DataLoader(dataset,batch_size=100,shuffle=True) # 神经网络主要结构,这里就是一个简单的线性结构 class Net(nn.Module): def __init__(self): super(Net, self).__init__() self.net=nn.Sequential( nn.Linear(in_features=1,out_features=10),nn.ReLU(), nn.Linear(10,100),nn.ReLU(), nn.Linear(100,10),nn.ReLU(), nn.Linear(10,1) ) def forward(self, input:torch.FloatTensor): return self.net(input) net=Net() # 定义优化器和损失函数 optim=torch.optim.Adam(Net.parameters(net),lr=0.001) Loss=nn.MSELoss() # 下面开始训练: # 一共训练 1000次 for epoch in range(1000): loss=None for batch_x,batch_y in dataloader: y_predict=net(batch_x) loss=Loss(y_predict,batch_y) optim.zero_grad() loss.backward() optim.step() # 每100次 的时候打印一次日志 if (epoch+1)%100==0: print("step: {0} , loss: {1}".format(epoch+1,loss.item())) # 使用训练好的模型进行预测 predict=net(torch.tensor(X,dtype=torch.float)) # 绘图展示预测的和真实数据之间的差异 import matplotlib.pyplot as plt plt.plot(x,y,label="fact") plt.plot(x,predict.detach().numpy(),label="predict") plt.title("sin function") plt.xlabel("x") plt.ylabel("sin(x)") plt.legend() plt.savefig(fname="result.png",figsize=[10,10]) plt.show()
输出结果:
step: 100 , loss: 0.06755948066711426
step: 200 , loss: 0.003788222325965762
step: 300 , loss: 0.0004728269996121526
step: 400 , loss: 0.0001810075482353568
step: 500 , loss: 0.0001108720971387811
step: 600 , loss: 6.29749265499413e-05
step: 700 , loss: 3.707894938997924e-05
step: 800 , loss: 0.0001250380591955036
step: 900 , loss: 3.0654005968244746e-05
step: 1000 , loss: 4.349641676526517e-05
输出图像:
到此这篇关于使用 pytorch 创建神经网络拟合sin函数的实现的文章就介绍到这了,更多相关pytorch 创建拟合sin函数内容请搜索小牛知识库以前的文章或继续浏览下面的相关文章希望大家以后多多支持小牛知识库!
深度神经网络具有独特的功能,可以帮助机器学习突破自然语言的过程。 据观察,这些模型中的大多数将语言视为单词或字符的平坦序列,并使用一种称为递归神经网络或RNN的模型。 许多研究人员得出的结论是,对于短语的分层树,语言最容易被理解。 此类型包含在考虑特定结构的递归神经网络中。 PyTorch有一个特定的功能,有助于使这些复杂的自然语言处理模型更容易。 它是一个功能齐全的框架,适用于各种深度学习,并为
递归神经网络是一种遵循顺序方法的深度学习导向算法。在神经网络中,我们总是假设每个输入和输出都独立于所有其他层。这些类型的神经网络被称为循环,因为它们以顺序方式执行数学计算,完成一个接一个的任务。 下图说明了循环神经网络的完整方法和工作 - 在上图中,,,和是包括一些隐藏输入值的输入,即输出的相应输出的,和。现在将专注于实现PyTorch,以在递归神经网络的帮助下创建正弦波。 在训练期间,将遵循模型
主要内容:卷积神经网络深度学习是机器学习的一个分支,它是近几十年来研究人员突破的关键步骤。深度学习实现的示例包括图像识别和语音识别等应用。 下面给出了两种重要的深度神经网络 - 卷积神经网络 递归神经网络。 在本章中,我们将关注第一种类型,即卷积神经网络(CNN)。 卷积神经网络 卷积神经网络旨在通过多层阵列处理数据。这种类型的神经网络用于图像识别或面部识别等应用。 CNN与任何其他普通神经网络之间的主要区别在于CNN
神经网络的主要原理包括一系列基本元素,即人工神经元或感知器。它包括几个基本输入,如:x1,x2 …… .. xn,如果总和大于激活潜在量,则产生二进制输出。 样本神经元的示意图如下所述 - 产生的输出可以认为是具有激活潜在量或偏差加权和。 典型的神经网络架构如下所述 - 输入和输出之间的层称为隐藏层,层之间的连接密度和类型是配置。例如,完全连接的配置使层L的所有神经元连接到的神经元。对于更明显的定
我正在尝试创建一个用于乳腺癌数据集二元分类的神经网络: https://www.kaggle.com/uciml/breast-cancer-wisconsin-data 我的神经网络由3层组成(不包括输入层): 第一层:具有tanh激活的6个神经元。 第二层:6个激活tanh的神经元。 最后一层:1个乙状结肠激活的神经元。 不幸的是,我在训练示例中的准确率只有44%左右,在测试示例中的准确率只有
本文向大家介绍PyTorch上实现卷积神经网络CNN的方法,包括了PyTorch上实现卷积神经网络CNN的方法的使用技巧和注意事项,需要的朋友参考一下 一、卷积神经网络 卷积神经网络(ConvolutionalNeuralNetwork,CNN)最初是为解决图像识别等问题设计的,CNN现在的应用已经不限于图像和视频,也可用于时间序列信号,比如音频信号和文本数据等。CNN作为一个深度学习架构被提出的