百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分类 > 正文

机器学习笔记-LSTM(长短时记忆网络)

ztj100 2024-12-12 16:15 19 浏览 0 评论

一 简介

LSTM网络,即长短期记忆网络,是循环神经网络(RNN)的一种高级形式,擅长捕捉数据中的长期依赖关系。

二 实现

(1)数据集:

百度网盘链接:https://pan.baidu.com/s/1oHPLWcs3XnFqJnJfKcLStQ

提取码:clyz

(2)环境:pytorch、sklearn、pandas、matplotlib、numpy

(3)导入包:

import pandas as pd
from matplotlib import pyplot as plt # 结果可视化
from torch import nn
import time
import matplotlib.pyplot as plt
import numpy as np
from typing import Tuple
from sklearn.preprocessing import MinMaxScaler
import torch

(4)设置显示中文:

plt.rcParams['font.sans-serif'] = 'SimHei'
plt.rcParams['axes.unicode_minus'] = False

(5)定义网络:

class LSTM_Regression(nn.Module):
    """
        使用LSTM进行回归
        参数:
        - input_size: 输入维度
        - hidden_size: 隐藏层维度
        - output_size: 输出维度
        - num_layers: cell的层数
        - dropout: 遗忘率
        - learning_rate: 学习率
        - batch_size: 批大小
    """
 
    def __init__(self, input_size, hidden_size, output_size=1, num_layers=2, dropout=0.2, learning_rate=0.001, batch_size=32):
        super().__init__()
 
        self.lstm = nn.LSTM(input_size, hidden_size, num_layers)  # LSTM层
        self.fc = nn.Linear(hidden_size, output_size)  # 全连接层
 
    def forward(self, _x):
        x, _ = self.lstm(_x)  # 输入数据和隐藏层输出
        s, b, h = x.shape  # 输入数据的形状
        x = x.view(s * b, h)  # 展开输入数据
        x = self.fc(x)  # 全连接层
        x = x.view(s, b, -1)  # 还原输入数据的形状
        return x

(6)定义数据集:

def create_dataset(data, days_for_train=5) -> Tuple[np.array, np.array]:
    """
        根据给定的序列data,生成数据集
        数据集分为输入和输出,每一个输入的长度为days_for_train,每一个输出的长度为1。
        也就是说用days_for_train天的数据,对应下一天的数据。
        若给定序列的长度为d,将输出长度为(d-days_for_train+1)个输入/输出对
    """
    dataset_x, dataset_y = [], []
    for i in range(len(data) - days_for_train):
        _x = data[i:(i + days_for_train)]
        dataset_x.append(_x)
        dataset_y.append(data[i + days_for_train])
    return (np.array(dataset_x), np.array(dataset_y))

(7)读取并查看数据:

 # 读取数据
    data = pd.read_csv('D:/myfile/myWorkSpace/参与的项目/备品备件-07.05/0708预处理/0718_datas/02/电力负荷.csv')

    # 转换为时间格式
    data['出库日期'] = pd.to_datetime(data['出库日期'])
    # print(data.head())
    df = data.rename(columns={'出库日期': 'ds', '数量和': 'y'})
    plt.plot(df['y'])
    plt.show()

(8)MinMaxScaler数据归一化

    # 创建一个MinMaxScaler实例
    scaler = MinMaxScaler()
    # 使用fit_transform方法来拟合数据并进行转换
    df_normalized = scaler.fit_transform(df['y'].values.reshape(-1, 1))

    plt.plot(df_normalized)
    plt.show()

(9)获取并打印数据集:

dataset_x, dataset_y = create_dataset(df_normalized, DAYS_FOR_TRAIN)
print(dataset_x.shape, dataset_y.shape)

(10)数据集准备:

        train_size = int(len(dataset_x) * 0.8)
    
        train_x = dataset_x[:train_size]
        train_y = dataset_y[:train_size]

        # 将数据改变形状,RNN 读入的数据维度是 (seq_size, batch_size, feature_size)
        train_x = train_x.reshape(-1, 1, DAYS_FOR_TRAIN)
        train_y = train_y.reshape(-1, 1, 1)

        # 转为pytorch的tensor对象
        train_x = torch.from_numpy(train_x).to(torch.float32) 
        train_y = torch.from_numpy(train_y).to(torch.float32) 

(11)使用模型:

model = LSTM_Regression(DAYS_FOR_TRAIN, 60, output_size=1, num_layers=2, dropout=0.2, learning_rate=0.001, batch_size=32) 

(12)开始训练:

        train_loss = []
        loss_function = nn.MSELoss()
        optimizer = torch.optim.Adam(model.parameters(), lr=1e-2, betas=(0.9, 0.999), eps=1e-08, weight_decay=0)

        for i in range(200):
            out = model(train_x)
            loss = loss_function(out, train_y)
            loss.backward()
            optimizer.step()
            optimizer.zero_grad()
            train_loss.append(loss.item())

(13)绘制损失曲线:

        # loss曲线
        plt.figure()
        plt.plot(train_loss, 'b', label='loss')
        plt.title("Train_Loss_Curve")
        plt.ylabel('train_loss')
        plt.xlabel('epoch_num')
        plt.legend()
        plt.show()

(14)模型评估:

        model = model.eval()  # 转换成评估模式
        # 注意这里用的是全集 模型的输出长度会比原数据少DAYS_FOR_TRAIN 需要填充使长度相等
        dataset_x = dataset_x.reshape(-1, 1, DAYS_FOR_TRAIN)  
        dataset_x = torch.from_numpy(dataset_x).to(torch.float32)  # 转为pytorch的tensor对象
    
        pred_test = model(dataset_x)  # 全量训练集
        pred_test = pred_test.view(-1).data.numpy()
        pred_test = np.concatenate((np.zeros(DAYS_FOR_TRAIN), pred_test))  # 填充0 使长度相同

(15)逆变换预测结果:

# 逆变换预测结果
preds = scaler.inverse_transform(pred_test.reshape(-1, 1))
reals = scaler.inverse_transform(df_normalized.reshape(-1, 1))

(16)绘图(预测值-实际值):

(17)计算准确率:

       # 计算准确率
        errors = abs(preds - reals)

        errors_01 = [e < t * 0.01 for e, t in zip(errors, reals)]
        errors_03 = [e < t * 0.03 for e, t in zip(errors, reals)]
        errors_05 = [e < t * 0.05 for e, t in zip(errors, reals)]
        errors_10 = [e < t * 0.10 for e, t in zip(errors, reals)]
        errors_15 = [e < t * 0.15 for e, t in zip(errors, reals)]

        count_01 = np.mean(errors_01)
        count_03 = np.mean(errors_03)
        count_05 = np.mean(errors_05)
        count_10 = np.mean(errors_10)
        count_15 = np.mean(errors_15)

        print("误差 1%: ", count_01)
        print("误差 3%: ", count_03)
        print("误差 5%: ", count_05)
        print("误差 10%: ", count_10)
        print("误差 15%: ", count_15)

三 小结

模型没有进行任何处理,直接预测的结果较好,如果想进一步提高模型的精度,需要进行参数调整:

  • 隐藏状态维度(hidden size/dimension):定义LSTMLSTM记忆细胞的容量。较大的隐藏尺寸可以捕获更复杂的信息,但也会增加计算成本和过拟合的风险。
  • 层数(num_layers):LSTM层的数量。增加层数可以学习更深层次的特征表示,但也可能带来梯度消失/爆炸问题,并增加训练时间和计算资源需求。
  • 学习率(learning rate):这是优化器在梯度下降过程中更新权重的步长。选择合适的学习率很关键,过高可能导致训练不稳定,过低则收敛速度慢。常见的初始学习率范围为10e-2至10e?4,并可能在训练过程中动态调整。
  • 批量大小(batch size):每次迭代时处理的数据样本数量。较大的批量可以加速计算,但可能会导致泛化能力降低和内存需求增加。较小的批量提供了更好的泛化能力,但训练速度较慢。
  • 激活函数:虽然不是直接的超参数,但选择不同的激活函数(如tanh、ReLU或softsign)会影响模型的训练动态和性能。
  • 优化器(optimizer):如Adam、RMSprop、SGD等,不同的优化器有不同的更新规则,影响学习效率和最终性能。
  • dropout比例:在训练过程中随机“丢弃”一部分神经元以减少过拟合,常见的dropout比例为0.2至0.5。
  • 序列长度(sequence length):对于时间序列数据,决定输入序列的长度,可能影响模型理解和捕捉长期依赖的能力。

相关推荐

sharding-jdbc实现`分库分表`与`读写分离`

一、前言本文将基于以下环境整合...

三分钟了解mysql中主键、外键、非空、唯一、默认约束是什么

在数据库中,数据表是数据库中最重要、最基本的操作对象,是数据存储的基本单位。数据表被定义为列的集合,数据在表中是按照行和列的格式来存储的。每一行代表一条唯一的记录,每一列代表记录中的一个域。...

MySQL8行级锁_mysql如何加行级锁

MySQL8行级锁版本:8.0.34基本概念...

mysql使用小技巧_mysql使用入门

1、MySQL中有许多很实用的函数,好好利用它们可以省去很多时间:group_concat()将取到的值用逗号连接,可以这么用:selectgroup_concat(distinctid)fr...

MySQL/MariaDB中如何支持全部的Unicode?

永远不要在MySQL中使用utf8,并且始终使用utf8mb4。utf8mb4介绍MySQL/MariaDB中,utf8字符集并不是对Unicode的真正实现,即不是真正的UTF-8编码,因...

聊聊 MySQL Server 可执行注释,你懂了吗?

前言MySQLServer当前支持如下3种注释风格:...

MySQL系列-源码编译安装(v5.7.34)

一、系统环境要求...

MySQL的锁就锁住我啦!与腾讯大佬的技术交谈,是我小看它了

对酒当歌,人生几何!朝朝暮暮,唯有己脱。苦苦寻觅找工作之间,殊不知今日之事乃我心之痛,难道是我不配拥有工作嘛。自面试后他所谓的等待都过去一段时日,可惜在下京东上的小金库都要见低啦。每每想到不由心中一...

MySQL字符问题_mysql中字符串的位置

中文写入乱码问题:我输入的中文编码是urf8的,建的库是urf8的,但是插入mysql总是乱码,一堆"???????????????????????"我用的是ibatis,终于找到原因了,我是这么解决...

深圳尚学堂:mysql基本sql语句大全(三)

数据开发-经典1.按姓氏笔画排序:Select*FromTableNameOrderByCustomerNameCollateChinese_PRC_Stroke_ci_as//从少...

MySQL进行行级锁的?一会next-key锁,一会间隙锁,一会记录锁?

大家好,是不是很多人都对MySQL加行级锁的规则搞的迷迷糊糊,一会是next-key锁,一会是间隙锁,一会又是记录锁。坦白说,确实还挺复杂的,但是好在我找点了点规律,也知道如何如何用命令分析加...

一文讲清怎么利用Python Django实现Excel数据表的导入导出功能

摘要:Python作为一门简单易学且功能强大的编程语言,广受程序员、数据分析师和AI工程师的青睐。本文系统讲解了如何使用Python的Django框架结合openpyxl库实现Excel...

用DataX实现两个MySQL实例间的数据同步

DataXDataX使用Java实现。如果可以实现数据库实例之间准实时的...

MySQL数据库知识_mysql数据库基础知识

MySQL是一种关系型数据库管理系统;那废话不多说,直接上自己以前学习整理文档:查看数据库命令:(1).查看存储过程状态:showprocedurestatus;(2).显示系统变量:show...

如何为MySQL中的JSON字段设置索引

背景MySQL在2015年中发布的5.7.8版本中首次引入了JSON数据类型。自此,它成了一种逃离严格列定义的方式,可以存储各种形状和大小的JSON文档,例如审计日志、配置信息、第三方数据包、用户自定...

取消回复欢迎 发表评论: