利用神经网络实现多元线性回归预测方案

WHY（目的、理念）

基于结构性归因和相关性分析的输入数据进行机器学习训练、预测，输出线性回归数据和可视化图表。

HOW（方法、措施）

利用神经网络实现多元线性回归预测方案

机器学习方案

一、创建模型

// 构造一个线性回归模型
function createModel(numOfFeatures) {
  // 通过tf.sequential()工厂函数创建Sequential模型
  const model = tf.sequential();
  // 输入层
  // 定义inputShape定义为1
  // units设置权重矩阵在层中的大小。通过将它设为1，意味着数据的每个输入特征都有一个权重
  model.add(tf.layers.dense({ inputShape: [numOfFeatures], units: 1 }));
  // 输出层
  // units设置为1，意味着输出一个数据
  model.add(tf.layers.dense({ units: 1 }));

  return model;
}

二、准备数据，将数据转换为张量

归一化公式：利用神经网络实现多元线性回归预测方案

function convertToTensor(data) {
  return tf.tidy(() => {
    // 获取因变量
    const inputs = data.x;
    // 获取自变量
    const labels = data.y;
    
    // 转换数组数据为2d张量
    // e.g. input: [1,2,3]
    // output: [[1], [2], [3]]
    const inputTensor = tf.tensor2d(inputs);
    const labelTensor = tf.tensor2d(labels, [labels.length, 1]);

    // 将数据归一化，解决大数据计算的问题
    const inputMax = inputTensor.max();
    const inputMin = inputTensor.min();
    const labelMax = labelTensor.max();
    const labelMin = labelTensor.min();

    const normalizedInputs = inputTensor
      .sub(inputMin)
      .div(inputMax.sub(inputMin));
    const normalizedLabels = labelTensor
      .sub(labelMin)
      .div(labelMax.sub(labelMin));

    return {
      inputs: normalizedInputs,
      labels: normalizedLabels,
      inputMax,
      inputMin,
      labelMax,
      labelMin,
    };
  });
}

三、训练模型

输入张量x映射到输出张量y通过等式利用神经网络实现多元线性回归预测方案来描述，其中_kernel_和_bias_为dense层可调参数。它们的值是在创建模型时是随机选择的，这些随机值不能很好地预测。为了进行更准确的预测，我们必须通过模型从数据中学习来寻找更好的_kernel_值和偏差值。这个搜索就是训练过程。

function trainModel(model, inputs, labels) {
  return new Promise((resolve, reject) => {
    model.compile({
      optimizer: 'sgd',
      loss: 'meanAbsoluteError',
      metrics: ['mse'],
    });

    const batchSize = 32; // 批处理大小
    const epochs = 200; // 训练次数

    return model
      .fit(inputs, labels, {
        batchSize,
        epochs,
        callbacks: { onEpochEnd: (epoch, logs) => console.log(logs) },
      })
      .then(res => {
        resolve(res);
      })
      .catch(err => {
        reject(err);
      });
  });
}

四、预测

function predict(model, inputData, normalizationData) {
  const { inputMax, inputMin, labelMin, labelMax } = normalizationData;

  const arr = tf.tidy(() => {
    // 创建100个新示例来提供给模型
    const xs = tf.linspace(0, 1, 100);
    // 通过reshape将1d张量转换为2d张量
    const preds = model.predict(xs.reshape([100, 1]));
    // 将数据转换为原始的值
    const unNormXs = xs.mul(inputMax.sub(inputMin)).add(inputMin);

    const unNormPreds = preds.mul(labelMax.sub(labelMin)).add(labelMin);

    return [unNormXs.dataSync(), unNormPreds.dataSync()];
  });

  const xs = arr[0];
  const preds = arr[1];

  const predictedPoints = Array.from(xs).map((val, i) => {
    return { x: val, y: preds[i] };
  });

  const originalPoints = inputData.map(d => ({
    x: d.x,
    y: d.y,
  }));

  return {
    predictedPoints,
    originalPoints,
  };
}

可视化效果（一元线性回归为例）

利用神经网络实现多元线性回归预测方案

WHAT（现象、成果）

均方误差

均方误差是各数据偏离真实值的距离平方和的平均数。

公式：利用神经网络实现多元线性回归预测方案

对于预测结果的评估方法通过计算损失函数的loss值与手动计算的均方误差进行对比得出，其中loss值比手动计算的均方误差越低表示预测结果越精准。

function evaluate(inputs, labels) {
  const result = labels.sub(inputs).pow([2]).mean();
  result.print();
  return result;
}

评估结果

通过手动计算的均方误差约为：0.16，通过配置epochs为200训练之后loss值为：0.017，这表示预测是数据比手动计算的精度高出多倍。

参考

《深度学习之Javascript》: [https://wendydesigner.github.io/DLwithjs---chinese/

](link.zhihu.com/?target=htt…)

利用神经网络实现多元线性回归预测方案

相关概念

机器学习

TFJS

统计学

WHY（目的、理念）

HOW（方法、措施）

WHAT（现象、成果）

均方误差

评估结果

参考

常见问题FAQ

掘金(阿里巴巴业务中台前端) SVIP

发表评论

如需帝国cms功能定制以及二次开发请联系我们

升级SVIP会员

工作时间

相关概念

机器学习

TFJS

统计学

WHY（目的、 理念）

HOW（方法、措施）​

WHAT（现象、成果）

均方误差

评估结果

参考

常见问题FAQ

掘金(阿里巴巴业务中台前端) SVIP

相关推荐

发表评论

如需帝国cms功能定制以及二次开发请联系我们

升级SVIP会员

工作时间

请选择支付方式

WHY（目的、理念）

HOW（方法、措施）