对流媒体传输关键指标作简单预测

时间：2019-04-01 17:03:12 阅读：225 评论：0 收藏：0 [点我收藏+]

标签：存储 mic top proc sans round 均值 list play

小书匠

本文目录：

1.数据情况
2.数据预处理
3.样本划分及标签处理
4.模型训练
5.模型评估
6.预测未来下一个６个指标

现收集有流媒体传输过程中的６个指标，这些指标分别是：

PDCCH信道CCE可用个数 AvaPdcch

PDCCH信道CCE占用个数 OccPdcch

RRC连接最大数 ConRrc

上行PRB平均利用率 UpPrb

下行PRB平均利用率 DownPrb

有效RRC连接最大数 EffConRrc

1.数据情况

每个指标的数据格式为：Data-Time-Value，本文首先对数据进行预处理，然后使用LSTM对这６个指标作简单预测。

import pandas as pd 
import numpy as np 
 
filenames=[‘AvaPdcch‘,‘OccPdcch‘,‘ConRrc‘,‘UpPrb‘,‘DownPrb‘,‘EffConRrc‘]  #属性列表 
 
#读取数据 
dataset=[] 
for filename in filenames: 
    df=pd.read_csv(filename+‘.csv‘,delimiter=‘,‘) 
    partfea=np.array(df)[:,-1] 
    dataset.append(partfea) 
 
dataset=np.array(dataset) 
dataset=dataset.T 
 
print(dataset.shape,dataset[1302]) 

输出：

(1378, 6) [nan nan 18.0 nan nan 8.0]

从这输出可以看出，数据量就是1378个，每个数据量是前文的６个指标。并且数据中包含缺失值，为了简单，这里使用均值进行填充，实际上还可以更加灵活处理缺失值，比如整行/列去掉，进行插值等。

2.数据预处理

缺失值填充

from sklearn import preprocessing 
 
impute = preprocessing.Imputer() 
dataset = impute.fit_transform(dataset) 
 
print(dataset.shape,dataset[1302]) 

输出：

(1378, 6) [ 7.31026325e+07 9.40476974e+06 1.80000000e+01 3.38872727e-02
1.92543953e-01 8.00000000e+00]

数据归一化

from sklearn.preprocessing import MinMaxScaler 
 
scaler = MinMaxScaler(feature_range=(0, 1)) 
dataset = scaler.fit_transform(dataset) 
 
print(dataset.shape,dataset[1302]) 

输出：

(1378, 6) [ 0.5072962 0.23767169 0.22222222 0.17733455 0.21859107 0.23809524]

3.样本划分及标签处理

后一个数据作为前一个数据的标签，模型最终是基于当前的数据预测下一状态数据。

train_size=int(0.8*len(dataset)) 
#训练集 
train_X=dataset[0:train_size,:] 
train_y=dataset[1:train_size+1,:] 
#验证集 
vali_X=dataset[train_size:,:] 
vali_y=dataset[train_size+1:,:] 
  
train_X=train_X.reshape(train_X.shape[0],1,train_X.shape[1]) 
vali_X=vali_X.reshape(vali_X.shape[0],1,vali_X.shape[1]) 
 
print(train_X.shape,train_y.shape,vali_X.shape,vali_y.shape) 

输出：

(1102, 1, 6) (1102, 6) (276, 1, 6) (275, 6)

4.模型训练

import keras 
from keras.models import Sequential 
from keras.layers import Dense 
from keras.layers import LSTM 
from keras.utils import plot_model 
from IPython.display import SVG 
 
from keras.utils.vis_utils import model_to_dot 
 
#构建LSTM网络 
model=Sequential() 
model.add(LSTM(32,input_shape=(1,6))) 
model.add(Dense(6)) 
 
#编译模型 
model.compile(loss=‘mean_squared_error‘, optimizer=‘adam‘) 
 
#打印模型 
model.summary() 
 
#保存模型 
SVG(model_to_dot(model,show_shapes=True).create(prog=‘dot‘, format=‘svg‘)) 
 
#训练LSTM网络 
model.fit(train_X, train_y, epochs=10, batch_size=1, verbose=1) 

5.模型评估

#预测数据 
valipredict=model.predict(vali_X) 
print(valipredict.shape,vali_y.shape) 

#画图模型预测显示 
finalypredict=[] 
#归一化后的数据画图,有6列 
plt.subplots(2,3,figsize=(18,6))  
for ind in range(6): 
    #归一化数据转换为真实数据 
    valipredict_real=valipredict[:,ind]*(scaler.data_max_[ind]-scaler.data_min_[ind])+scaler.data_min_[ind] 
    vali_y_real=vali_y[:,ind]*(scaler.data_max_[ind]-scaler.data_min_[ind])+scaler.data_min_[ind] 
     
    #未来的6个真实值 
    finalypredict.append(valipredict_real[-1]) 
     
    plt.subplot(2, 3,ind+1) 
    plt.title(filenames[ind])  
    plt.plot(valipredict_real,color=‘red‘,label=‘valipredict‘) 
    plt.plot(vali_y_real,color=‘green‘,label=‘vali_y‘) 
 
plt.show() 

模型在验证数据上的预测效果

由图可以看出，６个指标基本的趋势被正确预测，但是某个时刻的准确度不是很高，我认为原因有几个：

数据量太少，导致模型无法学习足够的特征

特征太简单，某个指标的预测仅仅依赖于包括自身在内的历史时刻的６个值，这明显不够，可以考虑加入更多特征。比如这几个值明显对”时间“敏感，不同的时间区间内，流媒体的传输需要不同，将时间考虑进去将使得模型学习到更加丰富的特征

模型太简单，在数据量少，特征不多的情况下，我只用了一层的LSTM。

6.预测未来下一个６个指标

将数据中的最后的６个指标输入已经训练好的模型，模型输出６个值，该６个值作为模型预测到的未来下一个６个指标值。

#前文已经存储，直接输出 
print(finalypredict) 

[93690488.0, 25693568.0, 40.356155, 0.088783175, 0.64066094, 17.614025]

对流媒体传输关键指标作简单预测

标签：存储 mic top proc sans round 均值 list play

原文地址：https://www.cnblogs.com/wushaogui/p/10637277.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行