码迷,mamicode.com
首页 > 其他好文 > 详细

海量电力设备监测数据的存储和特征分析

时间:2020-05-01 16:54:33      阅读:76      评论:0      收藏:0      [点我收藏+]

标签:流式计算   jar   tensor   规模   设备   content   消息   信号   ams   

一、电力设备在线监测的目的及意义

1、项目背景

电力设备在线检测是指在不停电的情况下,对电力设备状况进行连续或周期自动检测监视。运用传感器技术、广域通信技术、信息处理技术
实时感知-->监视预警-->分析诊断-->评估预测
电力设备在线检测是实现电力设备运行检修管理、提升生产运行管理精益化的重要手段,对提升电网智能化水平,实现电力设备状态运行管理具有积极而深远的意义。
例如:海量数据处理平台
变压器油色谱监测,容性设备在线检测,数字化变电站,山火监测,雷电定位系统,覆冰预警系统,SCADA系统。

2.数据特点:

规模巨大:TB->PB 【一个省级电网公司,150+变电站,150TB、day】
数据处理速度:性能瓶颈,实时监控画面刷新周期小于5s
数据类型多样:结构化,半结构化,非结构化
价值密度低:在正常数据占据大多数,希望发现隐匿在里面的价值数据。

3.国家电网公司数据存储和系统架构【现状】

  • 过于依赖集中式SAN存储
  • 基于SOA的数据集成
  • 主要采用“企业级关系型数据库”
  • 只存储二次加工的“熟数据”
  • 速度慢,静态,关联性强
  • OLTP没有用武之处
  • 容量,性能,可靠性,扩展性
  • 一次性设备绝缘放电电流波形信号

4.先进的技术解决

阿里云、亚马逊、ODPS、HADOOP,SPARK,HBASE,STORM,ZOOKEEPER

5.选择计算场景

流式计算:消息触发,单挑处理,实时计算
在线计算:用户触发,频繁交互,快速响应
离线计算:定时安生,批量处理,实时性差

二、监测数据分析方法介绍

1、局部放电相位分析

局部放电相位分析(phase resolved partial discharge, PRP D) 将多个工频周期内监测所得的局部放电参数(放电次数N、视在放电量Q或放电幅值,及放电所在相位p)折算到一个工频周期内,计算其统计规律性,获取放电谱图,统计放电特征,用于模式识别。

参数提取-->放电谱构造-->统计特征计算-->放电类别识别

2.基本参数n-q-p的获取

以变压器局部放电监测数据为例,使用经典的局部放电相位分析法,计算局部放电波形相位信息n-q-p参数,并在此基础上计算放电谱图。
对于局部放电脉冲,具有以下三个基本参数:
①放电量q;:第i次放电的视在放电量;
②放电相位p;:第i次放电脉冲存在的工频电压相位;
③放电重复率n:单位时间内的放电次数。
由于这三个参数具有很强的统计分散性,需要对若干个工频周期(50个)内的基本参数进行统计处理,以突出基本参数的变化规律,有利于反映局部放电特性,这就需要计算放电谱图。

三、MaxCompute介绍

大数据计算服务(MaxCompute,原名ODPS)是一种快速、完全托管的EB级数据仓库解决方案。
随着数据收集手段不断丰富,行业数据大量积累,数据规模已增长到了传统软件行业无法承载的海量数据(百TB、PB、EB)级别。MaxCompute致力于批量结构化数据的存储和计算,提供海量数据仓库的解决方案及分析建模服务。
由于单台服务器的处理能力有限,海量数据的分析需要分布式的计算模型。分布式的计算模型对数据分析人员要求较高且不易维护。数据分析人员不仅需要了解业务需求,同时还需要熟悉底层分布式计算模型。MaxCompute为您提供完善的数据导入方案以及多种经典的分布式计算模型,您可以不必关心分布式计算和维护细节,便可轻松完成大数据分析。
目前,MaxCompute服务已覆盖全球16个国家和地区,客户遍及金融、互联网、生物医疗、能源、交通、传媒等行业,为全球用户提供海量数据存储和计算服务。MaxCompute的多个客户案例荣获“2017大数据优秀产品和应用解决方案案例”奖。此外,MaxCompute、DataWorks以及AnalyticDB代表阿里云入选了Forrester Wave™ Q4 2018云数据仓库报告。

四、电力设备监测数据的MaxCompute表存储

1、MaxCompute字段限制

  • 列数量小于1024个
  • 支持数据类型不能存储多个【成千上万】采样点的值

2、DDL建表

  // 建表
create table if not exists ODPS_PD(Time string, Phase bigint, Value bigint) partitioned by(DeviceID string,  Date string);
  // 查询
List tables;
// 添加分区
alter table ODPS_PD add if not exists partition (DeviceID= ‘001‘, Date = ‘20200501‘); 
// 导入数据
tunnel upload d:\.....csv ODPS_PD/DeviceID= ‘001‘, Date = ‘20200501‘;
// 读取数据
read ODPS_PD;

3、并行特征计算,Eclipse和IDEA的MaxCompute插件,即可创建ODPS项目。

  • Eclipse Step 01官网导航中找到并下载ODP S for eclipse插件
    Step 02将插件解压并复制到问eclipse安装目录下的plug-in子目录下
    Step 03启动eclipse
    Step 04检查Wizard选项里面是否有ODP S的目录
  • IDEA 搜索插件 MaxCompute Studio安装即可。 使用MaxCompute实现监测数据统计特征分析的完整过程,最终让学员可以自己胜任在阿里云上的数据分析任务。实验中用到的数据是变压器局部放电的谱图数据,使用的数据分析工具是MaxCompute提供的MapReduce编程模型,要求使用Java语言编写程序,实现数据分析任务。

4、资源上传程序jar包

// 上传 add jar d:/NQF.jar; // 查询资源 ls resources; // 执行,依赖主类的名称FSDriver,还需要依赖本地的JAR来解析 jar -resources NQF.jar -classpath D:\NQF.jar FSDriver 输入表 输出表;

5、放电类型识别

  • 阿里云MaxCompute【模式识别算法】【Graph模式识别算法】
  • 阿里云机器学习平台 PAI
  • Apache Mahout
  • Spark的MLlib
  • 谷歌的TensorFlow

海量电力设备监测数据的存储和特征分析

标签:流式计算   jar   tensor   规模   设备   content   消息   信号   ams   

原文地址:https://www.cnblogs.com/vwvwvwgwgvervae/p/12813793.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!