4页 电力系统数据集成平台设计方案

VIP专享
4.0 海阔天空 2024-02-27 178 1.57MB 4 页 免费
侵权投诉
电子设计工程
Electronic Design Engineering
28
Vol.28
14
No.14
20207
Jul. 2020
稿2019-11-01 稿件编号:201911002
中国037800HK42180048
江 疆1982
数据共享是指对来自不同数据源的异构数据进
行 逻 辑 和 物 理 层 面 的 集 中 存 储 ,并 且 实 现 统 一 访
[1-3]
基于大数据的电力系统数据集成管理平台设计
12222
1. 广东电网有限责任公司 广东 广州 5100002. 广东电网有限责任公司 信息中心,广东 广州 510000
针对当前电力数据海量异构和共享度不高的问题,结合 Hadoop 和电力企业数据共享的必要
Hadoop HDFS 分布式文件系统
HBase
Apriori 算法的问题,Apriori 算法进行改进,具体则是引入 MapRduce 并行化处
Apriori 算法运算效率,进而达到提高电力元数据挖掘效率。最后
Hadoop
Hadoop Apriori
TN98 文献标识码:A文章编号:1674-6236202014-0163-04
DOI:10.14022/j.issn1674-6236.2020.14.036
Design of power system data integration management platform based on large data
JIANG Jiang1LIANG Ying⁃wei2PENG Ze⁃wu2FENG Xinyao2XIE Yuyang2
1. Guangdong Power Grid Co.Ltd.Guangzhou 510000China2. Information CenterGuangdong
Power Grid Co.Ltd.Guangzhou 510000China
Abstract: Aiming at the problem of massive heterogeneous power data and low sharing degree
combining the necessity of data sharing between Hadoop and power enterprisesa data integrated
management platform based on Hadoop is proposed. In order to realize the platformfirstlythe HDFS
distributed file system is used to manage the metadataso as to improve the integrated management
efficiency of massive datathe HBase data sharing mode is used to improve the data sharing degree
finallythe Apriori algorithm is improved for the problems of traditional Apriori algorithmspecifically
the maprduce parallel processing framework is introduced to design the algorithmso as to improve the
aprior. I algorithm operation efficiencyand then to improve the efficiency of power metadata mining.
Finallythe Hadoop platform is built to verify the efficiency of the above platform in the massive power
metadata mining.
Key words: Hadoop architecturemetadataintegrated managementApriori algorithm
--163
电子设计工程2020年第 14
1数据共享平台
1.1 平台整体架构设计
文中针对前文中所分析总结出的四点问题,
时依据我国国家电网公司的信息化建设思路,提出
Hadoop 架构的数据共享平台,其整体架构
1[4-6]
1
1基于 Hadoop架构的电力企业数据共享平台
1.2 元数据管理方案设计
在本文构建的电力企业数据共享模型中,采用
HDFS 分布式文件系统的元数据管理方案,
2[7-9]
2基于 HDFS的电力元数据管理方案
2可以看到该管理方案采用了镜像文件+
操作日志文件动态集成方式。通过上述方法,就能
够 在 系 统 故 障 时 依 靠 次 元 数 据 节 点 Secondary
NameNode [10]
1.3 数据共享模式
根 据 图 1所 示 的 整 体 架 构 方 案 ,基 于 开 源 的
Hadoop 框架的数据仓库层负责实现对不同业务系
HBase 作为数据共享的桥梁,建立全局
3[11-12]
2 Apriori 算法的并行化设计
出一种基于并行化改进的 Apriori
2.1 Apriori 算法改进
研究认为传统的 Apriori 算法在寻找强关联规则
Boole
扫 描 事 务 数 据 库 ,将 其 转 换 为 0-1 Boole
矩 阵 。
Dmn =
ì
í
î
ï
ï
ï
ï
ü
ý
þ
ï
ï
ï
ï
D1
D2
...
Dm
1
--164
摘要:

电子设计工程ElectronicDesignEngineering第28卷Vol.28第14期No.142020年7月Jul.2020收稿日期:2019-11-01稿件编号:201911002基金项目:中国南方电网科技项目(037800HK42180048)作者简介:江疆(1982—),男,湖北黄石人,博士,工程师。研究方向:控制科学与工程。数据共享是指对来自不同数据源的异构数据进行逻辑和物理层面的集中存储,并且实现统一访问。通过实现数据共享,能够更有效地实现资源集中管控,显著提升数据的利用效率。随着我国智能电网的迅速发展,生产运营过程中的海量异构数据资源规模增长趋势呈指数级发展,但是在数据共...

展开>> 收起<<
4页 电力系统数据集成平台设计方案.pdf

共4页,预览2页

还剩页未读, 继续阅读

声明:菜根智库所有资料均为用户上传分享,仅供参考学习使用,版权归原作者所有。若侵犯到您的权益,请告知我们处理!任何个人或组织,在未征得本平台同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。
作者:海阔天空 分类:数字化 价格:免费 属性:4 页 大小:1.57MB 格式:PDF 时间:2024-02-27

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 4
客服
关注