联系我们:010-88559646

  老师群

170086145

  学生群

179326524

209318323

215410234

客服电话:010-88559646

A5-电力客户行为分析

时间:2022-03-21        来 源:中国软件杯

第十一届中国软件杯大赛--A组赛题

赛题名称:电力客户行为分析

组类: A组( 本科、研究生、高职)

出题企业:东软教育科技集团

答疑老师:刘老师 liuchengwu@neuedu.com(请在邮件标题中标注【中国软件杯】)

线上赛题解析直播回放: https://wx.vzan.com/live/tvchat-1776423586?shauid=undefined&vprid=0&v=1653044914733

赛题简介:介绍整个赛题的实现目标、实用价值、涉及技术和整体要求

随着我国电力体制深入探索与改革,电力市场化进程不断加快,需要迅速提升电网公司在安全生产、电网规划、优质服务等方面的经营管理水平。目前电力公司相关内部数据越来越多,使用电力客户的数据,通过大数据分析手段,及时、准确地掌握客户用电行为特征,有助于对企业的电力营销和调度进行决策支撑,提高政府及工商业等部门的服务水平,提升企业的盈利能力和竞争能力。 

此次赛题基于电力客户数据进行处理,采用大数据分析技术对客户用电行为进行分析(电力用户包含社会机构、公司、高校、团体、居民等)。

赛题业务场景:描述赛题相关的真实企业业务背景。从真实场景中,适当简化或者提炼出适合比赛的赛题场景

一、业务场景:居民客户用电行为与缴费习惯分析

用电行为与缴费习惯一定程度上反映当地经济水平和消费能力,以某个区域为例,假设按照客户类型区分为高价值型、大众型、潜力型、低价值型四种,区分的原则见下表:

图片1.png


二、业务场景:电力客户模式编码

2.1 行为建模维度可以参考维度如:

基于行为结果,行为手段,行为主体;

用电模式,动态特性,不确定性;短期,中期,长期等预见行为模式。

2.2 数据编码

用户行为模式用稀疏编码来辨识,实现海量用电数据的压缩;

如通过对负荷曲线的聚类实现用户用电模式的提取,用户用电曲线本质是几种用电行为的叠加。

三、业务场景:电力用户集群辨识

根据不同的用户行为特征,如用户基本属性、电器设备使用、用电曲线形态等进行集群辨识;

基于大数据技术的电力用户行为分析,是基于多项高新技术的综合应用,关键模块涉及数据获取,数据编码,机器学习,深度学习等技术。

基本功能要求

任务1、计算 平均缴费金额、平均缴费次数,并以 csv 格式输出结果保存

“居民客户的用电缴费习惯分析 1.csv”

任务2、对每个居民客户的用电缴费情况按照上述四种居民客户类型进行归类,结果保存

”居民客户的用电缴费习惯分析 2.csv”

任务3、依据时间序列,预测最有可能成为高价值客户的TOP5,结果保存

“居民客户的用电缴费习惯分析 3.csv”

任务4、根据电力客户数据编码,建立电力用户用电模型,对企业电力营销和调度进行决策支撑,需要模型参数优化与评估分析,保存模型为 “企业电力营销模型.mdl”

任务5、根据不同的标准对用户进行集群划分,如某一用户的行为特征、用户基本属性、电器设备使用、用电曲线形态等,保存为“电力用户集群分析模型.mdl”

非功能性要求

1、系统运行顺畅无卡顿,无严重BUG。

2、逻辑合理、交互友好。

3、场景复杂,算法精确,有创意均为加分项。

4、文档应详细阐述所使用的技术算法,以及实现思路。

5、作品中应输出运行结果的准确率并有效评估。

实现条件:开发环境、实验平台、开发语言、数据库、编译器、涉及硬件等实现条件

开发环境及使用技术:

1、操作系统可选Windows、Linux。

2、开发语言推荐使用Python3。

3、模型训练不限机器学习,深度学习的框架和第三方工具。

4、对于训练使用的数据集不做限制,可使用开源或自行收集的数据且需要在文档中声明。 

5、需标注系统中哪些部分使用了开源代码、模型及出处。

测试数据或平台:提供给参赛者的测试环境和测试数据

测试数据供大家参考

测试数据下载:cph.xlsx

测试数据下载: 25家客户合计电量.rar

参赛学员自行参考:

电力网 http://www.chinapower.com.cn/sj/

http://www.chinapower.com.cn/bigdata/

国家政府官网 统计局 http://www.stats.gov.cn/等。

开发所需设备及设备指标需求说明

文档及其他要求

1、需求规格及使用说明书

2、概要设计文档(应包含所实现的所有场景及功能)

3、详细设计文档(应包含所使用的技术的详细介绍)

4、 Demo和源文件

各评分项及大致占比

1、创新价值(10%)

2、基本需求(10%):数据爬取,预处理形成可支持业务分析的数据文件

3、功能性技术需求(60%)

基本功能要求中 任务1, 2, 3每项完成占10%,任务4, 5每项完成占15% 

4、技术文档及展示汇报(20%)

(1)提供软件开发设计文档(内容包括需求分析、设计、实现、验证、部署使用说明等),完整项目的源代码,不得作弊抄袭(10%)

(2)展示清晰美观,汇报详实流畅,参赛者需制作项目展示的媒体文件(10%)  

初赛作品提交要求

1、源代码

2、可执行文件

3、演示视频(7分钟之内

4、相关文档(功能需求文档,技术说明文档,操作说明文档等)

5、项目演示PPT

【参赛团队作品中团队自主开发部分的软件作品著作权归参赛团队所有,其中具有市场应用及拓展的优秀作品,出题企业具有优先权,可以优先合作开发或者优先购买。另如基于该作品的任何合作升级开发、市场拓展等活动,以及在这一过程中所获得的任何商业费用,出题企业应与参赛团队协商解决。】 


主办单位

工业和信息化部

教育部

江苏省人民政府

承办单位

中国电子信息产业发展研究院

江苏省工业和信息化厅

江苏省教育厅

教育部高等学校计算机类专业教学指导委员会

信息技术新工科产学研联盟

南京航空航天大学

执行单位

中国信息化周报

中国(南京)软件谷

江苏软件产业人才发展基金会

南京市软件和信息服务集群发展促进机构

关于我们

客服电话:010-88559646

邮编:100048

联系地址:北京市海淀区紫竹院路66号赛迪大厦18层

网站备案/许可证号:京ICP备05039896号-10     京公网安备 11010802020860号