导读
为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。
至今,已有来自全校45个院系的3055名同学参加大数据能力提升项目,其中556位同学通过课程学习和实践获得由清华大学研究生院颁发的“清华大学大数据能力提升项目证书”。
谈起最大的收获,同学们表示无论是自身的数据思维还是本专业与大数据技术相结合的科研能力以及实践经验等方面均得到了很大的提升。清华的数据科学人才培养究竟有什么特别之处?让我们一起通过他们的故事,揭秘各院系清华学子的大数据提升之路吧!
郑可迪 电机系
2017 年,我在清华大学电机系获得学士学位,随后继续在电机系攻读博士研究生,师从陈启鑫副教授。在研究生入学伊始,导师就建议我从事电力与大数据结合的研究, 希望利用智能电网时代的诸多量测数据挖掘关键信息服务于电力系统的需求。在师兄的建议下,我报名了大数据能力提升项目,希望在项目中培养数据思维,提升相关领域的知识技能,提升未来在科研和求职上的竞争力。
在研究生的第一年,我就完成了项目课程《大数据分析A》和《大数据分析与处理》的学习,在项目课程学习中我对数据分析技术和机器学习算法有了较为全面的了解,并参与了相应的大作业和算法比赛。在算法比赛的参与过程中,虽然没有取得较好的名次,但我第一次系统性地学习了 Scikit-learn 和算法流水线,为后续的科研打下了基础。与此同时,我还主动学习了吴恩达的机器学习课程和 S. Boyd 的分布式优化算法等,为自己开拓科研思路,形成博士论文工作体系提供了重要的帮助。
在博士期间,我的研究工作围绕电力用户行为分析和电力交易决策方法展开。在电力市场化改革背景下,围绕学术界和工业界的热点,以数据驱动和机器学习方法为工具,为电网公司和售电公司的终端用户管理和现货市场主体(包括发电集团、负荷聚合商等)的电力交易决策提供原创的方法和理论支持。
我的第一个工作是基于用户的智能电表大数据,提出了基于快速密度峰值搜索聚类方法和最大信息系数相关性分析的异常用电检测算法,实现了电力用户的快速聚类与非技术性损失分析。相关论文发表于高水平国际期刊IEEE Transactions on Industrial Informatics,并申请和授权中国、美国的多项发明专利,论文受到广泛关注并被多次引用(谷歌学术单篇引用达 100 次)。在 2020 年夏天参加大数据实践课程时,我们团队与百望公司合作,开展基于发票大数据的税收风险监控模型分析研究,我将相关的电力用户异常检测框架和算法应用到发票大数据中,最终工作得到了公司的认可,项目获得了课程优秀团队奖。
博士论文《不完全信息下模型数据混合驱动的电力交易决策方法研究》顺利通过答辩
我的第二个工作面向电力交易中的主体最优决策问题,希望通过电力市场的历史大数据和机器学习方法为不完全信息下的主体提供决策支持,这也是我博士论文工作的主要内容。针对电力现货市场的一般性组织形式,从市场出清的基本模型出发分析了市场出清结果与主体报价之间的内在规律以及节点电价在空间分布中满足的基本规律,提出了数据驱动的节点电价子空间聚类方法以计算某一时刻全网节点电价对应的阻塞状态,以及不同阻塞状态下节点电价在空间中的分布情况,为电力市场中不同类型的市场主体(包括价格引领者和价格接受者)以及电力金融工具(如金融输电权等)投资者的电力交易决策提供了基础性的工具。此外,针对节点电价的预测问题,提出了基于分量预测和模型集成的预测方法,并通过模型集成避免尖峰电价对模型的影响,进一步提升整体预测精度。我的以上成果在 IEEE Transactions on Smart Grid 等 SCI 期刊发表了多篇论文,并申请多项发明专利,以唯一学生作者身份与 Springer 和科学出版社合作出版英文专著《Data Analytics in Power Markets》,并在今年 12 月 10 日顺利通过博士论文的答辩。
国际会议上作学术报告
在研究生期间,我围绕数据驱动和机器学习的主题,在 IEEE TII、IEEE TPWRS、IEEE TSG、Energy、IEEE PES GM 等能源电气领域高水平期刊和会议发表(或接收)论文十余篇并作多次学术报告,受理和授权发明专利和软件著作权多项,同时担任 IEEE TPWRS、IEEE TSG、Applied Energy、IJEPES、EPSR、IEEE PES GM、PSCC 等知名期刊和会议审稿人,也获得了国家奖学金等荣誉。明年 1 月毕业后,我将以博士后的身份继续从事电力 数据的研究,围绕我国“双碳”目标和能源战略需求,服务我国电力和能源行业的发展。
编辑:于腾凯
校对:杨学俊