杨璐嘉 : 治学无界,不应以文理为自我设限 | 提升之路系列(二)

2021-12-31 15:44:00 浏览数 (1)

导读

为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。

至今,已有来自全校45个院系的3055名同学参加大数据能力提升项目,其中556位同学通过课程学习和实践获得由清华大学研究生院颁发的“清华大学大数据能力提升项目证书”。

谈起最大的收获,同学们表示无论是自身的数据思维还是本专业与大数据技术相结合的科研能力以及实践经验等方面均得到了很大的提升。清华的数据科学人才培养究竟有什么特别之处?让我们一起通过他们的故事,揭秘各院系清华学子的大数据提升之路吧!

杨璐嘉 人文学院

我是一名正统的文科生,本科学习新闻传播学,研究生学习科学技术史。与清华大学大数据能力提升项目(以下简称:项目)结缘是无意中在微信群里看到的一句宣传语“欢迎不同学科专业的同学选修”激励了我。为什么文科生不能有大数据思维,培养大数据能力呢?于是我决定报名,扩展自己的边界。

在一年的学习中,从一名没有数据思维,不懂代码的小白,到目前可以做一些基本的数据挖掘、分析的工作,大数据项目对我的成长帮助显而易见。从此,我的名片上多了一项大多数文科生所不具备的:数据能力。它不仅仅是一种使用工具的能力,更是一种思维能力,我尝试将其延伸到了从科研到实践的各个方面。

(一) 将数据思维运用到文科科研中

常规的传播学研究,尤其是涉及历史的研究,都是以质性分析为主,不涉及量化方法。当我在对北伐战争舆论进行研究时,我意识到可以将质性和量化方法结合,量化赋予研究以客观和整体性,而深入分析的质性分析赋予研究以深度。接下来,如何将二者恰当的结合成为了一个问题,尤其是我主攻的符号学理论如何被量化?最终,我将研究对象,也就是民国画报的图像文本进行拆解,拆解为图像基本信息和标志性元素两个类目。图像基本信息的描述性统计结果可作为确认两画报政治立场的基础证据,而对标志性元素的分析可以再现文本更深层次的意义。最终完成了对十万字文本、千幅图片的分析,在数据与符号、图像与历史的互读中,考察出民国两大画报如何以图像表征其支持党派的军事口号和政治倾向,并如何对大众进行政治上的“视觉劝服”。2020 年底,该文章已在传播学顶刊(CSSCI)《国际新闻界》上发表。

(二) 积极参加大数据竞赛、实践和志愿活动

2021 年 3 月,在项目课程《媒体数据挖掘》中,出于对国际议题的关注, 我们提出了一个问题:一带一路上的恐怖主义情况如何?2021 年初,我和团队成员开始对此议题的数据进行收集和分析。对 Global Terrorism Database、Data For Belt And Road 等数据库进行整理,利用 python 爬取媒体数据,并利用 R 语言 plotly 包、d3.js、flourish 等对数据进行可视化,我们制作出数据可视化作品《丝路危机:“一带一路”上的恐怖主义》, 该作品在今年 8 月已入围中国数据内容大赛决赛。这个成果,集中体现了我作为文科生的社会洞察力和学习大数据项目后的数据分析力。

2021 年 6 月-10 月,我参与到了项目暑期实践中。我们了解到,北京妇产医院妇瘤科目前已经积累各类妇科恶性肿瘤病例上万例,但数据始终没有很好的利用起来。

因此,我们希望帮助该科室建立一个集录入、查询、导出、可视化分析为一体的智能专病数据库。虽然大家来自电子、社科、新闻、经管等院系,看起来这件事情似乎很难做成。但我相信事在人为,通过几个月对DWF 和其他数据分析工具的学习以及跨专业的沟通和合作,我们一起打磨出了产科在线数据库(如下图),极大程度方便了医生护士对病人资料的管理,项目最终获得“优秀实践团队奖”。

PC 端数据查询与可视化(基于 DWF)

移动端数据查询与可视化

2021 年 3 月至今,因为一直对神经医学感兴趣,我参与到了北京市儿童医院与清华大学医学院组织的社会志愿服务中,我担任项目助理,几乎每周前往医院,配合医生和工程师工作,配合医生和工程师利用脑机接口设备,检查弱视儿童。我负责为孩子们打脑电膏,以及采集样本数据。和医生一起就着凳子吃午饭、和工程师一起安抚孩子们、和孩子们一起聊王者荣耀、宽慰门外焦急等待的家长……虽然辛苦,但却感受到了百态人生中的温暖。之前在我眼前的只是存在于电脑里病患的几行枯燥的数据,但现在展示在我面前的是数据背后每个人真实的冷暖人生。

阻抗图

打完脑电膏的孩子

(三) 前往业界尝试参与大数据平台搭建

2021 年暑假,因为项目学习经历的背书,我成为了京东的一名数据产品经理,此前,很少有文科生能担任互联网公司的数据产品经理。参与 S 级项目“京东 CDP(消费者数据平台)”从 0 到 1 搭建,产品为企业提供对消费者运营、营销和广告投放的全链路服务。

我负责人群管理模块的搭建。人群管理应包含从上传、查看、圈选到投放人群的全流程。新增“人群上传”,支持 API 批量接入客户 数据,指数倍提升客户创建人群的效率;迭代“人群列表”和“人群圈选”,支持圈人时对人群数量作实时计算,并回传至人群列表,提升客户体验;迭代“人群投放”功能,支持投放至腾讯广告和巨量引擎,并对投放至京东域的链路进行优化,使人群数据利用率在现有基础上提 30%以上。实习期间,将人群管理模块的产品完成度从 60%提升到 100% 。相比于其他的产品经理,我发现自己能更快理解研发同学,也能更快掌握数据平台的逻辑。这得益于我在大数据项目中的学习。

在完成大数据项目之后,我得出的最终结论是:不应以文理为自己设限。从科研到实践, 我越来越坚信,知识是无边界的,它属于不设边界的人。

编辑:于腾凯

校对:杨学俊

0 人点赞