某高校毕业设计-数据分析课题技术实现篇
1.确定分析目标
1.法律,最高法标准案件发布后对酒驾量刑的影响。 2.教务处 分析各个学院的毕设指导情况分析
2.初步判断数据研判数据
2.1能不能找到数据–>可以找到
能不能找到数据 法律文书网找到了 教务处 教务数据可以直接导出
2.2分析指标
2.2.1 指标1 各个老师的毕设通过率
为完成这个指标,需要什么字段
学院名,专业名,指导教师,学生学号,学生姓名,企业老师姓名,选题,选题类型,是否通过
2.2.2 指标2 每年的毕设重修人数
为完成这个指标,需要什么字段
学院名,专业名,学生学号,是否通过
2.2.3 各个学院每年答辩通过率
为完成这个指标,需要什么字段
学院名,专业名,学生学号,是否通过
2.2.4 指标new
为完成这个指标,需要什么字段
…
2.2.15 指标new
为完成这个指标,需要什么字段
…
2.3 基于需要分析的目标确定需要哪些字段特征
汇总
学院名,专业名,指导教师,学生学号,学生姓名,学生的联系方式,企业老师姓名,选题,选题类型,答辩成绩,论文成绩,指导教师成绩
3.数据采集
python 或 一些工具 八爪鱼 后裔采集器 钞能力 但是采集的难度是有区别的
4.数据处理
**技术需要带一带大家**
常见包括
数据预处理
空缺值处理 重复值处理 异常值处理 数据集成 多个数据合并在一起 数据规约 完整数据集 100 字段,但我分析这个指标只需要10字段,我就提取10个字段作为子集,这样快,就是数据规约中的维度规约。数量规约。 数据转换。收入100亿 2000千元 0-1之间 数据转换
数据处理是遍布全周期的
5.数据分析实现
与数据处理是交叉
5.1指标1 各个老师的毕设通过率
实现流程
数据处理 数据集成 数据规约 数据子集 统计分析
**重点关注下**
绘图可视化 **重点关注下**
由图5-3分析 各个老师的毕设通过率XXX,相比往年XXXX,因此我们可以针对XXXX进行调整
5.2 指标2 每年的毕设重修人数
数据处理 数据集成 数据规约 数据子集 统计分析 重点关注下 绘图可视化 重点关注下 由图2-3分析 各个老师的毕设通过率XXX,相比往年XXXX,因此我们可以针对XXXX进行调整
6.数据挖掘实现
6.1 预测下今年每个学院的通过率
实现技术流程
数据处理 数据集成 数据规约 数据子集 统计分析 重点关注下 数据挖掘 回归算法 聚类 分类 深度学习 图 实现一个预测等 采用多种算法进行比较,评估 绘图可视化 重点关注下 由图6-3分析 各个老师的毕设通过率XXX,相比往年XXXX,因此我们可以针对XXXX进行调整
7.论文报告数据分析技术部分就已经完成。
总结
大家先确定下自己的分析目标,并初步判断能否获得数据,确定一些数据分析指标。本周任务