最新 最热

关于《Python数据挖掘入门与实战》读书笔记六(主成分分析一)

特征抽取是数据挖掘任务最为重要的一个环节,一般而言,它对最终结果的影响要高过数据挖掘算法本身。但怎样选取好的特征,还没有严格、快捷的规则可循,这也是数据挖掘科学更像是一门艺术的所在。创建好的规则离不开直觉,还需...

2022-03-11
0

关于《Python数据挖掘入门与实战》读书笔记四(转换器和流水线)

为使每条数据各特征值的和为1,使用sklearn.preprocessing.Normalizer。

2022-03-11
0

关于词云可视化笔记六(射雕英雄传前10章可视化分析)

关于词云的分析,一直想分析同一类文章的特征,不同类文章的特征,因此下载了射雕英雄传,神雕侠侣,倚天屠龙记这三部小说的前十章,又想着关于tf-idf的可视化分析问题,后来写着写着想着想着偏离主题了,变成射雕英雄传前十章人物的...

2022-03-11
0

关于词云可视化笔记四(tf-idf分析及可视化)

TF-IDF(term frequency–inversedocument frequency)是一种用于信息检索与数据挖掘的常用加权技术。

2022-03-11
0

关于《Python数据挖掘入门与实战》读书笔记三(估计器和近邻算法)

Scikit-learn库,实现了一系列数据挖掘算法,提供通用编程接口、标准化的测试和调参工具,便于用户尝试不同算法对其进行充分测试和查找优参数值。

2022-03-11
1

TASKCTL-Designer作业设计平台常见问题

答:当前流程被其它用户签出,需要其它用户签入后您才能签出(如果是上一次designer闪退造成的)。

2022-03-09
0

关于数据仓库、数据湖、数据平台和数据中台的概念和区别

我们谈论数据中台之前,我们也听到过数据平台、数据仓库、数据湖的相关概念,它们都与数据有关系,但他们和数据中台有什么样的区别,下面我们将分别介绍数据平台数据仓库数据湖和数据中台。...

2022-03-09
1

TASKCTL调度监控中常见问题

答:存储过程运行环境未配置成功,通常情况是TASKCTL安装用户的PATH环境变量没有把sqlplus命令的路径添加进去。首先sqlplus路径添加到环境变量PATH,然后重新登录TASKCTL安装用户使环境变量生效。...

2022-03-08
1

数据挖掘入门系列教程(六)之数据集特征选择「建议收藏」

大家好,我是架构君,一个会写代码吟诗的架构师。今天说一说数据挖掘入门系列教程(六)之数据集特征选择「建议收藏」,希望能够帮助大家进步!!!

2022-03-08
1

TASKCTL产品安装常见问题

答:taskctl安装后默认的用户名密码都是admin,后期的用户、密码都是通过Admin程序来管理。

2022-03-07
0