最新 最热

提高数据科学工作效率的 8 个 Python 库

Optuna 是一个开源的超参数优化框架,它可以自动为机器学习模型找到最佳超参数。

2023-12-01
1

(数据科学学习手札155)基于martin为在线地图构建字体切片服务

大家好我是费老师,在之前的一篇文章(基于martin的高性能矢量切片地图服务构建)中我为大家介绍过martin的安装与使用,它是由maplibre开源维护的新一代高性能地图服务框架,底层基于rust,使得其可以以远胜于geoserver等传统地...

2023-11-22
1

数据分析师和数据工程师的区别是什么?

有朋友留言问:面试数据分析相关工作,面试官让我说说数据工程师和数据分析师的区别在哪里,怎么回答?

2023-11-15
2

英伟达A800正在转向中国以外市场销售

11月4日消息,受美国政府最新出台的出口管制政策的影响,英伟达(NVIDIA)此前专为中国市场推出的A800 GPU已经无法继续在中国销售。但是有迹象表示,英伟达及其合作伙伴正准备将A800 GPU销往北美、拉丁美洲、欧洲、非洲、印度...

2023-11-06
2

为什么Kaggle对找工作有帮助?如何入门?

(具体聊聊在做kaggle项目的时候遇到哪些问题,问题出现的时候我是如何思考的?最后又是如何解决的?)

2023-10-30
3

掌握数据科学工作流程

除了机器学习之外,类在数据科学的各个领域都有广泛的应用。你可以使用类来组织各种EDA任务、特征工程操作和机器学习模型训练。这非常理想,因为如果编写得当,类可以使现有的属性和方法易于理解、修改和调试。尤其是如果...

2023-10-26
1

为什么Python是数据科学家的首选语言

在21世纪的数据时代,数据科学家是最令人艳羡的职业之一。他们使用各种工具和技术挖掘大量数据,从而帮助组织做出数据驱动的决策。在这些工具和技术中,Python语言以其易于学习、强大的功能和广泛的应用,已经成为了数据科学...

2023-10-21
1

15个高效的Pandas代码片段

Python的Pandas库是数据科学家必备的基础工具,在本文中,我们将整理15个高级Pandas代码片段,这些代码片段将帮助你简化数据分析任务,并从数据集中提取有价值的见解。...

2023-10-19
1

【Python 数据科学】Dask.array:并行计算的利器

Dask是一个用于并行计算的强大工具,它旨在处理大规模数据集,将数据拆分成小块,并使用多核或分布式系统并行计算。Dask提供了两种主要的数据结构:Dask.array和Dask.dataframe。在本文中,我们将重点介绍Dask.array,它是Dask中...

2023-10-12
2

coursera.org网站上的所有在线课程,帮我罗列出来课程名称及对应的链接地址?

由于Coursera上的课程数量非常庞大,无法一一列举。以下是Coursera上的一些热门课程及其链接地址,供您参考:

2023-05-18
1