最新 最热

NumPy 1.26 中文文档(五十)

安全问题可以按照项目 README 中描述的方式进行私下报告,也可以在打开问题跟踪器上的新问题时进行报告。Python 安全报告指南是一个很好的资源,其中的注意事项也适用于 NumPy。...

2024-07-26
1

NumPy 1.26 中文文档(四十六)

当构建 NumPy 时,将记录有关系统配置的信息,并且通过使用 NumPy 的 C API 的扩展模块提供。这些信息主要在 numpyconfig.h 中定义(包含在 ndarrayobject.h 中)。公共符号以 NPY_* 为前缀。NumPy 还提供了一些用于查询正在...

2024-07-26
1

用 Vue3 就该有不用 pinia 的自信

不管是用 React,还是用 Vue3,实际上大多数项目完全都可以不用全局状态管理库。不过在 React 中,要做到这样的事情,需要非常强的综合能力,在 Vue3 中,要做到这个事情更为简单。...

2024-07-25
1

SparkSQL练习题-开窗函数计算用户月访问次数

解释:小计为单月访问次数,累计为在原有单月访问次数基础上累加 将计算结果写入到mysql的表中,自己设计对应的表结构

2024-07-25
1

Spark面试题持续更新【2023-07-04】

综上所述,Spark是一个高性能、可扩展且易用的分布式计算框架,具有丰富的功能和灵活的编程接口,适用于大规模数据处理、实时流处理、机器学习和图计算等各种场景。它在大数据领域发挥着重要的作用,并受到广泛的应用和支持...

2024-07-25
1

Hive面试题持续更新【2023-07-07】

Hive是一个在Hadoop上构建的数据仓库基础架构,它提供了一种类似于SQL的查询语言,称为HiveQL,用于处理和分析大规模的结构化数据。Hive的体系架构主要包括以下几个组件:...

2024-07-25
1

HiveSQL练习题-rank(),dense_rank(),row_number(),lag()开窗计算排名和分差

开始之前hive打开本地模式 set hive.exec.mode.local.auto=true;

2024-07-25
1

【基于Flink的城市交通实时监控平台】需求二:卡口的实时拥堵情况-滑动窗口

卡口的实时拥堵情况,其实就是通过卡口的车辆平均车速和通过的车辆的数量,为了统计实时的平均车速,我设定一个滑动窗口,窗口长度是为5分钟,滑动步长为1分钟。...

2024-07-25
1

Spark算子官方文档整理收录大全持续更新【Update2023/6/24】

本文基于Spark 3.2.0 Scala的RDD API,内容来源主要由官方文档整理,文中所整理算子为常用收录,并不完全。在Spark RDD官方文档中按照转换算子(Transformation )和行动算子(Action)进行分类,在RDD.scala文档中按照RDD的内部...

2024-07-25
1

HiveSQL练习题:计算近一个月活跃、连续活跃、沉默用户需求

set hive.exec.mode.local.auto=true; 开启hive的local模式

2024-07-25
1