最新 最热

[R包分享] naniar包处理缺失数据

该警告问题在于ggplot默认不处理缺失值,并删除缺失值。这使得它们很难探索。它还提出了一个奇怪的问题:“如何可视化不存在的东西?

2024-07-26
5

字符串分隔(二)- 华为OD机试题

给定一个非空字符串S,其被N个‘-’分隔成N+1的子串,给定正整数K,要求除第一个子串外,其余的子串每K个字符组成新的子串,并用‘-’分隔。

2024-07-26
6

【Spark数仓项目】需求七:漏斗模型分析

create table dwd.tmp_event_log_detail( – dwd.event_log_detail deviceid string, eventid string, properties map<string,string>, ts bigint )partitioned by (dt...

2024-07-25
2

Spark中使用RDD算子GroupBy做词频统计的方法

测试文件在本地D://tmp/spark.txt,Spark采用Local模式运行,Spark版本3.2.0,Scala版本2.12,集成idea开发环境。

2024-07-25
4

使用ReduceByKey在Spark中进行词频统计

Spark采用Local模式运行,Spark版本3.2.0,Scala版本2.12,集成idea开发环境。

2024-07-25
1

美团大数据面试SQL-计算用户首单是即时单的比例

在外卖订单中,有时用户会指定订单的配送时间。现定义:如果用户下单日期与期望配送日期相同则认为是即时单,如果用户下单日期与期望配送时间不同则是预约单。每个用户下单时间最早的一单为用户首单,请计算用户首单中即时单...

2024-07-25
3

统计学整理(三)

上表中的成绩为数值变量:response/dependent variable(DV),一般称为响应/因变量;教学法为分类变量/因素(factor;2个水平):explanatory/independent variable(IV),一般称为解释/自变量。上表具备了做t检验的条件,教学法A的成...

2024-07-21
2

极地生产力自主采样系统的观测:融池比例统计 MEDEA 融池比例数据集

该项目是美国国家航空航天局 ICESCAPE 大型项目的一部分,旨在研究浮游植物丰度的长期季节性变化与整个生长季节在波弗特海和楚科奇海测量到的海冰覆盖、分层和温度变化的关系。这将通过使用 ARGO 浮漂和近实时卫星通信...

2024-07-20
1

这才是面试官想听到的答案,C++er必须得看看

在函数的开始位置记录下当前时刻,在函数的结尾处再次记录下当前时刻,两者做差即为函数耗时。

2024-07-18
2

万能字符单词拼写 - 华为OD机试题

有一个字符串数组 words 和一个字符串 chars。假如可以用 chars 中的字母拼写出 words 中的某个"单词"(字符串),那么我们就认为你掌握了这个单词。...

2024-07-15
7