最新 最热

MariaDB Columnstore 数仓OLAP使用注意事项

3、字段类型不同 join 关联查询报错,比如表1的id字段为int,表2的字段id为varchar,进行关联查询join就会报错

2023-12-21
1

企业为什么宁愿重新招聘也不愿意花精力培养员工而喜欢用年轻人

今天跟大家分享一个职场当中,比较残酷的一个事实,为什么很多企业主宁愿重新招聘也不愿意花精力培养员工,而喜欢用年轻人

2023-12-13
1

聊聊大数据框架的数据更新解决方案: COW, MOR, MOW

hudi等数据湖仓框架,常用的是前两种实现数据更新。而Doris则主要用后两种更新数据。

2023-12-07
0

超实用干货 | 金融界的“另类数据”采集技巧分享

以上案例分布在各行各业,但其实都与金融【另类数据】有关,可以很好地诠释【另类数据】的价值与场景。

2023-12-01
1

使用C语言创建高性能爬虫ip网络

之前写的python和GO语言的爬虫ip池的文章引起很大反响,这次我将以C语言来创建爬虫IP池,但是因为其复杂性,可能代码并非完美。但是最终也达到的想要的效果。...

2023-12-01
1

长安汽车基于 Apache Doris 的车联网数据分析平台建设实践

导读:随着消费者更安全、更舒适、更便捷的驾驶体验需求不断增长,汽车智能化已成必然趋势。长安汽车智能化研究院作为长安汽车集团有限责任公司旗下的研发机构,专注于汽车智能化技术的创新与研究。为满足各业务部门的数据...

2023-12-01
1

从 Elasticsearch 到 SelectDB,观测云实现日志存储与分析的 10 倍性价比提升

导读:在云计算逐渐成熟的当下,越来越多的企业开始将业务迁移到云端,传统的监控和故障排查方法已经无法满足企业的需求。观测云可以实现对云、云原生、应用及业务的统一监测,提供整体数据的分析、洞察、可视化、自动化、监...

2023-12-01
1

「EMR 开发指南」之 Oozie 作业调度

本文将使用oozie组件自带的例子,详细介绍如何在oozie workflow上提交一个MapReduce jar。 本文以oozie 4.3.1版本为例。

2023-11-30
1

新手速成!如何利用ChatGPT撰写正则表达式辅助数据采集?

先做一个小调研:爪子们在日常采集中会经常用到正则表达式吗?比如调整网页既定格式;剔除多余符号等.....

2023-11-30
1

「EMR 开发指南」之 Kylin 存算分离方案

在大数据领域,数据量持续增长,数据类型和来源也变得越来越复杂。传统的数据仓库和分析工具很难满足大规模数据处理和实时分析的需求。为了解决这些问题,Apache Kylin应运而生。...

2023-11-29
1