最新 最热

Delta Lake 2.0正式发布,Databricks能赢吗?

新粉请关注我的公众号我收到了一封邮件,具体内容截图如下:简单说,就是官宣Delta Lake 2.0正式发布了。这个距离Databricks的年度大会上面宣布,也有些时日了。Databricks在发布里面指出了一些新功能。我挑重点讲几个。首先...

2022-08-29
1

这个大数据开源项目多半要黄,但我希望它能成。。。

新粉请关注我的公众号今天聊聊这个由Kyligence和Intel一起搞的开源项目Gluten。Gluten是什么呢?简单来说,这个项目的作用是给Spark引擎的执行赋予调用Native Vectorized engine,比如ClickHouse的能力。要具体来说呢,就是...

2022-08-29
0

国内用得最多的 Java 框架,它排第一!

对于Java工程师来说,几乎没有没听过大名鼎鼎的Spring框架的,Spring框架早已成为了Java后端开发事实上的行业标准,可以说,是Spring成就了Java,Spring也成为Java程序员必修课之一。同时,随着Spring Boot和Spring Cloud的出现,...

2022-08-29
1

几行 Python 代码就可以提取数百个时间序列特征

来源:DeepHub IMBA本文约900字,建议阅读5分钟在本文中,我们将深入讨论tsfresh包的使用。时间序列数据是随着时间的推移反复捕获的变量值,随着时间的推移可以产生一系列的按时间顺序索引的数据点。在时间序列中,数据具有自...

2022-08-29
0

Java及大数据学习路线

HTML基础与CSS JavaScript DOM 与 jQuery XML与Tomcat HTTP协议 服务器端组件Servlet JSP EL表达式 JSTL 会话控制Cookie和Session 服务器端组件Filter 服务器端组件Listener 国际化 异步数据传输框架Ajax 文......

2022-08-27
1

0888-7.1.6-如何在集群外安装多集群Gateway支持

1.文档编写目的在使用CDH/CDP集群过程中会遇到在集群外的节点使用Hadoop命令访问集群(如:HDFS、HBASE、HIVE、SPARK、YARN)等命令操作。但是有特殊需求:1.不想将这个节点加入到CDH/CDP集群中管理,只用于实现CDH/CDP集群的...

2022-08-26
1

QCon大会实录:PB级数据秒级分析-腾讯云原生湖仓DLC架构揭秘

导语‍‍‍‍文章整理了全球软件开发大会QCon《PB级数据秒级分析-腾讯云原生湖仓DLC架构揭秘》。大数据基于海量数据的分析,硬件、存储、计算资源尽量都可以用廉价的资源完成,如何在廉价资源上进行性能优化尤为重要。大...

2022-08-26
1

云原生Spark UI Service在腾讯云云原生数据湖产品DLC的实践

作者:余建涛,大数据平台产品中心高级工程师摘要Spark UI是查看Spark作业运行情况的重要窗口,用户经常需要根据UI上的信息来判断作业失败的原因或者分析作业如何优化。DLC团队实现了云原生的Spark UI Sevice,相较于开源的S...

2022-08-26
0

Hadoop、spark、hive到底是什么,做算法要不要学?

最近我发现,很多萌新说着想要做算法工程师,但是却对这个岗位的要求以及工作内容一无所知。以为学一个Python,再学一些机器学习、深度学习的模型就可以胜任了。工作就是用Python不停地写模型。...

2022-08-26
0