我们在工作中还是在学习中有都会遇到我们写的HQL语句执行效率不高,那我们该怎么提高查询效率那,这篇文章就带你从不同维度讲解,让你的HQL瞬间提高一个档次。记得收藏...
作者:wyattliu 腾讯TEG工程师 |导语 集群中的机器机型、负载并不一定完全相同,所以即使一个MapReduce任务每一个Map/Reduce task要处理的数据量完全相同,其运行时间也可能会相差很大。推测机制就是为了缓解这种问题而...
在上篇文章手把手教你安装 azkaban 运行环境中,详细介绍了 azkaban服务的安装,现在就用SpringBoot来开发一个azkaban的调度任务,上传到web界面运行。
本MySQL模板采集数据使用mysqladmin/mysql命令连接数据库,并将获取的数据写入本地文件,然后通过Zabbix agent(active)方式获取各监控项的数据。在Zabbix自带的基础模板上进行升级,指标更完善,性能更好...
Linux的环境变量可在多个文件中配置,如/etc/profile,/etc/profile.d/*.sh,~/.bashrc等,下面说明上述几个文件之间的关系和区别。
那么就可以编写一个脚本,把输出的内容全部扔进“黑洞”。此脚本模拟在hadoop102和hadoop103两台主机上循环执行jar文件:
Hive在2.0之后,推出一个新特性LLAP(Live Long And Process),可以显著提高查询效率。
Hadoop到目前为止发展已经有10余年,版本经过无数次的更新迭代,目前业内大家把Hadoop大的版本分为Hadoop1.0、Hadoop2.0、Hadoop3.0 三个版本。
抱着学Flink的心,没想到先试水最基本的mapreduce了。由于项目不便于公开,所以这里故事描述会进行一些演义,尽量不影响看官们理解。
写博客也已经快一年了,从去年的1024到现在金秋10月已纷至沓来。回顾这一年所发布的原创文章,基本都是与大数据主流或者周边的技术为主。本篇博客,就为大家介绍几篇关于大数据领域必看的经典书籍,喜欢的小伙伴记得来发一键...