scala_字节宝

alpakka-kafka(9)-kafka在分布式运算中的应用

kafka具备的分布式、高吞吐、高可用特性，以及所提供的各种消息消费模式可以保证在一个多节点集群环境里消息被消费的安全性：即防止每条消息遗漏处理或重复消费。特别是exactly-once消费策略：可以保证每条消息肯定只被消...

Kafka 分布式 scala 编程算法

2022-05-10

SDP（0）：Streaming-Data-Processor - Data Processing with Akka-Stream

再有两天就进入2018了,想想还是要准备一下明年的工作方向。回想当初开始学习函数式编程时的主要目的是想设计一套标准API給那些习惯了OOP方式开发商业应用软件的程序员们，使他们能用一种接近传统数据库软件编程的方式...

编程算法分布式 scala

2022-05-10

大数据方向毕业设计，选题和实现思路

最近有很多人问我，大数据专业有什么好的毕设项目，我就简单的回复了一下。也有直接问我要源码的....

Kafka spark 数据分析爬虫 scala

2022-05-09

SQL谓词 IS JSON

IS JSON谓词确定数据值是否为JSON格式。下面的示例确定谓词是否是格式化正确的JSON字符串，是JSON对象还是JSON数组:

json 编程算法 scala 数据分析

2022-05-09

Spark的常用算子大总结

作用：返回一个新的RDD，该RDD由每一个输入元素经过func函数转换后组成 2. 需求：创建一个1-10数组的RDD，将所有元素2形成新的RDD （1）创建 scala> var source = sc.parallelize(1 to 10) source: org.apache.spark.rdd.RDD......

scala spark 编程算法

2022-05-08