一、Scala简介
scala是运行在JVM上的多范式编程语言,同时支持面向对象和面向函数编程
- 多范式:就是包含多种编程思想。目前主流的编程思想有4中,即面向对象、面向过程、面向函数、以及泛型
- 面向函数一句话形容:函数也是一个对象,可以作为参数进行传递。
也就是:
面向对象 :传递的参数是具体的对象或者值
函数式编程:传递的参数可以是一个函数(处理逻辑)
- 运行在JVM之上:
Scala程序编译执行流程
就像学习MapReduce中, 各种序列化器. 类比一下, 比如: IntWritable 以及 Text , 都是把内容进行序列化, 也就是输入不同, 输出相同. 不同的输入, 序列化为同样格式的内容, 运行在hadoop上. 同理, 我们可以认为, scala 和 java 就类比有个 ScalaWritable 以及 JavaWritable. 负责对java 以及Scala进行序列化, 输出是什么呢? 输出就是我们的字节码, 也就是 .class 文件. 用于运行在JVM之上.
早期,scala刚出现的时候,并没有怎么引起重视,随着Spark和Kafka这样基于scala的大数据框架的兴起,scala逐步进入大数据开发者的眼帘。scala的主要优势是它的表达性。
为什么使用scala
开发大数据应用程序(Spark程序、Flink程序)
Spark生态并不是要取代Hadoop生态,而是为了更好的拓展大数据生态,两者结合.
而Spark由我们Scala开发的,我们学习Scala为了更好的去学习Spark。
表达能力强,一行代码抵得上Java多行,开发速度快。 优雅,代码简介逻辑更加清晰。
兼容Java,可以访问庞大的Java类库,例如:操作mysql、redis、freemarker、activemq等等
Scala对比Java
通过下面的案例,对比分别使用Java和Scala实现的代码数量
案例
定义三个实体类(用户、订单、商品)
Java代码
代码语言:javascript复制/**
* 用户实体类
*/
public class User {
private String name;
private List<Order> orders;
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public List<Order> getOrders() {
return orders;
}
public void setOrders(List<Order> orders) {
this.orders = orders;
}
}
/**
* 订单实体类
*/
public class Order {
private int id;
private List<Product> products;
public int getId() {
return id;
}
public void setId(int id) {
this.id = id;
}
public List<Product> getProducts() {
return products;
}
public void setProducts(List<Product> products) {
this.products = products;
}
}
/**
* 商品实体类
*/
public class Product {
private int id;
private String category;
public int getId() {
return id;
}
public void setId(int id) {
this.id = id;
}
public String getCategory() {
return category;
}
public void setCategory(String category) {
this.category = category;
}
}
Scala代码
代码语言:javascript复制case class User(var name:String, var orders:List[Order]) // 用户实体类
case class Order(var id:Int, var products:List[Product]) // 订单实体类
case class Product(var id:Int, var category:String) // 商品实体类