2021年大数据常用语言Scala(一):Scala简介

2021-10-11 14:36:14 浏览数 (1)


一、Scala简介

scala是运行在JVM上的多范式编程语言,同时支持面向对象和面向函数编程

  • 多范式:就是包含多种编程思想。目前主流的编程思想有4中,即面向对象、面向过程、面向函数、以及泛型
  • 面向函数一句话形容:函数也是一个对象,可以作为参数进行传递。

也就是:

 面向对象 :传递的参数是具体的对象或者值

 函数式编程:传递的参数可以是一个函数(处理逻辑)

  • 运行在JVM之上:

Scala程序编译执行流程

就像学习MapReduce中, 各种序列化器. 类比一下, 比如: IntWritable 以及 Text , 都是把内容进行序列化, 也就是输入不同, 输出相同. 不同的输入, 序列化为同样格式的内容, 运行在hadoop上. 同理, 我们可以认为, scala 和 java 就类比有个 ScalaWritable 以及 JavaWritable. 负责对java 以及Scala进行序列化, 输出是什么呢? 输出就是我们的字节码, 也就是 .class 文件. 用于运行在JVM之上.

早期,scala刚出现的时候,并没有怎么引起重视,随着Spark和Kafka这样基于scala的大数据框架的兴起,scala逐步进入大数据开发者的眼帘。scala的主要优势是它的表达性

为什么使用scala

开发大数据应用程序(Spark程序、Flink程序)

Spark生态并不是要取代Hadoop生态,而是为了更好的拓展大数据生态,两者结合.

而Spark由我们Scala开发的,我们学习Scala为了更好的去学习Spark。

表达能力强,一行代码抵得上Java多行,开发速度快。 优雅,代码简介逻辑更加清晰。

兼容Java,可以访问庞大的Java类库,例如:操作mysql、redis、freemarker、activemq等等

Scala对比Java

通过下面的案例,对比分别使用Java和Scala实现的代码数量

案例

定义三个实体类(用户、订单、商品)

Java代码

代码语言:javascript复制
/**
 * 用户实体类
 */
public class User {
    private String name;
    private List<Order> orders;

    public String getName() {
     return name;
    }

    public void setName(String name) {
     this.name = name;
    }

    public List<Order> getOrders() {
     return orders;
    }

    public void setOrders(List<Order> orders) {
     this.orders = orders;
    }
}

/**
 * 订单实体类
 */
public class Order {
    private int id;
    private List<Product> products;

    public int getId() {
     return id;
    }

    public void setId(int id) {
     this.id = id;
    }

    public List<Product> getProducts() {
     return products;
    }

    public void setProducts(List<Product> products) {
     this.products = products;
    }
}

/**
 * 商品实体类
 */
public class Product {
    private int id;
    private String category;

    public int getId() {
     return id;
    }

    public void setId(int id) {
     this.id = id;
    }

    public String getCategory() {
     return category;
    }

    public void setCategory(String category) {
     this.category = category;
    }
}

Scala代码

代码语言:javascript复制
case class User(var name:String, var orders:List[Order]) // 用户实体类
case class Order(var id:Int, var products:List[Product]) // 订单实体类
case class Product(var id:Int, var category:String)   // 商品实体类

0 人点赞