一文读懂函数式接口、Lambda表达式、Stream

2024-02-02 17:49:51 浏览数 (1)

前言

  • Java 8 中引入很多有意思的新特性,本篇文章我们来聊聊其中三个比较重要的特性:函数式接口、Lambda表达式、Stream流,我们分别从示例用法、底层原理、最佳实践三个方面来了解这些特性。

版本

  • JDK 8

函数式接口

定义

  • 函数式接口是 Java 8 引入的一种接口,它只包含一个抽象方法。函数式接口的存在是为了支持 Lambda 表达式,使得我们可以使用更简洁、更灵活的方式编写匿名函数。
代码语言:java复制
@FunctionalInterface
interface Calculator {
    int add(int a, int b);

    default int subtract(int a, int b) {
        return a - b;
    }

    static int multiply(int a, int b) {
        return a * b;
    }
}
  • @FunctionalInterface 注解是可选的,推荐使用。该注解会让编译器强制检查接口是否满足函数式接口定义。

特点

  • 只能有一个抽象方法,可以有参数和返回值。
  • 可以包含多个默认方法(使用 default 关键字)和静态方法(使用 static 关键字),不违反函数式接口的定义。
代码语言:txt复制
说明:
默认方法和静态方法在 Java 8 中引入,目的是在引入新功能的同时不改变已有实现。
从而实现接口的的逐步演进,不需要同时修改所有实现类。

使用

代码语言:java复制
@FunctionalInterface
interface Calculator {
    int add(int a, int b);

    default int subtract(int a, int b) {
        return a - b;
    }

    static int multiply(int a, int b) {
        return a * b;
    }
}

public class TestMain {
    public static void main(String[] args) {
        Calculator addCalculator = (a, b) -> a   b;
        System.out.println(addCalculator.add(1, 2));
        System.out.println(addCalculator.subtract(1, 2));
    }
}

Lambda表达式

  • Lambda 表达式是一种用于传递匿名函数的简洁语法。它提供了一种更紧凑的方式来表示可以传递给方法的代码块。Lambda 表达式主要用于函数式接口,可以看作是对函数式接口的一个实现。
代码语言:java复制
Calculator addCalculator = (a, b) -> a   b;

主要场景

  • 简化匿名内部类的写法,但无法简化所有匿名内部类,只能简化满足函数式接口的匿名内部类。

用法

无参写法

  • 实现创建一个简单的线程。
代码语言:java复制
@FunctionalInterface
public interface Runnable {
    /**
     * When an object implementing interface <code>Runnable</code> is used
     * to create a thread, starting the thread causes the object's
     * <code>run</code> method to be called in that separately executing
     * thread.
     * <p>
     * The general contract of the method <code>run</code> is that it may
     * take any action whatsoever.
     *
     * @see     java.lang.Thread#run()
     */
    public abstract void run();
}


        // JDK7 匿名内部类写法
        new Thread(new Runnable() {// 接口名
            @Override
            public void run() {// 方法名
                System.out.println("Thread run()");
            }
        }).start();
        
        // JDK8 Lambda表达式代码块写法
        new Thread(
                () -> System.out.print("Thread run()")
        ).start();

有参写法

  • 实现根据列表中字符串元素长度进行排序。
代码语言:java复制
@FunctionalInterface
public interface Comparator<T> {
    int compare(T o1, T o2);   
}


        // JDK7 匿名内部类写法
        List<String> list = Arrays.asList("my", "name", "is", "lorin");
        list.sort(new Comparator<String>() {
            @Override
            public int compare(String s1, String s2) {
                if (s1 == null)
                    return -1;
                if (s2 == null)
                    return 1;
                return s1.length() - s2.length();
            }
        });

        // JDK8 Lambda表达式写法
        List<String> list = Arrays.asList("my", "name", "is", "lorin");
        list.sort((s1, s2) -> {// 省略参数表的类型
            if (s1 == null)
                return -1;
            if (s2 == null)
                return 1;
            return s1.length() - s2.length();
        });

Lambda 表达式的基础:函数式接口 类型推断

  • Lambda 表达式除了上文中提到的函数式接口,还有一个比较重要的特性来支持 Lambda 表达式简洁的写法,即类型推断:指编译器根据上下文信息推断变量的类型,而不需要显式地指定类型。类型推断的引入是为了简化代码,并提高代码的可读性和可维护性。
代码语言:java复制
    CustomerInterface<Integer> action = (Integer t) -> {
        System.out.println(this);
        return t   1;
    };
    
    
    // 使用类型推断
    CustomerInterface<Integer> action1 = t -> {
        System.out.println(this);
        return t   1;
    };

自定义函数接口使用 Lambda 表达式

  • 首先定义一个函数接口,函数作用是对传入的元素进行操作,最后返回操作后的元素。
代码语言:java复制
// 自定义函数接口
@FunctionalInterface
public interface CustomerInterface<T> {
    T operate(T t);
}
  • 自定义的 MyStream 类来使用自定义的函数接口。
代码语言:java复制
class MyStream<T> {
    private final List<T> list;

    MyStream(List<T> list) {
        this.list = list;
    }

    public void customerForEach(CustomerInterface<T> action) {
        Objects.requireNonNull(action);
        list.replaceAll(action::operate);
    }
}
  • 使用自定义的 MyStream 类实现对每一个元素的 1 操作。
代码语言:java复制
public class TestMain {
    public static void main(String[] args) {
        List<Integer> arr = Arrays.asList(1, 2, 3, 4);
        MyStream<Integer> myStream = new MyStream<>(arr);
        myStream.customerForEach(t -> t   1);
        System.out.println(arr);
    }
}

// 输出结果
[2, 3, 4, 5]

底层实现

  • 上面我们回顾了 JDK7 和 JDK8 对匿名内部类的写法,我们发现 JDK8 中的实现更加简洁了,但实际上不仅仅语法上更加简洁,即不是纯粹的语法糖,底层实现也发生了一些变化,下面我们一起来看一下。

JDK7

  • 由于 JDK7 并不支持函数式接口、Lambda表达式,所以我们先对代码做一些简单的改造:
代码语言:java复制
public interface CustomerInterface<T> {
    T operate(T t);
}

class MyStream<T> {
    private final List<T> list;

    MyStream(List<T> list) {
        this.list = list;
    }

    public void customerForEach(CustomerInterface<T> action) {
        Objects.requireNonNull(action);
        for (int i = 0; i < list.size(); i  ) {
            list.set(i, action.operate(list.get(i)));
        }
    }
}

public class TestMain {
    public static void main(String[] args) {
        List<Integer> arr = Arrays.asList(1, 2, 3, 4);
        MyStream<Integer> myStream = new MyStream<>(arr);
        myStream.customerForEach(new CustomerInterface<Integer>() {
            @Override
            public Integer operate(Integer integer) {
                return integer   1;
            }
        });
        System.out.println(arr);
    }
}
  • 使用 javap 分析字节码:
代码语言:java复制
 javap -c -p  .TestMain.class
Compiled from "TestMain.java"
public class test.TestMain {
  public test.TestMain();
    Code:
       0: aload_0
       1: invokespecial #1                  // Method java/lang/Object."<init>":()V
       4: return

  public static void main(java.lang.String[]);
    Code:
       0: iconst_4
       1: anewarray     #2                  // class java/lang/Integer
       4: dup
       5: iconst_0
       6: iconst_1
       7: invokestatic  #3                  // Method java/lang/Integer.valueOf:(I)Ljava/lang/Integer;
      10: aastore
      11: dup
      12: iconst_1
      13: iconst_2
      14: invokestatic  #3                  // Method java/lang/Integer.valueOf:(I)Ljava/lang/Integer;
      17: aastore
      18: dup
      19: iconst_2
      20: iconst_3
      21: invokestatic  #3                  // Method java/lang/Integer.valueOf:(I)Ljava/lang/Integer;
      24: aastore
      25: dup
      26: iconst_3
      27: iconst_4
      28: invokestatic  #3                  // Method java/lang/Integer.valueOf:(I)Ljava/lang/Integer;
      31: aastore
      32: invokestatic  #4                  // Method java/util/Arrays.asList:([Ljava/lang/Object;)Ljava/util/List;
      35: astore_1
      36: new           #5                  // class test/MyStream
      39: dup
      40: aload_1
      41: invokespecial #6                  // Method test/MyStream."<init>":(Ljava/util/List;)V
      44: astore_2
      45: aload_2
      46: new           #7                  // class test/TestMain$1  创建匿名内部类
      49: dup
      50: invokespecial #8                  // Method test/TestMain$1."<init>":()V
      53: invokevirtual #9                  // Method test/MyStream.customerForEach:(Ltest/CustomerInterface;)V
      56: getstatic     #10                 // Field java/lang/System.out:Ljava/io/PrintStream;
      59: aload_1
      60: invokevirtual #11                 // Method java/io/PrintStream.println:(Ljava/lang/Object;)V
      63: return
}
  • 从上面 46 行我们可以看出,JDK7 创建了真实的的匿名内部类。

JDK8

  • JDK8 我们以上述 自定义函数接口使用 Lambda 表达式 为例:
  • 使用 javap 分析字节码可以发现,Lambda 表达式 被封装为一个内部的私有方法并通过 InvokeDynamic 调用,而不是像 JDK7 那样创建一个真实的匿名内部类。
代码语言:java复制
 javap -c -p  .TestMain.class
Compiled from "TestMain.java"
public class test.TestMain {
  public test.TestMain();
    Code:
       0: aload_0
       1: invokespecial #1                  // Method java/lang/Object."<init>":()V
       4: return

  public static void main(java.lang.String[]);
    Code:
       0: iconst_4
       1: anewarray     #2                  // class java/lang/Integer
       4: dup
       5: iconst_0
       6: iconst_1
       7: invokestatic  #3                  // Method java/lang/Integer.valueOf:(I)Ljava/lang/Integer;
      10: aastore
      11: dup
      12: iconst_1
      13: iconst_2
      14: invokestatic  #3                  // Method java/lang/Integer.valueOf:(I)Ljava/lang/Integer;
      17: aastore
      18: dup
      19: iconst_2
      20: iconst_3
      21: invokestatic  #3                  // Method java/lang/Integer.valueOf:(I)Ljava/lang/Integer;
      24: aastore
      25: dup
      40: aload_1
      41: invokespecial #6                  // Method test/MyStream."<init>":(Ljava/util/List;)V
      44: astore_2
      45: aload_2
      46: invokedynamic #7,  0              // InvokeDynamic #0:operate:()Ltest/CustomerInterface;  InvokeDynamic 调用
      51: invokevirtual #8                  // Method test/MyStream.customerForEach:(Ltest/CustomerInterface;)V
      54: getstatic     #9                  // Field java/lang/System.out:Ljava/io/PrintStream;
      57: aload_1
      58: invokevirtual #10                 // Method java/io/PrintStream.println:(Ljava/lang/Object;)V
      61: return

  private static java.lang.Integer lambda$main$0(java.lang.Integer); // lambda 表达式被封装为内部方法
    Code:
       0: aload_0
       1: invokevirtual #11                 // Method java/lang/Integer.intValue:()I
       4: iconst_1
       5: iadd
       6: invokestatic  #3                  // Method java/lang/Integer.valueOf:(I)Ljava/lang/Integer;
       9: areturn
}

this 的含义

  • 从上面我们可以知道 JDK7 和 JDK8 对匿名内部类不仅写法上不一致,底层原理也不相同。因此,如果我们在两种写法种使用 this 关键字,两者是一样的?先说答案:不一样,JDK7this 指向创建的匿名内部内,而 JDK8 中Lambda表达式并不会创建真实存在的类,指向的是当前类。
  • 下面我们结合实际案例来看一下:

JDK7

代码语言:java复制
        CustomerInterface<Integer> action = new CustomerInterface<Integer>() {
            @Override
            public Integer operate(Integer integer) {
                System.out.println(this);
                return integer   1;
            }
        };

        CustomerInterface<Integer> action1 = new CustomerInterface<Integer>() {
            @Override
            public Integer operate(Integer integer) {
                System.out.println(this);
                return integer   1;
            }
        };

        System.out.println(action.operate(2));
        System.out.println(action1.operate(2));
        
        // 输出
        test.TestMain$1@8939ec3
        3
        test.TestMain$2@456bf9ce
        3
  • 可以看到两个 this 输出地址不同,分别指向自身的匿名内部类对象。

JDK8

代码语言:java复制
public class TestMain {

    CustomerInterface<Integer> action = t -> {
        System.out.println(this);
        return t   1;
    };

    CustomerInterface<Integer> action1 = t -> {
        System.out.println(this);
        return t   1;
    };

    public static void main(String[] args) {
        TestMain testMain = new TestMain();
        System.out.println(testMain.action.operate(2));
        System.out.println(testMain.action1.operate(2));
    }
}

// 输出
test.TestMain@1d81eb93
3
test.TestMain@1d81eb93
3
  • 可以看到,两个 this 都指向同一个 testMain 对象,因为我们从前文我们可以知道 JDK8Lambda 表达式 被封装为一个内部的私有方法并通过 InvokeDynamic 调用,而不是创建一个真实的匿名内部类。

Stream

  • Stream 是一种用于处理集合数据的高级抽象,它允许我们以声明式的方式对集合进行操作。
  • 函数式接口提供了Lambda表达式的类型,Lambda表达式提供了一种简洁的语法来定义匿名内部类,而 Stream 提供了一种声明式的方式来处理集合数据,并与Lambda表达式无缝结合,共同支持函数式编程在Java中的应用。

特点

  • Stream 不存储数据,按照特定的规则进行计算,最后返回计算结果。
  • Stream 不改变源数据源,而返回一个新的数据源。
  • Stream 是惰性计算,只有调用终端操作时,中间操作才会执行。

操作

Stream 流创建

  • Stream 流支持并行流和串行流两种方式,串行流每个元素按照顺序依次处理,并行流会将流中元素拆分为多个子任务进行处理,最后再合并结果,从而提高处理效率。
代码语言:java复制
    List<String> list = Arrays.asList("11", "2222", "333333");
    // 串行流
    list.stream().map(String::toString).collect(Collectors.toList());
    // 并行流
    list.parallelStream().map(String::toString).collect(Collectors.toList());
    list.stream().parallel().map(String::toString).collect(Collectors.toList());

中间操作和终端操

中间操作
  • 只会记录操作不会立即执行,中间操作可以细分为:无状态 Stateless有状态 Stateful 两种。
无状态 Stateless
  • 指元素不受其它元素影响,可以继续往下执行,比如 filter() map() mapToInt() 等。
filter
  • 用于筛选符合条件的元素,下一步只会拿到符合条件的元素。
代码语言:java复制
List<String>strings = Arrays.asList("abc", "", "bc", "efg", "abcd","", "jkl");
// 获取空字符串的数量
long count = strings.stream().filter(string -> string.isEmpty()).count();
map
  • 用于将一个流中的元素通过指定的映射函数转换为另一个流。返回类型必须是传入类型或传入类型的子类型。
代码语言:java复制
        List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);

        // 使用 map 方法将列表中的每个元素乘以2
        List<Integer> doubledNumbers = numbers.stream()
                .map(n -> n * 2)
                .collect(Collectors.toList());
mapToInt() mapToLong() 等
  • mapToInt() 方法用于将流中的元素映射为 int 类型的流。IntStream 是针对 int 类型数据进行优化的特殊流,提供了更高效的操作和更方便的处理方式。当处理基本类型 int 数据时,推荐使用 IntStream,可以提高代码的性能和可读性。
  • mapToLong() 方法用于将流中的元素映射为 long 类型的流。
代码语言:java复制
        // 整数列表
        Long[] numbers = {1, 2, 3, 4, 5};

        // 使用 mapToLong() 方法将每个整数乘以自身,并收集到一个 LongStream 流中
        LongStream squares = Arrays.stream(numbers).mapToLong(t -> t * t);
        squares.sum();
flatMap() flatMapToInt() 等
  • flatMap()用于将流中的每个元素映射为一个流,然后将所有映射得到的流合并成一个新的流。
  • flatMapToInt()flatMap() 的区别在于返回的流为 IntStream
代码语言:java复制
        // 字符串列表
        List<String> words = Arrays.asList("Java is fun", "Stream API is powerful", "FlatMap is useful");

        // 使用 flatMap() 提取每个字符串中的单词,并放入一个新的流中
        Stream<String> wordStream = words.stream()
                .flatMap(str -> Arrays.stream(str.split("\s ")));

        // 打印流中的每个单词
        wordStream.forEach(System.out::println);
        
// 输出
Java
is
fun
Stream
API
is
powerful
FlatMap
is
useful
peek
  • 用于在流的每个元素上执行指定的操作,同时保留流中的元素。peek() 方法不会改变流中的元素,而是提供一种查看每个元素的机会,通常用于调试、日志记录或记录流中的中间状态。
代码语言:java复制
        // 整数列表
        List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);

        // 使用 peek() 打印每个元素,并将元素乘以2,然后收集到一个新的列表中
        List<Integer> doubledNumbers = numbers.stream()
                .peek(num -> System.out.println("Original: "   num))
                .map(num -> num * 2)
                .peek(doubledNum -> System.out.println("Doubled: "   doubledNum))
                .collect(Collectors.toList());

        // 打印新列表中的元素
        System.out.println("Doubled Numbers: "   doubledNumbers);
有状态 Stateful
  • 指元素受到其它元素影响,比如 distinct() 去重,需要处理完所有元素才能往下执行。
distinct
  • 用于去除流中重复的元素,返回一个去重后的新流。distinct() 方法根据元素的 equals() 方法来判断是否重复,因此流中的元素必须实现了 equals() 方法以确保正确的去重。
代码语言:java复制
        // 字符串列表
        List<String> words = Arrays.asList("hello", "world", "hello", "java", "world");

        // 使用 distinct() 方法获取不重复的单词,并收集到一个新的列表中
        List<String> uniqueWords = words.stream()
                                        .distinct()
                                        .collect(Collectors.toList());

        // 打印不重复的单词列表
        System.out.println("Unique Words: "   uniqueWords);
limit
  • 用于限制流中元素的数量,返回一个包含了指定数量元素的新流。limit() 方法通常用于在处理大型数据集时,限制处理的数据量,以提高性能或减少资源消耗。需要注意的,返回的元素不一定是前三个。
代码语言:java复制
        // 整数列表
        List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);

        // 使用 limit() 方法获取前3个元素,并收集到一个新的列表中
        List<Integer> limitedNumbers = numbers.stream()
                                              .limit(3)
                                              .collect(Collectors.toList());

        // 打印前3个元素
        System.out.println("Limited Numbers: "   limitedNumbers);
终端操作
  • 调用终端操作计算会立即开始执行,终端操作可以细分为:非短路操作短路操作
非短路操作
  • 非短路操作:需要处理完所有元素才可以拿到结果,比如 forEach() forEachOrdered()
collect
  • 将流中的元素收集到一个集合或者其他数据结构中。下面是一些常见的用法:
代码语言:java复制
        // 将流中的元素收集到一个列表中:
        List<String> list = stream.collect(Collectors.toList());

        // 将流中的元素收集到一个集合中:
        Set<String> set = stream.collect(Collectors.toSet());

        // 将流中的元素收集到一个指定类型的集合中:
        ArrayList<String> arrayList = stream.collect(Collectors.toCollection(ArrayList::new));

        // 将流中的元素收集到一个字符串中,使用指定的分隔符连接:
        String result = stream.collect(Collectors.joining(", "));

        // 将流中的元素收集到一个 Map 中,根据指定的键值对:
        Map<Integer, String> map = stream.collect(Collectors.toMap(String::length, Function.identity()));

        // 对流中的元素进行分组:
        Map<Integer, List<String>> groupedMap = stream.collect(Collectors.groupingBy(String::length));

        // 对流中的元素进行分区:
        Map<Boolean, List<String>> partitionedMap = stream.collect(Collectors.partitioningBy(s -> s.length() > 3));

        // 对流中的元素进行统计:
        IntSummaryStatistics statistics = stream.collect(Collectors.summarizingInt(String::length));
reduce
  • 用于将流中的元素组合成一个值。
  • 灵活性:reduce() 方法提供了灵活的参数选项,可以根据需求选择不同的重载形式,包括指定初始值、选择累加器函数和组合器函数等,使得它可以适用于各种场景。
  • 统一操作:reduce() 方法提供了一种统一的方式来对流中的元素进行组合操作,不论是求和、求积、字符串拼接还是其他任何类型的组合操作,都可以使用 reduce() 方法来实现,这样可以减少代码重复,提高代码的可读性和可维护性。
  • 并行流支持:在并行流中,reduce() 方法可以更高效地利用多核处理器,通过并行化操作来提高性能。使用合适的组合器函数,可以在并行流中正确地合并部分结果,从而实现更高效的并行计算。而 sum() 函数是串行的。
代码语言:java复制
        // 将流中的元素累加求和:
        List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);
        Optional<Integer> sum = numbers.stream().reduce((a, b) -> a   b);
        System.out.println("Sum: "   sum.orElse(0));  // 输出 15

        // 使用初始值进行累加求和:
        List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);
        int sum = numbers.stream().reduce(0, (a, b) -> a   b);
        System.out.println("Sum: "   sum);  // 输出 15

        // 使用初始值和组合器函数在并行流中进行累加求和:
        List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);
        int sum = numbers.parallelStream().reduce(0, (a, b) -> a   b, Integer::sum);
        System.out.println("Sum: "   sum);  // 输出 15
短路操作
  • 短路操作:得到符合条件的元素就可以立即返回,而不用处理所有元素,比如 anyMatch() allMatch()
findFirst
  • 用于获取流中的第一个元素(如果存在的话),返回一个 Optional 对象。注意:返回值不一定为第一个元素。
代码语言:java复制
        List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);
        Optional<Integer> firstNumber = numbers.stream().findFirst();
        if (firstNumber.isPresent()) {
            System.out.println("First number: "   firstNumber.get());  // 输出 First number: 1
        } else {
            System.out.println("No elements found in the stream.");
        }

总结

  • 函数式接口、Lambda表达式和Stream是Java 8引入的重要特性,它们使得Java代码更加简洁、灵活、易读。函数式接口定义了一种新的编程模式,Lambda表达式提供了一种更加简洁的语法来实现函数式接口,Stream则提供了一套丰富的操作方法来处理集合数据。通过这些特性的组合应用,可以极大地提高Java代码的开发效率和质量。
  • 本文篇幅有限,Stream 部分仅介绍了基本定义和常见的用法,没有对 Stream 底层原理(并行、串行等)做深入解析,这部分将在下一篇文章中介绍。

个人简介

0 人点赞