引言
首先,Java 8 Streams 不应与 Java I/O 流混淆(例如:FileInputStream 等);这些彼此之间几乎没有关系。
简而言之,流是数据源的包装器,允许我们使用该数据源进行操作,并使批量处理方便快捷。
Stream不存储数据,从这个意义上说,它不是数据结构。它也从不修改底层数据源
这个功能 - java.util.stream - 支持对元素流的函数式操作,例如对集合的 map-reduce 转换。
现在让我们深入研究几个流创建和使用的简单示例——在进入术语和核心概念之前。
创建一个java流
- 已有的list转换成流对象
private static Employee[] arrayOfEmps = {
new Employee(1, "Jeff Bezos", 100000.0),
new Employee(2, "Bill Gates", 200000.0),
new Employee(3, "Mark Zuckerberg", 300000.0)
};
Stream.of(arrayOfEmps);
代码语言:javascript复制private static List<Employee> empList = Arrays.asList(arrayOfEmps);
empList.stream();
- 新建一个流
Stream.of(arrayOfEmps[0], arrayOfEmps[1], arrayOfEmps[2]);
- 使用build
Stream.Builder<Employee> empStreamBuilder = Stream.builder();
empStreamBuilder.accept(arrayOfEmps[0]);
empStreamBuilder.accept(arrayOfEmps[1]);
empStreamBuilder.accept(arrayOfEmps[2]);
Stream<Employee> empStream = empStreamBuilder.build();
Stream的操作
forEach
forEach() 是最简单最常用的操作;它遍历流元素,在每个元素上调用提供的函数。
该方法非常常见,已在 Iterable、Map 等中直接引入
代码语言:javascript复制@Test
public void whenIncrementSalaryForEachEmployee_thenApplyNewSalary() {
empList.stream().forEach(e -> e.salaryIncrement(10.0));
assertThat(empList, contains(
hasProperty("salary", equalTo(110000.0)),
hasProperty("salary", equalTo(220000.0)),
hasProperty("salary", equalTo(330000.0))
));
}
forEach() 是一个终端操作,也就是说,执行完操作后,流管道就被认为是消耗掉了,不能再使用了。我们将在下一节中详细讨论终端操作。
map
map() 在对原始流的每个元素应用函数后生成一个新流。新的流可以是不同的类型。
以下示例将整数流转换为雇员流
代码语言:javascript复制@Test
public void whenMapIdToEmployees_thenGetEmployeeStream() {
Integer[] empIds = { 1, 2, 3 };
List<Employee> employees = Stream.of(empIds)
.map(employeeRepository::findById)
.collect(Collectors.toList());
assertEquals(employees.size(), empIds.length);
}
在这里,我们从数组中获取员工 ID 的整数流。每个 Integer 都被传递给函数 employeeRepository::findById()——它返回相应的 Employee 对象;这有效地形成了一个员工流。
collect
我们在前面的例子中看到了 collect() 的工作原理;一旦我们完成所有处理,这是从流中取出内容的常用方法之一:
代码语言:javascript复制@Test
public void whenCollectStreamToList_thenGetList() {
List<Employee> employees = empList.stream().collect(Collectors.toList());
assertEquals(empList, employees);
}
collect() 对 Stream 实例中保存的数据元素执行可变折叠操作(将元素重新打包到某些数据结构并应用一些额外的逻辑,将它们连接起来等)。
此操作的策略是通过 Collector 接口实现提供的。在上面的示例中,我们使用 toList 收集器将所有 Stream 元素收集到一个 List 实例中。
filter
接下来,我们来看看 filter();这将生成一个新流,其中包含通过给定测试(由谓词指定)的原始流的元素。
让我们看看它是如何工作的:
代码语言:javascript复制@Test
public void whenFilterEmployees_thenGetFilteredStream() {
Integer[] empIds = { 1, 2, 3, 4 };
List<Employee> employees = Stream.of(empIds)
.map(employeeRepository::findById)
.filter(e -> e != null)
.filter(e -> e.getSalary() > 200000)
.collect(Collectors.toList());
assertEquals(Arrays.asList(arrayOfEmps[2]), employees);
}
在上面的示例中,我们首先过滤掉无效员工 ID 的空引用,然后再次应用过滤器以仅保留工资超过特定阈值的员工。
findFirst
ndFirst() 为流中的第一个条目返回一个 Optional; Optional 当然可以为空:
代码语言:javascript复制@Test
public void whenFindFirst_thenGetFirstEmployeeInStream() {
Integer[] empIds = { 1, 2, 3, 4 };
Employee employee = Stream.of(empIds)
.map(employeeRepository::findById)
.filter(e -> e != null)
.filter(e -> e.getSalary() > 100000)
.findFirst()
.orElse(null);
assertEquals(employee.getSalary(), new Double(200000));
}
在这里,返回第一个工资大于 100000 的员工。如果不存在这样的员工,则返回 null。
toArray
我们看到了如何使用 collect() 从流中获取数据。如果我们需要从流中取出一个数组,我们可以简单地使用 toArray():
代码语言:javascript复制@Test
public void whenStreamToArray_thenGetArray() {
Employee[] employees = empList.stream().toArray(Employee[]::new);
assertThat(empList.toArray(), equalTo(employees));
}
语法 Employee[]::new 创建一个空的 Employee 数组——然后用流中的元素填充。
flatMap
流可以包含复杂的数据结构,例如 Stream<List>。在这种情况下,flatMap() 可以帮助我们扁平化数据结构以简化进一步的操作:
@Test public void whenFlatMapEmployeeNames_thenGetNameStream() { List<List> namesNested = Arrays.asList( Arrays.asList("Jeff", "Bezos"), Arrays.asList("Bill", "Gates"), Arrays.asList("Mark", "Zuckerberg"));
代码语言:javascript复制List<String> namesFlatStream = namesNested.stream()
.flatMap(Collection::stream)
.collect(Collectors.toList());
assertEquals(namesFlatStream.size(), namesNested.size() * 2);
}
请注意我们如何能够将 Stream<List> 转换为更简单的 Stream - 使用 flatMap() API