Java8新特性(二)——强大的Stream API

2023-07-06

一、强大的Stream API

  除了Lambda表达式外,Java8另外一项重大更新便是位于java.util.stream.*下的Stream API

  Stream 是 Java8 中处理集合的关键抽象概念,它可以指定你希望对 集合进行的操作,可以执行非常复杂的查找、过滤和映射数据等操作。 使用Stream API 对集合数据进行操作,就类似于使用 SQL 执行的数 据库查询。也可以使用 Stream API 来并行执行操作。简而言之, Stream API 提供了一种高效且易于使用的处理数据的方式。

  什么是Stream

  是数据渠道,用于操作数据源(集合、数组等)所生成的元素序列。 “集合讲的是数据,流讲的是计算!

  注意:

    ①Stream 自己不会存储元素。

    ②Stream 不会改变源对象。相反,他们会返回一个持有结果的新Stream。

    ③Stream 操作是延迟执行的。这意味着他们会等到需要结果的时候才执行。

  接下来从三个流程讲解Stream的用法:创建——中间操作——终止操作

  如何创建Stream

   通过Collection集合家族的方法创建流

       default Stream stream() : 返回一个顺序流

       default Stream parallelStream() : 返回一个并行流

    通过数组的静态方法(Arrays.stream())

    static Stream stream(T[] array): 返回一个流

    通过Stream的静态方法of()

     public static Stream of(T... values) : 返回一个流

  通过静态方法 Stream.iterate() 和 Stream.generate(), 创建无限流。

    迭代:public static Stream iterate(final T seed, final UnaryOperator f)

    生成: public static Stream generate(Supplier s) :

  对以上这些方式进行实例演示:

    @Test
public void test1() {
// 1.通过集合得到流
List<String> list = new ArrayList<>();
Stream<String> stream = list.stream();
// 2.通过数组
Employee[] emps = new Employee[5];
Stream<Employee> stream1 = Arrays.stream(emps);
// 3.通过Stream的静态方法
Stream<String> stream2 = Stream.of("a", "b", "c");
// 4.通过Stream静态方法创建无限流
Stream<Integer> stream3 = Stream.iterate(0, (x) -> x + 2);
Stream<Double> stream4 = Stream.generate(Math::random);
}

  中间操作

  多个中间操作可以连接起来形成一个流水线,除非流水 线上触发终止操作,否则中间操作不会执行任何的处理! 而在终止操作时一次性全部处理,称为“惰性求值”。

  大致可以分为:筛选与切片、映射、排序

  

  我们依旧i通过示例来了解这几个操作:(结果已经通过测试,不再赘述)

  // filter——通过Lambda表达式排除流中某些元素
@Test
public void test2() {
List<Employee> empList = new ArrayList<>();
empList.add(new Employee("小张", 18));
empList.add(new Employee("小明", 19));
empList.add(new Employee("小红", 20));
// 集合创建流
Stream<Employee> empStream = empList.stream().filter((e) -> e.getAge() > 18);
// 终止操作
empStream.forEach(System.out::println);
} // limit——截断流,使流不超过指定数量(与skip互补,暂不演示)
@Test
public void test3() {
List<Employee> empList = new ArrayList<>();
empList.add(new Employee("小张", 18));
empList.add(new Employee("小明", 19));
empList.add(new Employee("小红", 20));
// 注意这种写法
empList.stream().filter((e) -> e.getAge() < 20)
.limit(1)
.forEach(System.out::println);
}
// distinct——通过hashCode()和equals()实现去重
@Test
public void test4() {
List<Employee> empList = new ArrayList<>();
empList.add(new Employee("小张", 18));
empList.add(new Employee("小张", 18));
empList.add(new Employee("小红", 20));
// 去重操作
empList.stream()
.filter((e) -> e.getAge() < 19)
.distinct()
.forEach(System.out::println); }

  映射

  

   示例讲解:

// map——接收函数,将每个元素运用到函数上,映射为一个新的元素(flatMap见定义,不再赘述)
@Test
public void test5() {
List<Employee> empList = new ArrayList<>();
empList.add(new Employee("小张", 18));
empList.add(new Employee("小明", 19));
empList.add(new Employee("小红", 20));
// 映射操作,例如提取名字
empList.stream()
.map(Employee::getName)
.forEach(System.out::println); }

  排序

  

  示例讲解

    // sorted——可以按自然排序(无参)或相应的比较器排序(参数为比较器)
@Test
public void test6() {
List<Employee> empList = new ArrayList<>();
empList.add(new Employee("小明", 18));
empList.add(new Employee("小张", 19));
empList.add(new Employee("小红", 20));
// 注意Employee没有自然排序方式!
empList.stream()
.sorted((e1, e2) -> {
// 若年龄相等,比较姓名
if (e1.getAge().equals(e2.getAge())) {
return e1.getName().compareTo(e2.getName());
}
// 年龄不等,直接比较年龄(加上符号,逆向排序)
return -(e1.getAge().compareTo(e2.getAge()));
})
.forEach(System.out::println); }

  终止操作

  查找与匹配

  

  

// allMatch——检查是否全部匹配
// anyMatch——是否至少匹配一个
// noneMatch不再赘述
@Test
public void test7() {
List<Employee> empList = new ArrayList<>();
empList.add(new Employee("小明", 18, Status.FREE));
empList.add(new Employee("小张", 19, Status.VOCATION));
empList.add(new Employee("小红", 20, Status.FREE));
// 注意Employee没有自然排序方式!
boolean b1 = empList.stream()
.allMatch((e) -> e.getStatus().equals(Status.FREE));
System.out.println(b1);// false
boolean b2 = empList.stream()
.anyMatch((e) -> e.getStatus().equals(Status.VOCATION));
System.out.println(b2);// true
}
// findFirst——流中第一个元素
// findAny——返回任意元素
@Test
public void test8() {
List<Employee> empList = new ArrayList<>();
empList.add(new Employee("小明", 18, Status.FREE));
empList.add(new Employee("小张", 19, Status.VOCATION));
empList.add(new Employee("小红", 20, Status.FREE));
// 注意Employee没有自然排序方式!
Optional<Employee> op = empList.stream()
.sorted((e1, e2) -> e1.getAge().compareTo(e2.getAge()))
.findFirst();
// Java8中使用Optional来避免空指针,orElse表示若op元素为空,则使用另外元素替代
// op.orElse(new Employee("老王", 20, Status.FREE));
Employee employee = op.get();
System.out.println(employee); Optional<Employee> any = empList.stream()
.filter((e) -> e.getStatus().equals(Status.FREE))
.findAny();
}
// count、max、min有点类似SQL语句
@Test
public void test9() {
List<Employee> empList = new ArrayList<>();
empList.add(new Employee("小明", 18, Status.FREE));
empList.add(new Employee("小张", 19, Status.VOCATION));
empList.add(new Employee("小红", 20, Status.FREE));
// 这里省略了中间操作
long count = empList.stream()
.count();
Optional<Employee> max = empList.stream()
.max((e1, e2) -> {
if (e1.getAge().equals(e2.getAge())) {
return e1.getName().compareTo(e2.getName());
}
return e1.getAge().compareTo(e2.getAge());
});
Employee employee = max.get();
System.out.println(employee);
// 提取最小的工资数(结合之前的中间操作)
Optional<Integer> min = empList.stream()
.map(Employee::getAge)
.min(Integer::compare);
System.out.println(min.get());
}
// forEach之前已经使用到,不再赘述

  规约

  

  示例:

 // reduce——将集合中的元素反复结合起来,得到一个值
@Test
public void test10() {
List<Employee> empList = new ArrayList<>();
empList.add(new Employee("小张", 18));
empList.add(new Employee("小明", 19));
empList.add(new Employee("小红", 20)); // 例如,计算所有年龄总和(先将员工信息进行映射,提取age,也就是经典的map-reduce模式)
Integer totalAge = empList.stream()
.map(Employee::getAge)
.reduce(0, (x, y) -> x + y);// 第一个参数是起始值,第二个参数为二元运算的Function
System.out.println(totalAge);
}

  收集

  

  Collector 接口中方法的实现决定了如何对流执行收集操作(如收 集到 List、Set、Map)。但是 Collectors 实用类提供了很多静态 方法,可以方便地创建常见收集器实例,

  示例

   // collect——常见的运用例如提取员工信息中的name,组装成新的集合等操作
@Test
public void test11() {
List<Employee> empList = new ArrayList<>();
empList.add(new Employee("小张", 18));
empList.add(new Employee("小明", 19));
empList.add(new Employee("小红", 20)); List<String> list = empList.stream()
.map(Employee::getName)
.collect(Collectors.toList());// 需要去重,请使用toSet();
list.forEach(System.out::println);
// 需要自定义集合,例如LinedHashSet,可以使用此方式
empList.stream()
.map(Employee::getName)
.collect(Collectors.toCollection(HashSet::new));
}

  更多Collectors中的方法(例如couonting,grouping),可以参见下表或者在源码中参考

toList List<T> 把流中元素收集到List
List<Employee> emps= list.stream().collect(Collectors.toList());
toSet Set<T> 把流中元素收集到Set
Set<Employee> emps= list.stream().collect(Collectors.toSet());
toCollection Collection<T> 把流中元素收集到创建的集合
Collection<Employee>emps=list.stream().collect(Collectors.toCollection(ArrayList::new));
counting Long 计算流中元素的个数
long count = list.stream().collect(Collectors.counting());
summingInt Integer 对流中元素的整数属性求和
inttotal=list.stream().collect(Collectors.summingInt(Employee::getSalary));
averagingInt Double 计算流中元素Integer属性的平均

doubleavg= list.stream().collect(Collectors.averagingInt(Employee::getSalary));
summarizingInt IntSummaryStatistics 收集流中Integer属性的统计值。
如:平均值
IntSummaryStatisticsiss= list.stream().collect(Collectors.summarizingInt(Employee::getSalary));
joining String 连接流中每个字符串
String str= list.stream().map(Employee::getName).collect(Collectors.joining());
maxBy Optional<T> 根据比较器选择最大值
Optional<Emp>max= list.stream().collect(Collectors.maxBy(comparingInt(Employee::getSalary)));
minBy Optional<T> 根据比较器选择最小值
Optional<Emp> min = list.stream().collect(Collectors.minBy(comparingInt(Employee::getSalary)));
reducing 归约产生的类型 从一个作为累加器的初始值
开始,利用BinaryOperator与
流中元素逐个结合,从而归
约成单个值
inttotal=list.stream().collect(Collectors.reducing(0, Employee::getSalar, Integer::sum));
collectingAndThen 转换函数返回的类型 包裹另一个收集器,对其结
果转换函数
inthow= list.stream().collect(Collectors.collectingAndThen(Collectors.toList(), List::size));
groupingBy Map<K, List<T>> 根据某属性值对流分组,属
性为K,结果为V
Map<Emp.Status, List<Emp>> map= list.stream()
.collect(Collectors.groupingBy(Employee::getStatus));
partitioningBy Map<Boolean, List<T>> 根据true或false进行分区
Map<Boolean,List<Emp>>vd= list.stream().collect(Collectors.partitioningBy(Employee::getManage));

 二、并行流与串行流

  并行流就是把一个内容分成多个数据块,并用不同的线程分 别处理每个数据块的流。

    原理——fork/join框架

  采用 “工作窃取”模式(work-stealing): 当执行新的任务时它可以将其拆分分成更小的任务执行,并将小任务加到线 程队列中,然后再从一个随机线程的队列中偷一个并把它放在自己的队列中。

  更多fork/join相关的介绍,请参见:http://www.infoq.com/cn/articles/fork-join-introduction

  Stream API 可以声明性地通过 parallel() 与 sequential() 在并行流与顺序流之间进行切换。

    Long sum = LongStream.rangeClosed(0L, 10000000000L)
.parallel()
.sum();

  完整的示例,请参见如下:

package com.atguigu.java8;

import java.util.concurrent.ForkJoinPool;
import java.util.concurrent.ForkJoinTask;
import java.util.stream.LongStream; import org.junit.Test; public class TestForkJoin { @Test
public void test1(){
long start = System.currentTimeMillis(); ForkJoinPool pool = new ForkJoinPool();
ForkJoinTask<Long> task = new ForkJoinCalculate(0L, 10000000000L); long sum = pool.invoke(task);
System.out.println(sum); long end = System.currentTimeMillis(); System.out.println("耗费的时间为: " + (end - start)); //112-1953-1988-2654-2647-20663-113808
} @Test
public void test2(){
long start = System.currentTimeMillis(); long sum = 0L; for (long i = 0L; i <= 10000000000L; i++) {
sum += i;
} System.out.println(sum); long end = System.currentTimeMillis(); System.out.println("耗费的时间为: " + (end - start)); //34-3174-3132-4227-4223-31583
} @Test
public void test3(){
long start = System.currentTimeMillis(); Long sum = LongStream.rangeClosed(0L, 10000000000L)
.parallel()
.sum(); System.out.println(sum); long end = System.currentTimeMillis(); System.out.println("耗费的时间为: " + (end - start)); //2061-2053-2086-18926
} }

Java8新特性(二)——强大的Stream API的相关教程结束。