# 5장: 스트림 활용

이번 장에서는 아래 메서드들을 차근차근 살펴본다. 🐳

<figure><img src="https://946524419-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FZqOTWctN1y9hEXEl4sKd%2Fuploads%2Fer0JwjrvV844fAFS4mkO%2Fimage.png?alt=media&#x26;token=e7fbd8ce-2516-433c-9e82-9a2da5881d91" alt=""><figcaption><p><a href="https://javaconceptoftheday.com/java-8-streams-beginners-guide/">https://javaconceptoftheday.com/java-8-streams-beginners-guide/</a></p></figcaption></figure>

## 필터링

### Predicate 필터링

* filter 메서드는 Predicate(boolean을 반환하는 함수형 인터페이스)를 인수로 받아서 Predicate에서 true를 반환하는 요소만 포함하는 스트림을 반환한다.

```java
List<Integer> numbers = List.of(1,2,4,2,3,5);
numbers.stream()
       .filter(i -> i % 2 == 0)
       .forEach(System.out::println);
```

### 고유 요소만 필터링

* 고유 요소로 이루어진 스트림을 반환하는 distinct메서드도 지원한다.
* 객체의 고유 여부는 스트림에서 만든 객체의 hashCode, equals로 결정한다. (equals & hashcode를 잘 정의하도록 하자..🥲)

```java
List<Integer> numbers = List.of(1,2,4,2,3,5);
numbers.stream()
       .filter(i -> i % 2 == 0)
       .distinct() // 중복 필터링
       .forEach(System.out::println);
```

## 스트림 슬라이싱

* 스트림의 요소를 선택하거나 스킵하는 방법

### Predicate를 이용한 슬라이싱

#### TAKEWHILE

* **데이터가 정렬되어 있고, 특정 조건이 참이 나오면 반복 작업을 중단**하려면 takeWhile()을 이용해 처리할 수 있다.
* filter는 모든 데이터를 검사하며 true인 것만 다음으로 넘어가지만, takeWhile은 조건에 대해 true가 아니게 될 경우 바로 거기서 멈추게 된다.
* 아래 예제는 320 칼로리 미만인 메뉴만 슬라이싱한다.

```java
List<Dish> silcedMenu = specialMenu.stream()
                                   .takeWhile(dish -> dish.getCalories() < 320)
                                   .collect(toList());
```

#### DROPWHILE

* takeWhile과 정반대로, **데이터가 정렬되어 있고, 특정 조건이 거짓이 나오면 반복 작업을 중단**하려면 dropWhile()을 이용해 처리할 수 있다.
* 프레디케이트가 처음으로 거짓이 되는 지점까지 탐색한 후, 작업을 중단하고 해당 지점 이후의 탐색하지 않은 모든 요소를 반환한다.
* 아래 예제는 320 칼로리 이상인 메뉴만 슬라이싱한다.

```java
List<Dish> silcedMenu = specialMenu.stream()
                                   .dropWhile(dish -> dish.getCalories() < 320)
                                   .collect(toList());
```

### 스트림 축소

* 주어진 값 이하의 크기를 갖는 새로운 스트림을 반환하는 limit(n) 메서드를 사용할 수 있다.
* 최대 n개의 요소만을 반환할 수 있다.
* 아래는 최대 3개의 요소만을 반환하도록 하는 코드이다.

```java
List<Dish> silcedMenu = specialMenu.stream()
                                   .filter(dish -> dish.getCalories() > 300)
                                   .limit(3)
                                   .collect(toList());
```

### 요소 건너뛰기

* 처음 n개 요소를 제외한 스트림을 반환하는 skip(n) 메서드를 제공한다.
* n개 이하의 요소를 포함하는 스트림에 skip(n)을 호출하면 빈 스트림이 반환된다.
* limit과 skip은 상호 보완적인 연산을 수행한다.
* 아래는 300칼로리 이상인 음식 중 처음 두 요리는 스킵하고 나머지 요리들만 반환하는 코드이다.

```java
List<Dish> silcedMenu = specialMenu.stream()
                                   .filter(dish -> dish.getCalories() > 300)
                                   .skip(2)
                                   .collect(toList());
```

## 매핑

* 특정 객체에서 특정 데이터를 선택하기 위해 매핑 작업을 수행할 수 있다.

### 스트림의 각 요소에 함수 적용하기

* 함수를 인수로 받는 map 메서드를 지원한다.
* 인수로 제공된 함수는 각 요소에 적용되며 함수를 적용한 결과가 새로운 요소로 매핑된다.
* 다음은 Dish 리스트를 스트림으로 순회하며 Dish의 name 필드만 추출한 리스트를 반환하는 코드이다.

```java
List<String> MenuNames = specialMenu.stream()
                                    .map(Dish::getName)
                                    .collect(toList());
```

* 다른 map 메서드를 체이닝하는 것도 가능하다.
* 다음은 Dish 리스트를 스트림으로 순회하며 name필드의 길이를 추출한 리스트를 반환하는 코드이다.

```java
List<Integer> MenuNameLengths = specialMenu.stream()
                                           .map(Dish::getName)
                                           .map(String::length)
                                           .collect(toList());
```

### 스트림 평면화

* flatMap은 각 배열을 스트림이 아니라 **스트림의 콘텐츠로 매핑**한다.
* 스트림의 각 값을 다른 스트림으로 만든 다음에, 모든 스트림을 하나의 스트림으로 연결하는 기능을 수행한다.
* 아래 코드의 flatMap은 단어들을 모두 알파벳 단위로 떼어낸 후 얻는 여러 개의 String\[] 배열들을 하나의 String Stream으로 모아 순회할 수 있도록 해준다.

```java
List<String> uniqueChars = words.stream()
                                .map(word -> word.split("")) // Stream<String[]>
                                .flatMap(Arrays::stream) // Stream<String>
                                .distinct()
                                .collect(toList());
```

## 검색과 매칭

### 적어도 한 요소와 일치하는지 검사

* Predicate가 주어진 스트림에서 적어도 한 요소와 일치하는지 확인할 때 anyMatch 메서드를 활용한다.

```java
boolean isMatch = menu.stream().anyMatch(Dish::isVegetarian);
```

### 모든 요소와 일치하는지 검사

* Predicate가 주어진 스트림의 모든 요소와 일치하는지 확인할 때 allMatch 메서드를 활용한다.

```java
boolean isAllVegiterian = menu.stream().allMatch(Dish::isVegetarian);
```

* Predicate가 주어진 스트림의 모든 요소와 일치하지 않는지 확인할 때 noneMatch 메서드를 활용한다.

```java
boolean isHealthy = menu.stream().noneMatch(d -> d.getCalories() >= 1000);
```

> 쇼트 서킷
>
> 하나라도 조건에 맞지 않는다면 나머지 표현식의 결과에 상관없이 전체 결과가 정해지기 때문에 전체 스트림을 처리하지 않아도 결과를 반환할 수 있는 것을 말한다.
>
> allMatch, noneMatch, findFirst, findAny 등의 연산이 모두 이에 해당한다.

### 요소 검색

* findAny 메서드는 현재 스트림에서 임의의 요소를 반환한다.
* 다른 스트림 연산과 연결해서 사용할 수 있으며, 결과를 찾는 즉시 스트림을 종료한다.
* [findFirst 메서드](#undefined-12)를 사용할 경우 병렬 실행 시 첫 번째 요소를 찾기 어려우므로 보통 병렬으로 실행시킬 때 제약이 적은 findAny 메서드를 사용한다.

```java
Optional<Dish> dish = words.stream()
          .filter(Dish::isVegetarian)
          .findAny();
```

### 첫 번째 요소 찾기

* 스트림은 첫번째 요소를 찾는 findFirst 메서드를 제공한다.
* 리스트 또는 정렬된 데이터로부터 생성된 스트림은 논리적인 아이템 순서가 정해져 있을 수 있다.

```java
Optional<Integer> first = someNumbers.stream()
        .map(n -> n * n)
        .filter(n -> n % 3 == 0)
        .findFirst();
```

## 리듀싱

* 스트림의 최종연산 중 하나로 마지막 결과가 나올때까지 스트림의 모든 요소를 반복적으로 처리하는 과정
* 함수형 프로그래밍 언어 용어로는 이과정이 마치 종이를 작은 조각이 될때까지 반복해서 접는것과 비슷하다 하여 폴드(fold)라고 부른다.
* 리듀스의 파라미터
  * 초깃값
  * 스트림의 두 요소를 조합해 새로운 값을 만드는 BinaryOperator\<T> 의 구현체(람다)
* reduce를 사용하면 스트림이 하나의 값으로 줄어들 때 까지 각 요소를 반복해 조합하기 때문에, 애플리케이션의 반복된 패턴을 추상화 할 수 있다.

### 요소의 합

* reduce를 사용해 스트림의 모든 요소들의 총합을 구해보자.
* 초깃값을 0으로 두고, 더하기 메서드를 파라미터로 넘기면 스트림에 총합만 남을때까지 더하는 연산이 수행된다.

```java
// 기존 자바 방식
int sum = 0;
for ( int x : numbers ) {
  sum += x;
}

// 스트림의 리듀스 사용
int sum = numbers.stream().reduce(0, (a, b) -> a + b);
int multiple = numbers.stream().reduce(1, (a, b) -> a * b); // 모든 요소를 곱하므로 초깃값은 1이어야 한다.

// 메서드 참조
int sum = numbers.stream().reduce(0, Integer::sum);

```

* 리듀스 연산에 초깃값을 주지 않으면 스트림에 아무 요소도 없는 경우 값을 반환할 수 없기 때문에 Optional 객체로 감싼 결과를 반환한다.

### 최댓값과 최솟값

* 최댓값과 최솟값을 찾을 때도 reduce를 활용할 수 있다.
* 스트림의 모든 요소를 소비할 때 까지 max() 혹은 min() 연산을 한다.

```java
Optional<Integer> max = numbers.stream().reduce(Integer::max);
Optional<Integer> min = numbers.stream().reduce(Integer::min);
```

> reduce 메서드와 병렬화
>
> * reduce를 이용하면 내부 반복이 추상화되면서 포크/조인 프레임워크를 활용해 병렬로 reduce를 실행할 수 있게 된다.
> * 단계적 반복으로 합계를 구할때는 sum 변수를 공유해야 하는데, 이로 인해 동기화 이슈가 발생해 병렬화가 어렵다.
> * 물론 병렬로 실행하기 위해서는 연산이 어떤 순서로 실행되더라도 결과가 바뀌지 않는 구조여야 한다.

> 스트림 연산 : 상태 있음과 상태 없음
>
> * 상태 없음 (stateless operation)
>   * map, filter 등은 입력 스트림에서 각 요소를 받아 0 또는 결과를 출력 스트림으로 보낸다.
> * 상태 있음 (stateful operation)
>   * reduce, sum, max 같은 연산은 결과를 누적할 내부 상태가 필요하지만 이는 int, double 등과 같이 작은 값이며, 스트림에서 처리하는 요소 수와 관계없이 **한정**(bounded)되어있다.
>   * 반면 sorted나 distinct 같은 연산을 수행하기 위해서는 과거의 이력을 알고있어야 한다. 예를 들어 어떤요소를 출력 스트림으로 추가하려면 **모든 요소가 버퍼에 추가되어 있어야** 한다. 따라서 데이터 스트림의 크기가 크거나 무한이라면 문제가 생길 수 있다.

## 숫자형 스트림

* [3장](https://develop-footprint.gitbook.io/o/java/3#primitive-type) 내용과 비슷하게 오토박싱을 피하기 위해 primitive type을 위한 스트림을 제공한다.
* int 요소에 특화된 IntStream, double 요소에 특화된 DoubleStream, long 요소에 특화된 LongStream을 제공한다.

### 숫자 스트림으로 매핑

* mapToInt, mapToDouble, mapToLong 메서드를 사용하면 기본형 특화 스트림으로 변환해준다.
* 아래와 같이 mapToInt 메서드로 각 요리에서 모든 칼로리(Interger형식)를 추출한 다음에 IntStream을(Stream\<Integer>가 아님) 반환한다. 스트림이 비어있으면 sum은 기본값 0을 반환한다.

```java
int calories = menu.stream()
                   .mapToInt(Dish::getCalories) // IntStream
                   .sum();
```

### 객체 스트림으로 복원

* 숫자 스트림을 기본 스트림으로 변환하려면 boxed() 메서드를 사용하면 된다.

```java
IntStream intStream = menu.stream().mapToInt(Dish::getCalories);
Stream<Integer> stream = intStream.boxed();
```

### OptionalInt

* Optional을 Integer, String 등의 참조 형식으로 파라미터화할 수 있다.&#x20;
* OptionalInt, OptionalDouble, OptionalLoing 세 가지 기본형 특화 스트림 버전을 제공하여 숫자 스트림 메서드의 결과를 받을 수 있다.

```java
OptionalInt maxCalories = menu.stream().mapToInt(Dish::getCalories).max();
int max = maxCalories.orElse(1);
```

### **숫자 범위**

* IntStream과 LongStream에서는 range와 rangeClosed라는 두 가지 정적 메서드를 제공한다. 두 메서드 모두 시작값과 종료값을 인수로 가진다.
* range 메서드는 시작값과 종료값이 결과에 포함되지 않는다.
* rangeClosed 메서드는 시작값과 종료값이 결과에 포함된다.

```java
IntStream evenNumbers = IntStream.rangeClosed(1, 100).filter(n -> n % 2 == 0);
System.out.println(evenNumbers.count()); // 50 출력
```

#### 피타고라스의 수를 구하는 예제

* 1부터 100까지 피타고라스의 수를 구한다. (a\*a + b\*b = c\*c인 경우의 수를 모두 구하기)
* a, b를 iteration 돌면서 a\*a + b\*b 의 제곱근이 정수일 경우에만 int\[a, b, c]를 스트림에 남겨둔다.

```java
Stream<int[]> pythagoreanTriples = 
   IntStream.rangeClose(1, 100).boxed()
            .flatMap(a -> 
                     IntStream.rangeClose(a, 100)
                              .mapToObj(b -> new int[]{a, b, (int)Math.sqrt(a * a + b * b)})
                              .filter(t -> t[2] % 1 == 0));
```

## 다양하게 스트림 만들기

### 값으로 스트림 만들기

* 임의의 수를 인수로 받는 정적 메서드 Stream.of를 이용해서 스트림을 만들 수 있다.

```java
Stream<String> stream = Stream.of("Modern", "Java", "In", "Action");
```

* Stream.empty() 메서드는 스트림을 비운다.

```java
Stream<String> emptyStream = Stream.empty();
```

### null이 될 수 있는 **객체로 스트림 만들기**

* ofNullable 메서드로 null이 될 수 있는 객체를 포함하는 스트림을 만들 수 있다.
* nullable한 객체를 포함하는 스트림값과 flatMap을 함께 사용하는 상황에서 유용하게 사용할 수 있다.

```java
Stream<String> stream = Stream.ofNullable(System.getProperty("home"));

Stream<String> values = Stream.of("config", "home", "user")
   .flatMap(key -> Stream.ofNullable(System.getProperty(key)));
```

### **배열로 스트림 만들기**

* 배열을 인수로 받는 정적 메서드 Arrays.stream()을 이용해서 스트림을 만들 수 있다.

```java
int[] numbers = {2, 3, 5, 7, 11, 13};
int sum = Arrays.stream(numbers).sum();
```

### **파일로 스트림 만들기**

* 파일을 처리하는 등의 I/O 연산에 사용하는 자바의 NIO API(비블록 I/O)도 스트림 API를 활용할 수 있다.
* Files.lines로 파일의 각 행 요소를 반환하는 스트림을 얻을 수 있다.
* Stream 인터페이스는 AutoCloseable 인터페이스를 구현하므로, try 블록 내의 자원은 자동으로 관리된다.
* 다음은 입력받은 파일에서 각 행의 단어들을 flatMap으로 하나의 스트림으로 평면화한 후, 고유한 단어가 몇개인지 반환하는 코드이다.

```java
long uniqueWords = 0;
try(Stream<String> lines = Files.lines(Paths.get("data.txt"), Charset.defaultCharset())) {
  uniqueWords = lines.flatMap(line -> Arrays.stream(line.split(" ")))
    .distinct()
    .count();
} catch (IOException e) {
  // 파일 열다가 예외 발생 시 처리
}
```

### **함수로 무한 스트림 만들기**

* Stream.iterate와 Stream.generate를 이용해서 함수로부터 크기가 고정되지 않은 무한 스트림(unbounded stream)을 만들 수 있다.

#### iterate 메서드

* 초깃값과 람다를 인수로 받아서 새로운 값을 끊임없이 생산할 수 있다.
* 보통은 무한한 값을 출력하지 않도록 limit(n)  메서드와 함께 사용한다.
* 혹은 두 번째 인수로 Predicate를 받아 작업 중단의 기준으로 사용할 수도 있다.

```java
Stream.iterate(0, n -> n + 2)
   .limit(10)
   .forEach(System.out::println);

// 100보다 큰 값이 나오면 작업 중단
IntStream.iterate(0, n -> n < 100, n -> n + 4)
         .forEach(System.out::println);
```

* filter 메서드는 언제 작업을 중단할 지 알릴 수 없기 때문에,  takeWhile 메서드를 사용해야 한다.

```java
IntStream.iterate(0, n -> n + 4)
         .takeWhile(n -> n < 100)
         .forEach(System.out::println);
```

#### generate 메서드

* iterate와 달리 generate는 생산된 각 값을 연속적으로 계산하지 않으며, Supplier\<T>를 인수로 받아서 새로운 값을 생산한다.
* 아래 코드는 0에서 1 사이의 임의의 double number 5개를 만든다.

```java
Stream.generate(Math::random)
      .limit(5)
      .forEach(System.out::println);
```

* generate 메서드의 경우 Supplier에 상태를 가질 가능성이 높아지므로, 순수한 불변 상태를 유지하는 iterate 메서드에 비해 병렬 환경에서 불안정하다.
