고차 함수

고차 함수

  • 고차 함수란 다른 함수를 인자로 받거나 함수를 반환하는 함수이다.

  • 코틀린에서는 람다나 함수 참조를 인자로 넘기거나 반환하면 고차 함수가 된다.

함수 타입

  • 람다를 로컬 변수에 대입할 때 코틀린의 타입 추론으로 인해 변수 타입을 지정하지 않아도 된다.

  • 이 때 컴파일러는 람다가 함수 타입임을 추론하게 된다.

  • 아래는 자동으로 타입 추론이 되도록 간결하게 작성할 수도 있고 직접 함수 타입을 명시할 수도 있음을 보여주는 예제이다.

// 자동으로 타입 추론이 되도록 한다.
val sum = {x: Int, y: Int -> x + y }

// 직접 함수 타입을 명시한다.
val sum: (Int, Int) -> Int = { x, y -> x + y}
  • 함수 타입을 정의하려면 함수 파라미터의 타입을 괄호 안에 넣고 화살표를 추가한 후 함수의 반환 타입을 지정하면 된다.

  • 함수 타입 선언 시 반환값이 없다면 Unit 타입을 반환하도록 지정해야 한다.

(Int, String) -> Unit
  • 반환 타입을 널이 될 수 있는 타입으로 지정할 수 있다.

var canReturnNull: (Int, Int) -> Int? = { null }
  • 함수 타입 자체가 널이 될 수 있도록 지정할 수도 있다. 이 경우 함수 타입 전체를 괄호로 감싼 후 물음표를 붙여야 한다.

인자로 받은 함수 호출

  • 인자로 받은 함수는 일반 함수를 호출하는 것과 동일하게 호출하면 된다.

  • 아래는 predicate라는 함수 타입을 인자로 받아 문자열에서 특정 조건을 만족하는 문자만 남기는 filter 함수 구현이다.

자바에서 코틀린의 함수 타입 사용

  • 함수 타입 변수는 FunctionN 인터페이스를 구현하는 객체를 저장한다. FunctionN 인터페이스에는 invoke 메서드를 정의해두어 이를 호출하면 함수가 실행된다.

  • 코틀린 표준 라이브러리는 함수 인자 개수에 따라 Function0<R>, Function1<P1, R> 등의 인터페이스를 제공한다.

  • 자바에서는 함수 타입을 인자로 받는 코틀린 함수에 람다를 넘기면 된다. 자바 8 이전이라면 FunctionN 인터페이스의 invoke 메서드를 구현한 익명 클래스를 넘기면 된다.

  • 람다를 인자로 받는 확장 함수를 자바에서 호출 시 첫 번째 인자로 수신 객체를 넘겨야 한다.

  • 반환 타입이 Unit인 함수나 람다를 자바로 작성할 때 반드시 Unit 타입의 값을 명시적으로 반환해야 한다.

  • 아래는 자바로 람다를 인자로 받는 확장 함수에 Unit 타입을 반환하는 람다를 인자로 입력하는 예제이다.

디폴트 값을 지정하거나 널이 될 수 있는 함수 타입 파라미터

  • 함수 타입의 파라미터에 대해 디폴트 값을 지정할 수 있다.

  • 다음은 컬렉션의 요소들을 원하는 형태로 가공해 하나의 String 타입으로 통합하는 joinToString 함수이다.

    • transform이라는 함수 타입 인자에 대한 기본값을 toString으로 지정하여, 사용자가 별도로 지정하지 않으면 기본값을 사용하게 된다.

  • 널이 될 수 있는 함수 타입 파라미터는 물음표를 사용해 선언하고, invoke 메서드 호출 전 물음표를 사용해 null 인지 여부를 확인해야 한다.

함수 타입을 반환하기

  • 다른 함수를 반환하는 함수를 정의하려면 함수 타입을 반환하도록 해야 한다.

람다로 중복 제거하기

  • 아래와 같이 사이트 방문 로그 데이터가 존재할 때, 모바일 OS의 사용자들의 평균 사이트 지속 시간을 알고 싶다면 람다를 직접 작성해 filter 함수에 넘겨야 한다.

  • 람다를 직접 정의하는 대신 사용자가 직접 원하는 조건이면 true를 반환하는 람다를 함수에 인자로 입력하도록 하여 평균 사이트 지속 시간을 구하도록 할 수 있다.

인라인 함수

동작 방식

  • 람다는 보통 익명 클래스로 컴파일되지만 람다 식을 사용할 때마다 새로운 클래스가 생성되지는 않으며, 람다가 변수를 포획하면 람다가 생성되는 시점마다 새로운 익명 클래스 객체가 생성된다.

  • 코틀린에서는 반복되는 코드를 별도 함수로 분리할 때 효율적인 동작을 위해 컴파일 시 함수 본문에 바이트코드로 넣어주는 inline 변경자를 제공한다.

  • inline 함수를 호출하는 함수 내부 코드에 inline 함수 구현이 바이트코드로 그대로 들어가게 된다.

  • 예를 들어 synchronized라는 간단한 함수를 inline으로 정의하면, 컴파일 전에는 함수를 호출하도록 구현해두지만 컴파일하면 별도의 함수를 호출하는 대신 하나의 함수에 흡수(인라이닝)된다.

    • 인자로 입력된 람다 역시 인라이닝된다.

  • 만약 함수 타입의 변수를 인라인 함수에 전달한다면, 컴파일 시점에 변수에 저장된 내용을 알 수 없으므로 함수 타입은 인라이닝되지 않는다.

  • 하나의 인라인 함수를 여러 곳에서 호출한다면 각각의 호출된 부분에 인라이닝된다.

한계

  • 인라인 함수 호출 시 람다 식을 바로 호출하거나 인자로 전달받는 경우에만 인라이닝할 수 있다.

  • 인라인 함수의 특정 인자만 인라인되지 않도록 하려면 noinline 변경자를 파라미터에 붙여야 한다.

컬렉션 연산 인라이닝

  • 코틀린의 컬렉션에서 제공하는 filter 함수는 인라인 함수이다. 따라서 함수에 전달된 람다 본문과 filter 함수 구현이 filter 함수 호출 위치에 들어간다.

  • 아래와 같이 filter, map을 체이닝해 사용하는 경우 호출 위치로 인라인 되지만, 중간 리스트를 생성해 filter 함수의 결과를 저장해두어야 한다.

  • 시퀀스를 사용할 경우 람다를 저장해야 하므로 인라인할 수 없다. 따라서 컬렉션 크기가 클 때에만 시퀀스를 통해 지연 계산으로 성능을 향상시키는 것을 고려해야 한다.

함수를 인라인으로 선언해야 하는 이유

  • 일반 함수 호출 시 JVM은 코드 실행을 분석해 가장 좋은 방향으로 인라인한다. 이는 JIT 컴파일러가 바이트코드를 기계어 코드로 번역할 때 이뤄진다.

  • JVM의 최적화를 사용하면 바이트 코드에서 함수 구현이 한 번만 있으면 되므로 코드가 중복될 필요가 없다.

  • 코틀린의 인라인을 사용하면 호출되는 부분마다 코드에 중복이 생기게 되는 단점이 존재하지만, 함수 호출 비용을 줄이고 람다를 표현하는 클래스나 객체를 생성할 필요가 없어진다.

  • 인라인 변경자를 붙이는 함수는 코드 크기가 적어야 전체 바이트 코드 크기에 영향이 적으므로 효율적이다.

자원 관리를 위해 인라인된 람다 사용

  • 파일, 락, 데이터베이스 트랜잭션 등 자원 관리 패턴을 만들 때 인라인된 람다를 사용할 수 있다.

  • 다음은 withLock 함수에 락을 사용하는 람다를 입력하여 직접 락을 걸거나 해제하지 않아도 되는 예제이다.

  • use 함수를 사용하면 자바의 try-with-resource와 같이 직접 자원을 해제해줄 필요 없이 자원을 사용하는 람다만 넘기면 된다.

고차 함수 안에서 흐름 제어

람다 안의 return문

  • 람다 안에서 return을 사용하면 람다로부터만 반환되는 것이 아니라 람다를 호출하는 함수까지 실행을 끝내고 반환하게 된다.

  • 이와 같이 자신을 둘러싸고 있는 블록보다 더 바깥의 블록을 반환하게 만드는 return문을 non-local return 이라고 부른다.

  • 람다를 인자로 받는 함수가 인라인 함수인 경우에만 non-local return을 할 수 있다. 인라이닝되지 않는 함수는 람다를 변수에 저장할 수 있고, 바깥쪽 함수가 반환된 이후에 람다가 호출될 때를 다룰 수 없으므로 non-local return을 할 수 없다.

  • forEach는 인라인 함수이므로 아래와 같이 작성하면 return문을 수행할 때 lookForAlice 함수도 반환된다.

레이블을 사용한 return

  • local return은 람다의 실행을 끝낸 후 람다를 호출했던 부분을 이어서 실행한다.

  • 레이블을 사용해 return으로 실행을 끝내고 싶은 람다식을 지정할 수 있다.

  • 람다 식에 레이블을 붙이기 위해 <레이블 이름>@을 람다 정의 직전 선언하고, 반환 시에 return문 뒤에 @<레이블 이름을 붙인다.

  • 람다를 인자로 받는 인라인 함수의 이름을 return문 뒤의 레이블 이름으로 사용할 수도 있다. 람다 식에 레이블을 이미 명시했다면 함수 이름을 레이블로 사용할 수 없다. 람다 식에는 레이블이 2개 이상 붙을 수 없기 때문이다.

익명 함수

  • 익명 함수는 코드 블럭을 함수에 넘길 때 사용할 수 있는 또다른 방법이다.

  • 람다 식에 대한 문법적 편의를 위해 제공된다.

  • 일반 함수와 달리 함수 이름이나 파라미터 타입을 생략할 수 있다.

  • 별도로 레이블을 붙이지 않아도 return문은 항상 익명 함수 자체만 반환시킨다. 따라서 람다와 달리 바깥 함수가 반환되는 것을 고려하지 않아도 된다.

Last updated