Что такое функция батута?

Во время недавних обсуждений на работе кто-то упомянул батутную функцию.

Я прочитал описание в Википедии. Достаточно дать общее представление о функциональности, но я бы хотел кое-что более конкретное.

У вас есть простой фрагмент кода, который будет иллюстрировать батут?

7 ответов

Существует также LISP-ощущение "батут", как описано в Википедии:

Используемый в некоторых реализациях LISP, батут представляет собой цикл, который итеративно вызывает функции, возвращающие thunk. Один батут достаточно, чтобы выразить все контрольные передачи программы; программа, выраженная таким образом, является батутом или в "батутном стиле"; преобразование программы в батутный стиль - это прыжки на батуте. Батутные функции могут использоваться для реализации вызовов хвостовых рекурсивных функций в стеково-ориентированных языках.

Допустим, мы используем Javascript и хотим написать наивную функцию Фибоначчи в стиле прохождения продолжения. Причина, по которой мы это сделаем, не имеет значения - например, перенести Scheme на JS или поиграть с CPS, который мы все равно должны использовать для вызова функций на стороне сервера.

Итак, первая попытка

function fibcps(n, c) {
    if (n <= 1) {
        c(n);
    } else {
        fibcps(n - 1, function (x) {
            fibcps(n - 2, function (y) {
                c(x + y)
            })
        });
    }
}

Но, запустив это с n = 25 в Firefox выдает ошибку "Слишком много рекурсии!". Теперь это именно та проблема (отсутствует оптимизация хвостового вызова в Javascript), которую решает прыжок на батуте. Вместо того, чтобы делать (рекурсивный) вызов функции, давайте return инструкция (thunk) для вызова этой функции для интерпретации в цикле.

function fibt(n, c) {
    function trampoline(x) {
        while (x && x.func) {
            x = x.func.apply(null, x.args);
        }
    }

    function fibtramp(n, c) {
        if (n <= 1) {
            return {func: c, args: [n]};
        } else {
            return {
                func: fibtramp,
                args: [n - 1,
                    function (x) {
                        return {
                            func: fibtramp,
                            args: [n - 2, function (y) {
                                return {func: c, args: [x + y]}
                            }]
                        }
                    }
                ]
            }
        }
    }

    trampoline({func: fibtramp, args: [n, c]});
}

Позвольте мне добавить несколько примеров для факториальной функции, реализованной с помощью батутов, на разных языках:

Scala:

sealed trait Bounce[A]
case class Done[A](result: A) extends Bounce[A]
case class Call[A](thunk: () => Bounce[A]) extends Bounce[A]

def trampoline[A](bounce: Bounce[A]): A = bounce match {
  case Call(thunk) => trampoline(thunk())
  case Done(x) => x
}

def factorial(n: Int, product: BigInt): Bounce[BigInt] = {
    if (n <= 2) Done(product)
    else Call(() => factorial(n - 1, n * product))
}

object Factorial extends Application {
    println(trampoline(factorial(100000, 1)))
}

Джава:

import java.math.BigInteger;

class Trampoline<T> 
{
    public T get() { return null; }
    public Trampoline<T>  run() { return null; }

    T execute() {
        Trampoline<T>  trampoline = this;

        while (trampoline.get() == null) {
            trampoline = trampoline.run();
        }

        return trampoline.get();
    }
}

public class Factorial
{
    public static Trampoline<BigInteger> factorial(final int n, final BigInteger product)
    {
        if(n <= 1) {
            return new Trampoline<BigInteger>() { public BigInteger get() { return product; } };
        }   
        else {
            return new Trampoline<BigInteger>() { 
                public Trampoline<BigInteger> run() { 
                    return factorial(n - 1, product.multiply(BigInteger.valueOf(n)));
                } 
            };
        }
    }

    public static void main( String [ ] args )
    {
        System.out.println(factorial(100000, BigInteger.ONE).execute());
    }
}

C (неудачно без реализации больших чисел):

#include <stdio.h>

typedef struct _trampoline_data {
  void(*callback)(struct _trampoline_data*);
  void* parameters;
} trampoline_data;

void trampoline(trampoline_data* data) {
  while(data->callback != NULL)
    data->callback(data);
}

//-----------------------------------------

typedef struct _factorialParameters {
  int n;
  int product;
} factorialParameters;

void factorial(trampoline_data* data) {
  factorialParameters* parameters = (factorialParameters*) data->parameters;

  if (parameters->n <= 1) {
    data->callback = NULL;
  }
  else {
    parameters->product *= parameters->n;
    parameters->n--;
  }
}

int main() {
  factorialParameters params = {5, 1};
  trampoline_data t = {&factorial, &params};

  trampoline(&t);
  printf("\n%d\n", params.product);

  return 0;
}

Я приведу пример, который я использовал в античит-патче для онлайн-игры.

Мне нужно было иметь возможность сканировать все файлы, которые загружались игрой для модификации. Поэтому самым надежным способом, который я нашел для этого, было использование батута для CreateFileA. Поэтому, когда игра была запущена, я бы нашел адрес для CreateFileA, используя GetProcAddress, затем я изменил бы первые несколько байтов функции и вставил ассемблерный код, чтобы перейти к моей собственной функции "батута", где я бы сделал некоторые вещи, и тогда я бы перейти к следующему месту в CreateFile после моего кода JMP. Надежно сделать это надежнее, но основная идея - просто перехватить одну функцию, заставить ее перенаправить на другую функцию, а затем вернуться к исходной функции.

Изменить: Microsoft имеет рамки для этого типа вещей, которые вы можете посмотреть. Называется Detours

В настоящее время я экспериментирую со способами реализации оптимизации хвостового вызова для интерпретатора Scheme, и в настоящий момент я пытаюсь выяснить, будет ли батут для меня осуществимым.

Насколько я понимаю, это в основном просто серия вызовов функций, выполняемых функцией батута. Каждая функция называется thunk и возвращает следующий шаг в вычислении, пока программа не завершится (пустое продолжение).

Вот первый кусок кода, который я написал, чтобы улучшить мое понимание батута:

#include <stdio.h>

typedef void *(*CONTINUATION)(int);

void trampoline(CONTINUATION cont)
{
  int counter = 0;
  CONTINUATION currentCont = cont;
  while (currentCont != NULL) {
    currentCont = (CONTINUATION) currentCont(counter);
    counter++;
  }
  printf("got off the trampoline - happy happy joy joy !\n");
}

void *thunk3(int param)
{
  printf("*boing* last thunk\n");
  return NULL;
}

void *thunk2(int param)
{
  printf("*boing* thunk 2\n");
  return thunk3;
}

void *thunk1(int param)
{
  printf("*boing* thunk 1\n");
  return thunk2;
}

int main(int argc, char **argv)
{
  trampoline(thunk1);
}

результаты в:

meincompi $ ./trampoline 
*boing* thunk 1
*boing* thunk 2
*boing* last thunk
got off the trampoline - happy happy joy joy !

Вот пример вложенных функций:

#include <stdlib.h>
#include <string.h>
/* sort an array, starting at address `base`,
 * containing `nmemb` members, separated by `size`,
 * comparing on the first `nbytes` only. */
void sort_bytes(void *base,  size_t nmemb, size_t size, size_t nbytes) {
    int compar(const void *a, const void *b) {
        return memcmp(a, b, nbytes);
    }
    qsort(base, nmemb, size, compar);
}

compar не может быть внешней функцией, потому что она использует nbytes, который существует только во время sort_bytes вызов. На некоторых архитектурах небольшая функция-заглушка - батут - генерируется во время выполнения и содержит расположение в стеке текущего вызова sort_bytes, При вызове он переходит к compar код, передавая этот адрес.

Этот беспорядок не требуется в таких архитектурах, как PowerPC, где ABI указывает, что указатель функции на самом деле является "толстым указателем", структурой, содержащей как указатель на исполняемый код, так и другой указатель на данные. Однако в x86 указатель на функцию является просто указателем.

Теперь, когда C# имеет локальные функции, ката кодирования игры в боулинг можно элегантно решить с помощью батута:

using System.Collections.Generic;
using System.Linq;

class Game
{
    internal static int RollMany(params int[] rs) 
    {
        return Trampoline(1, 0, rs.ToList());

        int Trampoline(int frame, int rsf, IEnumerable<int> rs) =>
              frame == 11             ? rsf
            : rs.Count() == 0         ? rsf
            : rs.First() == 10        ? Trampoline(frame + 1, rsf + rs.Take(3).Sum(), rs.Skip(1))
            : rs.Take(2).Sum() == 10  ? Trampoline(frame + 1, rsf + rs.Take(3).Sum(), rs.Skip(2))
            :                           Trampoline(frame + 1, rsf + rs.Take(2).Sum(), rs.Skip(2));
    }
}

Метод Game.RollMany вызывается с количеством бросков: обычно 20 бросков, если нет запасных частей или ударов.

Первая строка сразу вызывает функцию батута: return Trampoline(1, 0, rs.ToList());. Эта локальная функция рекурсивно просматривает массив rolls. Локальная функция (батут) позволяет начать обход с двух дополнительных значений: начать сframe 1 и rsf (результат пока) 0.

Внутри локальной функции есть тернарный оператор, который обрабатывает пять случаев:

  • Игра заканчивается на кадре 11: вернуть результат на данный момент
  • Игра заканчивается, если бросков больше нет: вернуть результат на данный момент
  • Strike: подсчитать количество кадров и продолжить обход
  • Запасной: вычислить оценку кадра и продолжить обход
  • Нормальная оценка: вычислить оценку кадра и продолжить обход

Чтобы продолжить обход, снова вызовите батут, но теперь с обновленными значениями.

Для получения дополнительной информации выполните поиск по запросу "аккумулятор хвостовой рекурсии ". Имейте в виду, что компилятор не оптимизирует хвостовую рекурсию. Каким бы элегантным ни было это решение, оно, скорее всего, не будет голодным.

Для C батут будет указателем на функцию:

size_t (*trampoline_example)(const char *, const char *);
trampoline_example= strcspn;
size_t result_1= trampoline_example("xyzbxz", "abc");

trampoline_example= strspn;
size_t result_2= trampoline_example("xyzbxz", "abc");

Редактировать: больше эзотерических батутов будет неявно сгенерировано компилятором. Одним из таких применений будет таблица прыжков. (Хотя есть и более сложные из них, чем дальше вы начинаете пытаться генерировать сложный код.)

typedef void* (*state_type)(void);
void* state1();
void* state2();
void* state1() {
  return state2;
}
void* state2() {
  return state1;
}
// ...
state_type state = state1;
while (1) {
  state = state();
}
// ...
Другие вопросы по тегам