Связь между Java и Haskell
Я погуглил и получил несколько ответов, что связь между Java и Haskell может осуществляться с помощью GCJNI(теперь сайт не работает) и LambdaVM. Чтобы использовать LambdaVM/GCJNI, нужно ли мне загружать какие-либо инструменты для сборки? Где я могу узнать о них больше, так как я не нахожу много ресурсов в Интернете?
Я хочу разработать приложение, которое обменивается данными между Java и Haskell(где я получу входные данные от Java, передам его на Haskell, обработаю там и верну результат обратно в Java). Это то, что я хочу сделать. Пожалуйста, помогите мне...
4 ответа
Вызов Haskell из C выглядит довольно просто, и, следовательно, также может быть легко вызван из Java с помощью JavaCPP. Например, чтобы позвонить fibonacci_hs()
функция из примера кода Safe.hs
:
{-# LANGUAGE ForeignFunctionInterface #-}
module Safe where
import Foreign.C.Types
fibonacci :: Int -> Int
fibonacci n = fibs !! n
where fibs = 0 : 1 : zipWith (+) fibs (tail fibs)
fibonacci_hs :: CInt -> CInt
fibonacci_hs = fromIntegral . fibonacci . fromIntegral
foreign export ccall fibonacci_hs :: CInt -> CInt
мы можем сделать это таким образом из Java:
import org.bytedeco.javacpp.*;
import org.bytedeco.javacpp.annotation.*;
@Platform(include={"<HsFFI.h>","Safe_stub.h"})
public class Safe {
static { Loader.load(); }
public static native void hs_init(int[] argc, @Cast("char***") @ByPtrPtr PointerPointer argv);
public static native int fibonacci_hs(int i);
public static void main(String[] args) {
hs_init(null, null);
int i = fibonacci_hs(42);
System.out.println("Fibonacci: " + i);
}
}
Под Linux процедура компиляции выглядит следующим образом:
$ ghc -fPIC -dynamic -c -O Safe.hs
$ javac -cp javacpp.jar Safe.java
$ java -jar javacpp.jar -Dplatform.compiler=ghc -Dplatform.compiler.output="-optc-O3 -Wall Safe.o -dynamic -fPIC -shared -lstdc++ -lHSrts-ghc7.6.3 -o " -Dplatform.linkpath.prefix2="-optl -Wl,-rpath," Safe
И программа работает нормально с обычным java
команда:
$ java -cp javacpp.jar:. Safe
Fibonacci: 267914296
Изменить: я позволил себе сделать некоторые микробенчмаркинг вызова накладных расходов. Со следующим заголовочным файлом C
Safe.h
:inline int fibonacci_c(int n) {
return n < 2 ? n : fibonacci_c(n - 1) + fibonacci_c(n - 2);
}
следующий класс Java:
import org.bytedeco.javacpp.*;
import org.bytedeco.javacpp.annotation.*;
@Platform(include={"<HsFFI.h>","Safe_stub.h", "Safe.h"})
public class Safe {
static { Loader.load(); }
public static native void hs_init(int[] argc, @Cast("char***") @ByPtrPtr PointerPointer argv);
public static native int fibonacci_hs(int i);
public static native int fibonacci_c(int n);
public static int fibonacci(int n) {
return n < 2 ? n : fibonacci(n - 1) + fibonacci(n - 2);
}
public static void main(String[] args) {
hs_init(null, null);
for (int i = 0; i < 1000000; i++) {
fibonacci_hs(0);
fibonacci_c(0);
fibonacci(0);
}
long t1 = System.nanoTime();
for (int i = 0; i < 1000000; i++) {
fibonacci_hs(0);
}
long t2 = System.nanoTime();
for (int i = 0; i < 1000000; i++) {
fibonacci_c(0);
}
long t3 = System.nanoTime();
for (int i = 0; i < 1000000; i++) {
fibonacci(0);
}
long t4 = System.nanoTime();
System.out.println("fibonacci_hs(0): " + (t2 - t1)/1000000 + " ns");
System.out.println("fibonacci_c(0): " + (t3 - t2)/1000000 + " ns");
System.out.println("fibonacci(0): " + (t4 - t3)/1000000 + " ns");
}
}
выводит это с процессором Intel Core i7-3632QM @ 2,20 ГГц, Fedora 20 x86_64, GCC 4.8.3, GHC 7.6.3 и OpenJDK 8:
fibonacci_hs(0): 200 ns
fibonacci_c(0): 9 ns
fibonacci(0): 2 ns
Справедливости ради стоит отметить, что заходить в JVM тоже довольно дорого...
Обновление: с недавними изменениями в JavaCPP пользователи теперь могут получить доступ к функции обратного вызова (указатели) по имени из C/C++, что позволяет легко вызывать JVM из Haskell. Например, на основе информации, найденной на вики-странице относительно FFI Haskell, со следующим кодом, размещенным в
Main.hs
:{-# LANGUAGE ForeignFunctionInterface #-}
module Main where
import Foreign.C -- get the C types
import Foreign.Ptr (Ptr,nullPtr)
-- impure function
foreign import ccall "JavaCPP_init" c_javacpp_init :: CInt -> Ptr (Ptr CString) -> IO ()
javacpp_init :: IO ()
javacpp_init = c_javacpp_init 0 nullPtr
-- pure function
foreign import ccall "fibonacci" c_fibonacci :: CInt -> CInt
fibonacci :: Int -> Int
fibonacci i = fromIntegral (c_fibonacci (fromIntegral i))
main = do
javacpp_init
print $ fibonacci 42
и fibonacci
функция, определенная в Java следующим образом:
import org.bytedeco.javacpp.*;
import org.bytedeco.javacpp.annotation.*;
@Platform
public class Main {
public static class Fibonacci extends FunctionPointer {
public @Name("fibonacci") int call(int n) {
return n < 2 ? n : call(n - 1) + call(n - 2);
}
}
}
мы можем собрать под Linux x86_64 что-то вроде:
$ javac -cp javacpp.jar Main.java
$ java -jar javacpp.jar Main -header
$ ghc --make Main.hs linux-x86_64/libjniMain.so
и программа выполняется правильно, выдавая такой вывод:
$ ./Main
267914296
Если вы выберете подход на сервере Haskell, вы можете использовать библиотеку MessagePack serialization / rpc. У него есть привязки как для Java, так и для Haskell, и привязки на Haskell, похоже, хорошо поддерживаются. Ищите msgpack и msgpack-rpc в Hackage.
Вот забавный пример взаимодействия Java/Haskell с использованием MessagePack: Java-сервер, клиент Haskell (ссылки идут на GitHub). Общение в противоположном направлении от того, что вы хотите, хотя.
Это зависит от того, как вы хотите, чтобы они общались. Иметь код Java и Haskell, работающий изначально в одном и том же процессе и обменивающийся данными в памяти через их соответствующие FFI, - огромная проблема, не в последнюю очередь потому, что у вас есть два GC, борющихся за данные, и два компилятора, каждый из которых имеет свои собственные идеи представления различные типы данных. Скомпилировать Haskell под JVM также сложно, потому что у JVM (в настоящее время) нет концепции замыканий.
Конечно, это можно сделать, но переход от демонстратора к промышленному инструменту требует огромных усилий. Насколько я понимаю, инструменты, о которых вы говорите, никогда не выходили за рамки демонстрации.
Более простое, хотя и менее изящное решение - написать программу на Haskell в виде серверного процесса, который отправляет данные через сокеты из Java. Если производительность и объем не слишком высоки, то кодирование в JSON, вероятно, будет простым, поскольку обе стороны имеют библиотеки для его поддержки.
TL;DR: использовать шаблон передачи сообщений (т. Е. Клиент-сервер RPC или одноранговые узлы).
Зачем? Это безопаснее, масштабируемо, гибко и отлаживаемо. Вызов в FFI будет хрупким и сложным для тестирования.
Основы / спецификации RPC
gRPC Публичная ветка Google Protobufs RPC через HTTP/2
msgpack-rpc Не включает транспорт.
zerorpc ZeroMQ + msgpack. Имеет только реализации Python и Node. Кажется, заброшенный тоже.
XML-RPC зрелый. Широкая совместимость, но это также XML.
JSON-RPC Легче отлаживать. Не бинарный протокол, хотя BSON может взломать некоторые библиотеки.
Сериализация
Буферы протокола (protobufs) Существует много, гораздо больше инструментов для этого, чем другие. Он поддерживает версионные / необязательные элементы данных, которые не требуют перекомпиляции (или разрушения) мира для взаимодействия.
msgpack Симпатичный, простой и эффективный, но не поддерживающий совместимые изменения схемы. Это просто тупой двоичный кодек. Вероятно, слишком простой и низкоуровневый для практического использования.
Транспорты
ZeroMQ Вероятно, самый быстрый, не Infiniband/FC/10 GbE, не потокобезопасный транспорт сообщений.
Nanomsg Новая, поточно- ориентированная, переосмысленная философия UNIX ZeroMQ от одного из ее основателей.
HTTP/2 (используется gRPC) Преимущество здесь в том, что это стандарт, который работает внутри и между центрами обработки данных, а также имеет TLS (нативный код gRPC использует BoringSSL, "более безопасный" разворот OpenSSL от Google).
MQTT Когда вам нужно реализовать push-уведомления для миллиарда устройств и использовать удобочитаемый протокол.