CURL в PHP для вызова сервера Tika с удаленным файлом
Я застрял с этим довольно давно. Я хочу проанализировать PDF в текст, используя Tika, размещенную на внешнем сервере, выделенном для этого. Он должен работать с любым удаленным URL-адресом в формате pdf и любым сервером Tika (в настоящее время с помощью этого бесплатного теста настроен какой-то удивительный парень).
В любом случае, эта команда отлично работает в командной строке, но не смогла перевести ее на PHP, я хочу иметь возможность получить полученный текст и сохранить его в db, и, скорее всего, не нужно использовать exec().
curl "https://rifed-alfgago.c9users.io/wp-content/uploads/2017/06/demopdf.pdf" | curl -X PUT -T http://beta.offenedaten.de:9998/tika
Это то, что я до сих пор в PHP, но он не работает и не могу найти причину почему:
$fileurl = "https://rifed-alfgago.c9users.io/wp-content/uploads/2017/06/demopdf.pdf";
$file = fopen($fileurl, 'r');
$url = "http://beta.offenedaten.de:9998/tika";
$ch = curl_init();
$options = array(
CURLOPT_URL => $url,
CURLOPT_CUSTOMREQUEST => "PUT",
CURLOPT_RETURNTRANSFER => 1,
CURLOPT_HEADER => 1,
CURLOPT_CONNECTTIMEOUT => 120,
CURLOPT_TIMEOUT => 120,
CURLOPT_MAXREDIRS => 10,
CURLOPT_INFILE => $file
);
curl_setopt_array( $ch, $options );
$response = curl_exec($ch);
$httpCode = curl_getinfo($ch, CURLINFO_HTTP_CODE);
echo "<pre>".htmlspecialchars($response)."</pre>";
curl_close ($ch);
Заранее благодарю