Ошибка FSCrawler при сканировании E:\TestFilesToBeIndexed\subfolder: java.net.ConnectException: время ожидания подключения истекло: подключение
Ошибка при сканировании пути \ к \file_folder: java.net.ConnectException: время ожидания подключения истекло: подключение
Я пытаюсь загрузить файлы удаленного сервера с помощью FSCrawler в существующий индекс Elasticserach(который находится на моем локальном компьютере), но получаю исключение выше.
Ниже представлен файл _settings.yml FSCrawler:
---
name: "index_in_es_onefsc"
server:
hostname: "machinename.abc.com"
port: 22
username: "username"
password: "password@20"
protocol: "ssh"
fs:
url: "E:\\TestFilesToBeIndexed"
update_rate: "15m"
excludes:
- "*/~*"
json_support: false
filename_as_id: false
add_filesize: true
remove_deleted: true
add_as_inner_object: false
store_source: false
index_content: true
attributes_support: false
raw_metadata: false
xml_support: false
index_folders: true
lang_detect: false
continue_on_error: false
ocr:
language: "eng"
enabled: true
pdf_strategy: "ocr_and_text"
follow_symlinks: false
elasticsearch:
nodes:
- url: "http://127.0.0.1:9200"
bulk_size: 100
flush_interval: "5s"
byte_size: "10mb"
1 ответ
В документации говорится, что в Windows при выполнении SSH с и на машину Windows вы должны использовать следующую форму:
Я думаю, что в Windows нужно использовать:
name: "index_in_es_onefsc"
fs:
url: "/E:/TestFilesToBeIndexed"
server:
hostname: "machinename.abc.com"
port: 22
username: "username"
password: "password@20"
protocol: "ssh"
Обратите внимание, что при запуске FSCrawler с компьютера Windows существует известная проблема. Это было исправлено, но если вы используете более старую версию SNAPSHOT, чем та, которая была опубликована 26 июня, вам, скорее всего, потребуется обновление.