Для схемы: gs не настроена система AbstractFileSystem.
Я получаю ошибку ниже при выполнении задания гоблина. Мой core-site.xml выглядит нормально и имеет необходимое значение.
core-site.xml
<property>
<name>fs.AbstractFileSystem.gs.impl</name>
<value>com.google.cloud.hadoop.fs.gcs.GoogleHadoopFS</value>
<description>The AbstractFileSystem for 'gs:' URIs.</description>
</property>
Ошибка
org.apache.gobblin.runtime.ForkException: Fork branches [0] failed for task task_toGCPHIVE_1639057335724_14
<Fork 0>
java.lang.RuntimeException: Error creating writer
at org.apache.gobblin.writer.PartitionedDataWriter$4.get(PartitionedDataWriter.java:214)
at org.apache.gobblin.writer.PartitionedDataWriter$4.get(PartitionedDataWriter.java:207)
at org.apache.gobblin.writer.CloseOnFlushWriterWrapper.<init>(CloseOnFlushWriterWrapper.java:73)
at org.apache.gobblin.writer.PartitionedDataWriter.<init>(PartitionedDataWriter.java:206)
at org.apache.gobblin.runtime.fork.Fork.buildWriter(Fork.java:562)
at org.apache.gobblin.runtime.fork.Fork.buildWriterIfNotPresent(Fork.java:570)
at org.apache.gobblin.runtime.fork.Fork.processRecord(Fork.java:516)
at org.apache.gobblin.runtime.fork.AsynchronousFork.processRecord(AsynchronousFork.java:103)
at org.apache.gobblin.runtime.fork.AsynchronousFork.processRecords(AsynchronousFork.java:86)
at org.apache.gobblin.runtime.fork.Fork.run(Fork.java:250)
at org.apache.gobblin.util.executors.MDCPropagatingRunnable.run(MDCPropagatingRunnable.java:39)
at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:511)
at com.google.common.util.concurrent.TrustedListenableFutureTask$TrustedFutureInterruptibleTask.runInterruptibly(TrustedListenableFutureTask.java:111)
at com.google.common.util.concurrent.InterruptibleTask.run(InterruptibleTask.java:58)
at com.google.common.util.concurrent.TrustedListenableFutureTask.run(TrustedListenableFutureTask.java:75)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
at java.lang.Thread.run(Thread.java:748)
Caused by: org.apache.hadoop.fs.UnsupportedFileSystemException: fs.AbstractFileSystem.gs.impl=null: No AbstractFileSystem configured for scheme: gs
at org.apache.hadoop.fs.AbstractFileSystem.createFileSystem(AbstractFileSystem.java:160)
Я могу без проблем запускать команды GS в командной строке. Для Ex:
hadoop fs -ls gs://<<bucketName>>
производит требуемый вывод.
Любая помощь будет оценена.
1 ответ
Есть 2 возможных решения, если при использовании Scala, pyspark и/или SPARK приходится возиться с core-site.xml.
Первый связан с тем, как исправить «Нет файловой системы для схемы: gs» в pyspark?Нет файловой системы для схемы: gs
и второй: Нет файловой системы для схемы: gs" при локальном запуске задания spark Нет файловой системы для схемы
Наконец, это также может быть проблема с соединителем облачного хранилища, я предлагаю просмотреть следующий документ, чтобы убедиться, что ваши настройки были применены правильно.Коннектор облачного хранилища .