Автономная сервисная фабрика - AWS - FileStoreService - Сбой Copy-ServiceFabricApplicationPackage

У меня есть 3-х узловая автономная установка Windows Service Fabric в AWS. Сценарии TestConfiguration и CreateCluster выполняются успешно, однако при попытке развертывания любых приложений в кластере я получаю следующую ошибку от powershell.

Copy-ServiceFabricApplicationPackage -ApplicationPackagePath .\pkg\<packagename> -ImageStoreConnectionString fabric:ImageStore

Copy-ServiceFabricApplicationPackage : An error occurred during this operation.  Please check the trace logs for more
details.
At line:1 char:1
+ Copy-ServiceFabricApplicationPackage -ApplicationPackagePath .\pkg\ ...
+ ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
    + CategoryInfo          : InvalidOperation: (:) [Copy-ServiceFabricApplicationPackage], FabricException
    + FullyQualifiedErrorId : CopyApplicationPackageErrorId,Microsoft.ServiceFabric.Powershell.CopyApplicationPackage

Не уверен, какие журналы трассировки будут полезны при диагностике ошибки, однако при проверке журнала событий Windows на одном из узлов я вижу следующие ошибки, все для FileStoreService.

ImpersonateAndCopyFile for SourcePath:\\<ipaddress>\StoreShare_Node3\131601795137630192\6.0.232.9494_0\131601794828730764_8589934592_1.ClusterManifest.xml, DestinationPath:C:\ProgramData\SF\Node1\Fabric\work\Applications\__FabricSystem_App4294967295\work\Store\131601795317314061\6.0.232.9494_0\131601794828730764_8589934592_1.ClusterManifest.xml failed: 0x8007052e. Have tried all access tokens.


CopyFile: SourcePath:\\<ip address>\StoreShare_Node3\131601795137630192\6.0.232.9494_0\131601794828730764_8589934592_1.ClusterManifest.xml, DestinationPath:C:\ProgramData\SF\Node1\Fabric\work\Applications\__FabricSystem_App4294967295\work\Store\131601795317314061\6.0.232.9494_0\131601794828730764_8589934592_1.ClusterManifest.xml, Error:0x8007052e, ElapsedTime:80


CopyFile: no new token is found. current token count: 2

Есть идеи, что это может быть? Я воссоздал новый кластер без защиты, в брандмауэре все порты открыты как в AWS, так и на компьютерах узлов (пытаясь удалить все, что может блокировать копирование). В AWS я использую SimpleAD, поэтому все узлы работают с одним и тем же администратором AD и могут связываться для создания кластера.

Ниже приведена конфигурация кластера, которую я использую, она была настолько простой, насколько я мог, чтобы попытаться ограничить причины проблем.

Любая помощь в диагностике проблем с файлами копий или даже указание мне на соответствующие журналы трассировки было бы здорово.

Кроме того, я заметил, что ImageStoreService показывает предупреждения в Service Fabric Explorer

Unhealthy event: SourceId='System.FM', Property='State', HealthState='Warning', ConsiderWarningAsError=false.
Partition reconfiguration is taking longer than expected.
ImageStoreService 3 3 00000000-0000-0000-0000-000000003000
   P/P Ready Node3 131601795137630192
   S/S InBuild Node1 131601795317314061
   S/S InBuild Node2 131601795317314062   
(Showing 3 out of 3 replicas. Total available replicas: 1)  

РЕДАКТИРОВАТЬ
Дополнительная информация

После более подробного изучения проблемы я запустил Copy-ServiceFabricApplicationPackage с флагом -Debug, и теперь он выдает следующую ошибку, предлагая имя пользователя или пароль, используемые либо для загрузки пакета с моего компьютера в кластер, либо для кластера для распространения узла к узлу неверно. Я предполагаю, что для узла к узлу он использует локальные учетные записи, которые он создает, заканчивая в fffff, для которого я не знаю, почему это будет создавать недопустимые учетные данные пользователя. Если это между компьютером, загружающим пакет и кластером, то в настоящее время я работаю без включенной защиты, поэтому не знаю, почему это будет проблемой?? Любая помощь высоко ценится.

Copy-ServiceFabricApplicationPackage -ApplicationPackagePath ..\pkg\Release -ImageStoreConnectionString fabric:imagestore -Debug
VERBOSE: System.Fabric.FabricException: An error occurred during this operation.  Please check the trace logs for more details. ---> System.Runtime.InteropServices.COMException: The user name or password is incorrect. (Exception from HRESULT: 0x8007052E)

Спасибо

{
    "name": "SampleCluster",
    "clusterConfigurationVersion": "1.0.0",
    "apiVersion": "08-2017",
    "nodes": [
      {
        "nodeName": "Node1",
        "iPAddress": "<node 1 internal ip address>",
        "nodeTypeRef": "StandardNodeType",
        "faultDomain": "fd:/0",
        "upgradeDomain": "UD0"
      },
      {
        "nodeName": "Node2",
        "iPAddress": "<node 2 internal ip address>",
        "nodeTypeRef": "StandardNodeType",
        "faultDomain": "fd:/1",
        "upgradeDomain": "UD1"
      },
      {
        "nodeName": "Node3",
        "iPAddress": "<node 3 internal ip address>",
        "nodeTypeRef": "StandardNodeType",
        "faultDomain": "fd:/2",
        "upgradeDomain": "UD2"
      }
    ],
    "properties": {
        "diagnosticsStore": {
            "metadata":  "Please replace the diagnostics store with an actual file share accessible from all cluster machines.",
            "dataDeletionAgeInDays": "7",
            "storeType": "FileShare",
            "IsEncrypted": "false",
            "connectionstring": "c:\\ProgramData\\SF\\DiagnosticsStore"
        },
        "nodeTypes": [
          {
            "name": "StandardNodeType",
            "clientConnectionEndpointPort": "19000",
            "clusterConnectionEndpointPort": "19001",
            "leaseDriverEndpointPort": "19002",
            "serviceConnectionEndpointPort": "19003",
            "httpGatewayEndpointPort": "19080",
            "reverseProxyEndpointPort": "19081",
            "applicationPorts": {
                "startPort": "20000",
                "endPort": "30000"
            },
            "ephemeralPorts": {
                "startPort": "49152",
                "endPort": "65534"
            },
            "isPrimary": true
          }
        ],
        "fabricSettings": [
            {
                "name": "Setup",
                "parameters": [
                    {
                        "name": "FabricDataRoot",
                        "value": "C:\\ProgramData\\SF"
                    },
                    {
                        "name": "FabricLogRoot",
                        "value": "C:\\ProgramData\\SF\\Log"
                    }
                ]
            }
        ],
        "addOnFeatures": [
            "DnsService",
            "RepairManager"
        ]
    }
}

1 ответ

Решение

После более подробного изучения я обнаружил, что это связано с неправильным включением общего доступа к файлам на окнах. Хотя показано, как включено в свойствах сетевого адаптера. Мне не удалось понять, какие параметры необходимо было включить в разделе "Дополнительные параметры общего доступа" (Панель управления \ Сеть и Интернет \ Центр управления сетями и общим доступом \ Дополнительные параметры общего доступа).

Другие вопросы по тегам