Автономная сервисная фабрика - AWS - FileStoreService - Сбой Copy-ServiceFabricApplicationPackage
У меня есть 3-х узловая автономная установка Windows Service Fabric в AWS. Сценарии TestConfiguration и CreateCluster выполняются успешно, однако при попытке развертывания любых приложений в кластере я получаю следующую ошибку от powershell.
Copy-ServiceFabricApplicationPackage -ApplicationPackagePath .\pkg\<packagename> -ImageStoreConnectionString fabric:ImageStore
Copy-ServiceFabricApplicationPackage : An error occurred during this operation. Please check the trace logs for more
details.
At line:1 char:1
+ Copy-ServiceFabricApplicationPackage -ApplicationPackagePath .\pkg\ ...
+ ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+ CategoryInfo : InvalidOperation: (:) [Copy-ServiceFabricApplicationPackage], FabricException
+ FullyQualifiedErrorId : CopyApplicationPackageErrorId,Microsoft.ServiceFabric.Powershell.CopyApplicationPackage
Не уверен, какие журналы трассировки будут полезны при диагностике ошибки, однако при проверке журнала событий Windows на одном из узлов я вижу следующие ошибки, все для FileStoreService.
ImpersonateAndCopyFile for SourcePath:\\<ipaddress>\StoreShare_Node3\131601795137630192\6.0.232.9494_0\131601794828730764_8589934592_1.ClusterManifest.xml, DestinationPath:C:\ProgramData\SF\Node1\Fabric\work\Applications\__FabricSystem_App4294967295\work\Store\131601795317314061\6.0.232.9494_0\131601794828730764_8589934592_1.ClusterManifest.xml failed: 0x8007052e. Have tried all access tokens.
CopyFile: SourcePath:\\<ip address>\StoreShare_Node3\131601795137630192\6.0.232.9494_0\131601794828730764_8589934592_1.ClusterManifest.xml, DestinationPath:C:\ProgramData\SF\Node1\Fabric\work\Applications\__FabricSystem_App4294967295\work\Store\131601795317314061\6.0.232.9494_0\131601794828730764_8589934592_1.ClusterManifest.xml, Error:0x8007052e, ElapsedTime:80
CopyFile: no new token is found. current token count: 2
Есть идеи, что это может быть? Я воссоздал новый кластер без защиты, в брандмауэре все порты открыты как в AWS, так и на компьютерах узлов (пытаясь удалить все, что может блокировать копирование). В AWS я использую SimpleAD, поэтому все узлы работают с одним и тем же администратором AD и могут связываться для создания кластера.
Ниже приведена конфигурация кластера, которую я использую, она была настолько простой, насколько я мог, чтобы попытаться ограничить причины проблем.
Любая помощь в диагностике проблем с файлами копий или даже указание мне на соответствующие журналы трассировки было бы здорово.
Кроме того, я заметил, что ImageStoreService показывает предупреждения в Service Fabric Explorer
Unhealthy event: SourceId='System.FM', Property='State', HealthState='Warning', ConsiderWarningAsError=false.
Partition reconfiguration is taking longer than expected.
ImageStoreService 3 3 00000000-0000-0000-0000-000000003000
P/P Ready Node3 131601795137630192
S/S InBuild Node1 131601795317314061
S/S InBuild Node2 131601795317314062
(Showing 3 out of 3 replicas. Total available replicas: 1)
РЕДАКТИРОВАТЬ
Дополнительная информация
После более подробного изучения проблемы я запустил Copy-ServiceFabricApplicationPackage с флагом -Debug, и теперь он выдает следующую ошибку, предлагая имя пользователя или пароль, используемые либо для загрузки пакета с моего компьютера в кластер, либо для кластера для распространения узла к узлу неверно. Я предполагаю, что для узла к узлу он использует локальные учетные записи, которые он создает, заканчивая в fffff, для которого я не знаю, почему это будет создавать недопустимые учетные данные пользователя. Если это между компьютером, загружающим пакет и кластером, то в настоящее время я работаю без включенной защиты, поэтому не знаю, почему это будет проблемой?? Любая помощь высоко ценится.
Copy-ServiceFabricApplicationPackage -ApplicationPackagePath ..\pkg\Release -ImageStoreConnectionString fabric:imagestore -Debug
VERBOSE: System.Fabric.FabricException: An error occurred during this operation. Please check the trace logs for more details. ---> System.Runtime.InteropServices.COMException: The user name or password is incorrect. (Exception from HRESULT: 0x8007052E)
Спасибо
{
"name": "SampleCluster",
"clusterConfigurationVersion": "1.0.0",
"apiVersion": "08-2017",
"nodes": [
{
"nodeName": "Node1",
"iPAddress": "<node 1 internal ip address>",
"nodeTypeRef": "StandardNodeType",
"faultDomain": "fd:/0",
"upgradeDomain": "UD0"
},
{
"nodeName": "Node2",
"iPAddress": "<node 2 internal ip address>",
"nodeTypeRef": "StandardNodeType",
"faultDomain": "fd:/1",
"upgradeDomain": "UD1"
},
{
"nodeName": "Node3",
"iPAddress": "<node 3 internal ip address>",
"nodeTypeRef": "StandardNodeType",
"faultDomain": "fd:/2",
"upgradeDomain": "UD2"
}
],
"properties": {
"diagnosticsStore": {
"metadata": "Please replace the diagnostics store with an actual file share accessible from all cluster machines.",
"dataDeletionAgeInDays": "7",
"storeType": "FileShare",
"IsEncrypted": "false",
"connectionstring": "c:\\ProgramData\\SF\\DiagnosticsStore"
},
"nodeTypes": [
{
"name": "StandardNodeType",
"clientConnectionEndpointPort": "19000",
"clusterConnectionEndpointPort": "19001",
"leaseDriverEndpointPort": "19002",
"serviceConnectionEndpointPort": "19003",
"httpGatewayEndpointPort": "19080",
"reverseProxyEndpointPort": "19081",
"applicationPorts": {
"startPort": "20000",
"endPort": "30000"
},
"ephemeralPorts": {
"startPort": "49152",
"endPort": "65534"
},
"isPrimary": true
}
],
"fabricSettings": [
{
"name": "Setup",
"parameters": [
{
"name": "FabricDataRoot",
"value": "C:\\ProgramData\\SF"
},
{
"name": "FabricLogRoot",
"value": "C:\\ProgramData\\SF\\Log"
}
]
}
],
"addOnFeatures": [
"DnsService",
"RepairManager"
]
}
}
1 ответ
После более подробного изучения я обнаружил, что это связано с неправильным включением общего доступа к файлам на окнах. Хотя показано, как включено в свойствах сетевого адаптера. Мне не удалось понять, какие параметры необходимо было включить в разделе "Дополнительные параметры общего доступа" (Панель управления \ Сеть и Интернет \ Центр управления сетями и общим доступом \ Дополнительные параметры общего доступа).