не стабильная работа платформ, AppEngin
Добавлено: Ср янв 08, 2020 4:17 pm
Доброго времени суток.
на двух серверах по два AppEngin, с дублированием на друг дружку. хаотично платформы переходят состояние OffScan, AppEnginы перебрасываются с основного на резервный, переходят в OffScan, останавливаются...помогает ручной запуск и перевод в OnScan или перезапуск платформ.
в логах ОС попадаются следующие ошибки:
Faulting application name: aahClientAccessPoint.exe, version: 2014.1210.9660.3, time stamp: 0x596f2255
Faulting module name: MSVCR110.dll, version: 11.0.51106.1, time stamp: 0x5098858e
Exception code: 0xc0000409
Fault offset: 0x000a326c
Faulting process id: 0x2f04
Faulting application start time: 0x01d5c5b365642a78
Faulting application path: C:\Program Files (x86)\Common Files\ArchestrA\aahClientAccessPoint.exe
Faulting module path: C:\Windows\SYSTEM32\MSVCR110.dll
Report Id: 68eaca89-31e5-11ea-8111-00155d210aed
Faulting package full name:
Faulting package-relative application ID:
в логах SMC:
This process failed to send heartbeat and it exceeds maximum WatchdogFault.. This process will be restarted.
Pid:14376 Path:C:\Program Files (x86)\ArchestrA\Framework\Bin\aaEngine.exe Cmd:CheckpointPath=,ClsId={BE4A11B6-86C2-49C6-883E-ABA501A6BCC7},Deploy=False,EngineId=5,EngineName=XXEngine_1,EngineSignature=0,PartnerPMCAddress=XXXXX,PartnerPMCPort=30000,PartnerPlatformId=3,PartnerRMCAddress=XXX.XXX.XXX.XXX,PartnerRMCPort=30001,PlatformId=9,RedundancyIdentity=1,Restart=True,RestartOnStandbyTransition=true,ScanState=Last,TimeToDiscoverPartner=15000 Ctrl:-win
SetEngineStatus - XXXEngine was terminated abnormally.
ProcessNotifyStateChanged - engineInfo.processstatus 4 engineInfo.enginestate 2
Local Engine mesengine_tof (5) has been stuck in 'Standby_NotReady' for more than 120 seconds and will be shutdown and auto-restarted.
AS2014 R2 SP1, Win srv 2012 standart.
Подозрение на то что не хватает времени для сканирования у AppEngin, scanstate стоит 1000.
на двух серверах по два AppEngin, с дублированием на друг дружку. хаотично платформы переходят состояние OffScan, AppEnginы перебрасываются с основного на резервный, переходят в OffScan, останавливаются...помогает ручной запуск и перевод в OnScan или перезапуск платформ.
в логах ОС попадаются следующие ошибки:
Faulting application name: aahClientAccessPoint.exe, version: 2014.1210.9660.3, time stamp: 0x596f2255
Faulting module name: MSVCR110.dll, version: 11.0.51106.1, time stamp: 0x5098858e
Exception code: 0xc0000409
Fault offset: 0x000a326c
Faulting process id: 0x2f04
Faulting application start time: 0x01d5c5b365642a78
Faulting application path: C:\Program Files (x86)\Common Files\ArchestrA\aahClientAccessPoint.exe
Faulting module path: C:\Windows\SYSTEM32\MSVCR110.dll
Report Id: 68eaca89-31e5-11ea-8111-00155d210aed
Faulting package full name:
Faulting package-relative application ID:
в логах SMC:
This process failed to send heartbeat and it exceeds maximum WatchdogFault.. This process will be restarted.
Pid:14376 Path:C:\Program Files (x86)\ArchestrA\Framework\Bin\aaEngine.exe Cmd:CheckpointPath=,ClsId={BE4A11B6-86C2-49C6-883E-ABA501A6BCC7},Deploy=False,EngineId=5,EngineName=XXEngine_1,EngineSignature=0,PartnerPMCAddress=XXXXX,PartnerPMCPort=30000,PartnerPlatformId=3,PartnerRMCAddress=XXX.XXX.XXX.XXX,PartnerRMCPort=30001,PlatformId=9,RedundancyIdentity=1,Restart=True,RestartOnStandbyTransition=true,ScanState=Last,TimeToDiscoverPartner=15000 Ctrl:-win
SetEngineStatus - XXXEngine was terminated abnormally.
ProcessNotifyStateChanged - engineInfo.processstatus 4 engineInfo.enginestate 2
Local Engine mesengine_tof (5) has been stuck in 'Standby_NotReady' for more than 120 seconds and will be shutdown and auto-restarted.
AS2014 R2 SP1, Win srv 2012 standart.
Подозрение на то что не хватает времени для сканирования у AppEngin, scanstate стоит 1000.