Уважаемые дамы и господа! Для вас сохранен старый форум по адресу http://forum.intersyst.ru

Страницы: 1
RSS
CPU7-2 Standby перегружается
 
Есть OXE, два CPU7-2  - main и standby.  Main  Rel. 12.3  и работает нормально, подготовили другой CPU7-2 Standby c 12.3 , включаем и он ходит по кругу,  без IO2N запускается.  Без телефонии тоже запускается.  Кланирование не помогло.   Часть лога загрузки  standby   CPU такой:

"(002375:000022:03069)  mutex release on dis25 exception
05/09/19 19:15:20 000001I|000/28/-/---|=4:0260=Beginning of downloading tonesnv
(002392:000023:02965) IO2:Driver synchronized (wd_val=0x6827)
05/09/19 19:15:21 000001I|000/28/-/---|=5:0261=End of downloading tonesnv
(002402:000024:02548) IO2N:Driver IO2N recognized
ioctl cmd UART_OFF
0
IOREVEIL Start
IOREVEIL Init
cls_debug(Pid 3222)
**  CALL_LOG_SERVER Initialising Remanents **
DATE: 09/05/19 TIME: 19:16:03
sip: Ethernet link is used for copy
sip: role is standby, registrar copy
rcp: /tmpd/localize.sip: No such file or directory
Command "REGISTRAR" (pid 3213) exited with status 1.
ioctl cmd UART_OFF
(002935:000025:0ioctl cmd UART_OFF
2548) IO2_DRIVER_STOPPED event on boot reset
(002935:000026:02844) IO2N:driver not ready !!!
Problem in mailsys : see /DHS3dyn/incid/incpbm file
Problem in mailsys : see /DHS3dyn/incid/incpbm file
Problem in mailsys : see /DHS3dyn/incid/incpbm file
Problem in mailsys : see /DHS3dyn/incid/incpbm file
05/09/19 19:16:15 000001S|000/21/-/---|=1:2456=Reboot CPU after 2 problem (IO2)

INIT: Switching to runlevel: 6
INIT: Shutting down TEL services :  (002945:000027:0ioctl cmd UART_OFF
2548) IO1 driver: read bad IO1 flag value: 0x0012
(002945:000028:02548) IO1 driver: read bad IO1 flag value: 0x0012
(002945:000029:02548) IO1 driver: lost IO1 board (IO1-flag: 0x0012) !!!
(002945:000030:02909) Stop all
(002945:000031:02909) SUPERVISOR -- Supervisor_Number=1605 Param0=18 Param1=-1 Param2=-1 Param3=-1

(002945:000032:02909) SUPERVISOR --  Stops the applicative actor

(002945:000033:02909) monitel saves blackbox state at shutdown time
05/09/19 19:16:16 000001S|---/--/-/---|=1:1605=Loss of the IO1 board, value of the 18 flags
Thu Sep  5 19:16:16 EEST 2019


05/09/19 19:16:17 000001S|---/--/-/---|=1:2077=CPU was halted due to a shutdown
sh: line 0: kill: (3295) - No such process
Not found: rainbowagent.configPath
RainbowAgentMain::killProcess(): 3295

Command "IP_LINK" (pid 3008) exited with status 1.
Command "RAINBOWAGENTSTOP" (pid 3275) exited with status 70.
(002985:000034:03069) ***************************
(002985:000035:03069) ** ACTOR DIS25 SHUTDOWN **
(002985:000036:03069) ***************************
(002985:000037:03069)  Thread Appli shutdown
(002985:000038:03069)  Thread IPrcv shutdown
(002985:000039:03069)  Thread fluxIP shutdown
(002985:000040:03069)  Thread AckIP shutdown
(002985:000041:03069)  Thread FipTR shutdown
(002985:000042:03069)   Thread FipRC shutdown
(002985:000043:03069)  Thread FipAG shutdown
(002985:000044:03069)  Thread Dis25 shutdown
(002985:000045:03302) ***************************
(002985:000046:03302) **  DEMANDE DE STOP X25  **
(002985:000047:03302) ***************************
stop of abca 2
Waiting for (initial) shutdown-applications to stop ...
(003045:000048:03048)  
(003045:000049:03048) ***************************
(003045:000050:03048) ** ACTOR MON25 SHUTDOWN **
(003045:000051:03048) ***************************
All (initial) shutdown-applications exited.
05/09/19 19:16:27 000001S|---/--/-/---|=0:2663=IPC Chorus err: appli BROADCAST oper 18 err 15
pbmd:PB_Mem_Add_Entry Error=-8 on entry:
pbmd:Name=, FName=, Mcdu=7161, Abr=-1 NameIdx=0
pbmd:PB_Mem_Add_Entry Error=-8 on entry:
pbmd:Name=, FName=, Mcdu=7382, Abr=-1 NameIdx=0
main_signal_handler sig=15
Terminating process ...
pbmd exits.
main_signal_handler sig=15
Terminating process ...
terminate_main
pbmd exits.
Command "CMISD" (pid 2824) exited with status 15.
Command "GWLINUX" (pid 2854) received fatal signal 15.
Command "BTLINK" (pid 3009) received fatal signal 15.
Command "IBS_DOWNLOAD" (pid 3056) received fatal signal 15.
Command "ML_SERV" (pid 3057) received fatal signal 15.
Command "TIMED" (pid 3092) received fatal signal 9.
Command "EACCSRV" (pid 3129) received fatal signal 9.
Command "BROADCAST" (pid 3174) exited with status 255.
Command "EVENTMON" (pid 3175) received fatal signal 9.
Command "IOREVEIL" (pid 3176) received fatal signal 15.
Command "ANNU_PROCESS" (pid 3180) received fatal signal 15.
Command "CALL_LOG_SRVR" (pid 3211) exited with status 1.
Problem in mailsys : see /DHS3dyn/incid/incpbm file
05/09/19 19:16:27 000001S|---/--/-/---|=3:4076=PBM : signal 15 caught
05/09/19 19:16:27 000001S|---/--/-/---|=3:4076=PBM : signal 15 caught
05/09/19 19:16:27 000001S|---/--/-/---|=3:4019=CSTA server : 3840 exit
Command "SERV_APPLI" (pid 2949) exited with status 15.
Command "FLEX_AGENT" (pid 3130) received fatal signal 9.
Command "CLOUDCONNECT" (pid 3131) exited with status 63.
Command "PBMD" (pid 3177) exited with status 15.
Command "UTF8_PBMD" (pid 3178) exited with status 15.
Command "CSTAMONO" (pid 3181) exited with status 15.
Command "MAIN_AFE" (pid 3205) received fatal signal 9.
05/09/19 19:16:29 000001S|---/--/-/---|=2:0275=ACCOUNTING: Appli PRINTING : feature incident 20 15
05/09/19 19:16:29 000001S|---/--/-/---|=0:2663=IPC Chorus err: appli SAVE oper 20 err 15
05/09/19 19:16:29 000001S|---/--/-/---|=0:2663=IPC Chorus err: appli ACC_ETH oper 20 err 15
05/09/19 19:16:29 000001S|---/--/-/---|=2:0275=ACCOUNTING: Appli ASCII : feature incident 20 15
05/09/19 19:16:29 000001S|---/--/-/---|=2:0275=ACCOUNTING: Appli ACCOUNTING : feature incident 20 15
--> ACCOUNTING     0 tickets stored in database

Command "INTERNAL_TAX" (pid 3128) exited with status 159.
Waiting for applications to stop ...
Command "V24_CONFIG" (pid 3179) exited with status 15"
 
Какие-то проблемы с IO2N (05/09/19 19:16:15 000001S|000/21/-/---|=1:2456=Reboot CPU after 2 problem (IO2)). Плохо воткнули - плату, разъем на передней панели...
 
Несколько раз вынимали и ставили обратно CPU и  IO2N , разъем тоже переставляли -  ничего не изменилось. Осталось взять CPU и  IO2N и установить в лабораторный АСТ, после этого она загрузиться(есть надежда), но это не решит проблему
 
Вопрос - насколько можно экспериментировать со станцией. Поменяйте между собой две IO2N (с соединительными платами). Глянете - перейдет ли неисправность.
 
Патчи от 12.3 - одинаковые, лили с одного дистрибутива? Встречал случаи забавных проблем, когда "криво" вставал софт (если ставили с битого дистрибутива).
 
Заливали ПО с одного дистрибутива и по одинаковой процедуре с помощью  PC installer 5.6.  Main CPU с IO2N  работает, а вот  stanby  не хочет.  Менять платы и т.п. с перерывом связи проблематично, причем в любое время.
Есть вариант откатиться назад до 11 релиза
 
в качестве гипотезы и проверок на тестовом АСТ попробовать стартовать процессор RUNTEL -DNOIO2 и конечно в тестовом кристалле надо чтобы была хотя бы одна плата UA или Z
У Дарта Вейдера в столе всякого навалено: карты разные галактик и портрет Гагарина.
 
были случаи
- cpu7-2 с платой IO2N при старте телефонии идет в перезагрузку, т.е. говорит что IO2N нет, хотя без IO2N запускается нормально и работает
- cpu7-2 при включении в консоле говорит что IO2N - present хотя платы нет, в этом случае такой cpu годится только для заливки софта, телефония не запускается и уходит в перезагрузку независимо от того стоит IO2N или нет

дурацский вопрос - OXE 12.3 разве в Россию поставляется?
Пути IP-пакета неисповедимы
 
В тестовом кристалле с  RUNTEL -DNOIO2  CPU  запускается, запускается CPU  и в рабочем кристалле(после RUNTEL -DNOIO2) , без   RUNTEL -DNOIO2  он грузится, определяется что он  standby  и сразу уходит в рестарт.

"- cpu7-2 с платой IO2N при старте телефонии идет в перезагрузку, т.е. говорит что IO2N нет, хотя без IO2N запускается нормально и работает" - это как раз тот сценарий, правда нормально он работает или нет не определял. OXE рабочая и отключать не дают. Есть мысль перегрузить всю систему и посмотреть результат. Одно можно сказать определенно - все  завязано на IO2N
Изменено: Vlad 46 - 09.09.2019 09:29:28 (уточнения)
 
TC2585 ed.5,  параграф 10.3 прочтен и исполнен, как написано?
Так же там рекомендуется ознакомиться с TC0567 "Reboot of the CPU board after an inopportune shutdown of IO2N board."
 
Цитата
Username написал:
TC2585 ed.5,  параграф 10.3 прочтен и исполнен, как написано?
Так же там рекомендуется ознакомиться с TC0567 "Reboot of the CPU board after an inopportune shutdown of IO2N board."
По поводу TC2585 хорошая идея, он  исполнен, изменения внесены, но CPU после этого не перегружался. Планировалось перегрузить после ввода   CPU  standby.  Вот CPU standby  с изменениями перегружали много раз.  Т.е.  надо перезапустить всю систему, другого варианта пока не вижу.   С TC0567 знаком - что-то похожее, но не совсем.  
 
 
могу посоветовать взять хороший фонарик и посветить на разъемы CPU и IO на самом ACT очень-очень внимательно. Возможно загнулся/поломался штырек на плате.
 
Цитата
Vlad 46 написал:
Цитата
Username написал:
TC2585 ed.5,  параграф 10.3 прочтен и исполнен, как написано?
Так же там рекомендуется ознакомиться с TC0567 "Reboot of the CPU board after an inopportune shutdown of IO2N board."
По поводу TC2585 хорошая идея, он  исполнен, изменения внесены, но CPU после этого не перегружался.
Увы, там написано: "This management must be followed by a reboot of the installation".
Надо брать окно на полный рестарт.
 
Проблема решена путем  рестарта системы. Большое спасибо всем за подсказки и мысли  :)  
Страницы: 1