【導(dǎo)讀】在工程實踐中通常都是幾種抗干擾方法并用,互相補充完善,才能取得較好的抗干擾效果。從根本上來說,硬件抗干擾是主動的,而軟件是抗干擾是被動的。本文將以MCS-51單片機系統(tǒng)為例,對微機系統(tǒng)軟件抗干擾方法進(jìn)行研究。
在提高硬件系統(tǒng)抗干擾能力的同時,軟件抗干擾以其設(shè)計靈活、節(jié)省硬件資源、可靠性好越來越受到重視。下面以MCS-51單片機系統(tǒng)為例,對微機系統(tǒng)軟件抗干擾方法進(jìn)行研究。
1、軟件抗干擾方法的研究
在工程實踐中,軟件抗干擾研究的內(nèi)容主要是:一、消除模擬輸入信號的噪聲(如數(shù)字濾波技術(shù));二、程序運行混亂時使程序重入正軌的方法。本文針對后者提出了幾種有效的軟件抗干擾方法。
1.1 指令冗余
CPU取指令過程是先取操作碼,再取操作數(shù)。當(dāng)PC受干擾出現(xiàn)錯誤,程序便脫離正常軌道“亂飛”,當(dāng)亂飛到某雙字節(jié)指令,若取指令時刻落在操作數(shù)上,誤將操作數(shù)當(dāng)作操作碼,程序?qū)⒊鲥e。若“飛”到了三字節(jié)指令,出錯機率更大。
在關(guān)鍵地方人為插入一些單字節(jié)指令,或?qū)⒂行巫止?jié)指令重寫稱為指令冗余。通常是在雙字節(jié)指令和三字節(jié)指令后插入兩個字節(jié)以上的NOP。這樣即使亂飛程序飛到操作數(shù)上,由于空操作指令NOP的存在,避免了后面的指令被當(dāng)作操作數(shù)執(zhí)行,程序自動納入正軌。
此外,對系統(tǒng)流向起重要作用的指令如RET、RETI、LCALL、LJMP、JC等指令之前插入兩條NOP,也可將亂飛程序納入正軌,確保這些重要指令的執(zhí)行。
1.2 攔截技術(shù)
所謂攔截,是指將亂飛的程序引向指定位置,再進(jìn)行出錯處理。通常用軟件陷阱來攔截亂飛的程序。因此先要合理設(shè)計陷阱,其次要將陷阱安排在適當(dāng)?shù)奈恢谩?/div>
(1)軟件陷阱的設(shè)計
當(dāng)亂飛程序進(jìn)入非程序區(qū),冗余指令便無法起作用。通過軟件陷阱,攔截亂飛程序,將其引向指定位置,再進(jìn)行出錯處理。軟件陷阱是指用來將捕獲的亂飛程序引向復(fù)位入口地址0000H的指令。通常在EPROM中非程序區(qū)填入以下指令作為軟件陷阱:
NOPNOPLJMP 0000H其機器碼為0000020000。
(2)陷阱的安排
通常在程序中未使用的EPROM空間填0000020000。最后一條應(yīng)填入020000,當(dāng)亂飛程序落到此區(qū),即可自動入軌。在用戶程序區(qū)各模塊之間的空余單元也可填入陷阱指令。當(dāng)使用的中斷因干擾而開放時,在對應(yīng)的中斷服務(wù)程序中設(shè)置軟件陷阱,能及時捕獲錯誤的中斷。如某應(yīng)用系統(tǒng)雖未用到外部中斷1,外部中斷1的中斷服務(wù)程序可為如下形式:
NOPNOPRETI返回指令可用“RETI”,也可用“LJMP0000H”。如果故障診斷程序與系統(tǒng)自恢復(fù)程序的設(shè)計可靠、完善,用“LJMP0000H”作返回指令可直接進(jìn)入故障診斷程序,盡早地處理故障并恢復(fù)程序的運行。
考慮到程序存貯器的容量,軟件陷阱一般1K空間有2-3個就可以進(jìn)行有效攔截。
1.3 軟件“看門狗”技術(shù)
若失控的程序進(jìn)入“死循環(huán)”,通常采用“看門狗”技術(shù)使程序脫離“死循環(huán)”。通過不斷檢測程序循環(huán)運行時間,若發(fā)現(xiàn)程序循環(huán)時間超過最大循環(huán)運行時間,則認(rèn)為系統(tǒng)陷入“死循環(huán)”,需進(jìn)行出錯處理。
“看門狗”技術(shù)可由硬件實現(xiàn),也可由軟件實現(xiàn)。在工業(yè)應(yīng)用中,嚴(yán)重的干擾有時會破壞中斷方式控制字,關(guān)閉中斷。則系統(tǒng)無法定時“喂狗”,硬件看門狗電路失效。而軟件看門狗可有效地解決這類問題。
筆者在實際應(yīng)用中,采用環(huán)形中斷監(jiān)視系統(tǒng)。用定時器T0監(jiān)視定時器T1,用定時器T1監(jiān)視主程序,主程序監(jiān)視定時器T0。采用這種環(huán)形結(jié)構(gòu)的軟件“看門狗”具有良好的抗干擾性能,大大提高了系統(tǒng)可靠性。對于需經(jīng)常使用T1定時器進(jìn)行串口通訊的測控系統(tǒng),則定時器T1不能進(jìn)行中斷,可改由串口中斷進(jìn)行監(jiān)控(如果用的是MCS-52系列單片機,也可用T2代替T1進(jìn)行監(jiān)視)。這種軟件“看門狗”監(jiān)視原理是:在主程序、T0中斷服務(wù)程序、T1中斷服務(wù)程序中各設(shè)一運行觀測變量,假設(shè)為MWatch、T0Watch、T1Watch,主程序每循環(huán)一次,MWatch加1,同樣T0、T1中斷服務(wù)程序執(zhí)行一次,T0Watch、T1Watch加1。在T0中斷服務(wù)程序中通過檢測T1Watch的變化情況判定T1運行是否正常,在T1中斷服務(wù)程序中檢測MWatch的變化情況判定主程序是否正常運行,在主程序中通過檢測T0Watch的變化情況判別T0是否正常工作。若檢測到某觀測變量變化不正常,比如應(yīng)當(dāng)加1而未加1,則轉(zhuǎn)到出錯處理程序作排除故障處理。當(dāng)然,對主程序最大循環(huán)周期、定時器T0和T1定時周期應(yīng)予以全盤合理考慮。限于篇幅不贅述。
2、系統(tǒng)故障處理、自恢復(fù)程序的設(shè)計
單片機系統(tǒng)因干擾復(fù)位或掉電后復(fù)位均屬非正常復(fù)位,應(yīng)進(jìn)行故障診斷并能自動恢復(fù)非正常復(fù)位前的狀態(tài)。
2.1 非正常復(fù)位的識別
程序的執(zhí)行總是從0000H開始,導(dǎo)致程序從0000H開始執(zhí)行有四種可能:一、系統(tǒng)開機上電復(fù)位;二、軟件故障復(fù)位;三、看門狗超時未喂狗硬件復(fù)位;四、任務(wù)正在執(zhí)行中掉電后來電復(fù)位。四種情況中除第一種情況外均屬非正常復(fù)位,需加以識別。
(1)硬件復(fù)位與軟件復(fù)位的識別
此處硬件復(fù)位指開機復(fù)位與看門狗復(fù)位,硬件復(fù)位對寄存器有影響,如復(fù)位后PC=0000H,SP=07H,PSW=00H等。而軟件復(fù)位則對SP、SPW無影響。故對于微機測控系統(tǒng),當(dāng)程序正常運行時,將SP設(shè)置地址大于07H,或者將PSW的第5位用戶標(biāo)志位在系統(tǒng)正常運行時設(shè)為1,那么系統(tǒng)復(fù)位時只需檢測PSW.5標(biāo)志位或SP值便可判此是否硬件復(fù)位。
由于硬件復(fù)位時片內(nèi)RAM狀態(tài)是隨機的,而軟件復(fù)位片內(nèi)RAM則可保持復(fù)位前狀態(tài),因此可選取片內(nèi)某一個或兩個單元作為上電標(biāo)志。設(shè)40H用來做上電標(biāo)志,上電標(biāo)志字為78H,若系統(tǒng)復(fù)位后40H單元內(nèi)容不等于78H,則認(rèn)為是硬件復(fù)位,否則認(rèn)為是軟件復(fù)位,轉(zhuǎn)向出錯處理。若用兩個單元作上電標(biāo)志,則這種判別方法的可靠性更高。
(2)開機復(fù)位與看門狗故障復(fù)位的識別
開機復(fù)位與看門狗故障復(fù)位因同屬硬件復(fù)位,所以要想予以正確識別,一般要借助非易失性RAM或者EEROM。當(dāng)系統(tǒng)正常運行時,設(shè)置一可掉電保護(hù)的觀測單元。當(dāng)系統(tǒng)正常運行時,在定時喂狗的中斷服務(wù)程序中使該觀測單元保持正常值(設(shè)為AAH),而在主程中將該單元清零,因觀測單元掉電可保護(hù),則開機時通過檢測該單元是否為正常值可判斷是否看門狗復(fù)位。
(3)正常開機復(fù)位與非正常開機復(fù)位的識別
識別測控系統(tǒng)中因意外情況如系統(tǒng)掉電等情況引起的開機復(fù)位與正常開機復(fù)位,對于過程控制系統(tǒng)尤為重要。如某以時間為控制標(biāo)準(zhǔn)的測控系統(tǒng),完成一次測控任務(wù)需1小時。在已執(zhí)行測控50分鐘的情況下,系統(tǒng)電壓異常引起復(fù)位,此時若系統(tǒng)復(fù)位后又從頭開始進(jìn)行測控則會造成不必要的時間消耗。因此可通過一監(jiān)測單元對當(dāng)前系統(tǒng)的運行狀態(tài)、系統(tǒng)時間予以監(jiān)控,將控制過程分解為若干步或若干時間段,每執(zhí)行完一步或每運行一個時間段則對監(jiān)測單元置為關(guān)機允許值,不同的任務(wù)或任務(wù)的不同階段有不同的值,若系統(tǒng)正在進(jìn)行測控任務(wù)或正在執(zhí)某時間段,則將監(jiān)測單元置為非正常關(guān)機值。那么系統(tǒng)復(fù)位后可據(jù)此單元判系統(tǒng)原來的運行狀態(tài),并跳到出錯處理程序中恢復(fù)系統(tǒng)原運行狀態(tài)。
2.2 非正常復(fù)位后系統(tǒng)自恢復(fù)運行的程序設(shè)計
對順序要求嚴(yán)格的一些過程控制系統(tǒng),系統(tǒng)非正常復(fù)位否,一般都要求從失控的那一個模塊或任務(wù)恢復(fù)運行。所以測控系統(tǒng)要作好重要數(shù)據(jù)單元、參數(shù)的備份,如系統(tǒng)運行狀態(tài)、系統(tǒng)的進(jìn)程值、當(dāng)前輸入、輸出的值,當(dāng)前時鐘值、觀測單元值等,這些數(shù)據(jù)既要定時備份,同時若有修改也應(yīng)立即予以備份。
當(dāng)在已判別出系統(tǒng)非正常復(fù)位的情況下,先要恢復(fù)一些必要的系統(tǒng)數(shù)據(jù),如顯示模塊的初始化、片外擴(kuò)展芯片的初始化等。其次再對測控系統(tǒng)的系統(tǒng)狀態(tài)、運行參數(shù)等予以恢復(fù),包括顯示界面等的恢復(fù)。之后再把復(fù)位前的任務(wù)、參數(shù)、運行時間等恢復(fù),再進(jìn)入系統(tǒng)運行狀態(tài)。
應(yīng)當(dāng)說明的是,真實地恢復(fù)系統(tǒng)的運行狀態(tài)需要極為細(xì)致地對系統(tǒng)的重要數(shù)據(jù)予以備份,并加以數(shù)據(jù)可靠性檢查,以保證恢復(fù)的數(shù)據(jù)的可靠性。
其次,對多任務(wù)、多進(jìn)程測控系統(tǒng),數(shù)據(jù)的恢復(fù)需考慮恢復(fù)的次序問題。
系統(tǒng)基本初始化是指對芯片、顯示、輸入輸出方式等進(jìn)行初始化,要注意輸入輸出的初始化不應(yīng)造成誤動作。而復(fù)位前任務(wù)的初始化是指任務(wù)的執(zhí)行狀態(tài)、運行時間等。
對于軟件抗干擾的一些其它常用方法如數(shù)字濾波、RAM數(shù)據(jù)保護(hù)與糾錯等,限于篇幅,本文未作討論。在工程實踐中通常都是幾種抗干擾方法并用,互相補充完善,才能取得較好的抗干擾效果。從根本上來說,硬件抗干擾是主動的,而軟件是抗干擾是被動的。細(xì)致周到地分析干擾源,硬件與軟件抗干擾相結(jié)合,完善系統(tǒng)監(jiān)控程序,設(shè)計一穩(wěn)定可靠的單片機系統(tǒng)是完全可行的。