聯(lián)系我們contact
電話(huà):027-59760188-801
地址:武漢市東湖高新開(kāi)發(fā)區(qū)光谷大道120號(hào)現(xiàn)代森林小鎮(zhèn)A座609室
發(fā)布時(shí)間:2018-05-30 瀏覽次數(shù):1648次
文章標(biāo)題是仿照《浮生六記》中第五記 “中山記歷”而擬定的。目的是記錄2017年7/8月間的一次項(xiàng)目經(jīng)歷,項(xiàng)目的歷程,遇到的問(wèn)題,以及對(duì)數(shù)據(jù)管理的一些思考。恰值數(shù)據(jù)管理規(guī)范將落未落之際,數(shù)據(jù)完整性余熱未消,謹(jǐn)以此文與業(yè)界同仁共同探討數(shù)據(jù)管理之疾患。
七八月份正是一年中最熱的季節(jié)。從去年三月份用戶(hù)就開(kāi)始不斷聊起研發(fā)實(shí)驗(yàn)室的數(shù)據(jù)管理問(wèn)題,終于到了六月底,塵埃才落定。我們的客戶(hù)是國(guó)內(nèi)著名制藥企業(yè)的研發(fā)中心,目的是想建立實(shí)驗(yàn)室所有儀器數(shù)據(jù)的自動(dòng)備份,減輕實(shí)驗(yàn)室運(yùn)營(yíng)人員的工作負(fù)擔(dān),提高數(shù)據(jù)的安全性和整體的合規(guī)性。
客戶(hù)其實(shí)很早就在考慮數(shù)據(jù)自動(dòng)備份的事情,而且手頭可選的法寶還不少。他們有自己企業(yè)級(jí)的Veritas 備份一體機(jī),Agilent 的OpenLab ECM。但由于面對(duì)的儀器種類(lèi)太多,加之IT人員面對(duì)各種奇形怪狀的儀器心里十分發(fā)怵,生怕影響了這些儀器正常運(yùn)行,因此備份工作一直躊躇不前。大路貨HPLC就不說(shuō)了,已經(jīng)接入Agilent的網(wǎng)絡(luò)版中,其他的林林總總60多臺(tái)單機(jī)儀器,且重樣的不多。細(xì)細(xì)數(shù)來(lái),有島津的HPLC,GC-MS,Thermo的紅外光譜,梅特勒的滴定儀,細(xì)胞計(jì)數(shù)儀,戴安的離子色譜儀,GE Unicorn制備色譜儀,Waters UPLC-QDA液質(zhì)聯(lián)用儀,PE的ICP-MS,Agilent QTOF/QTRAP。儀器太多,這里不一一列出,一些高端的質(zhì)譜儀器,價(jià)格不小于一套房子。除了一些因?yàn)檐浖旧碓驘o(wú)法備份的除外,實(shí)驗(yàn)室的運(yùn)營(yíng)人員需要為50多臺(tái)儀器逐個(gè)進(jìn)行手動(dòng)備份,工作量之大可想而知。
儀器種類(lèi)多樣首先帶來(lái)的挑戰(zhàn)是多重的。首先,我們面對(duì)的操作系統(tǒng)就有Win2000,WinXP,Win7,win10四種。尤其是Win2000,我已經(jīng)10年沒(méi)有見(jiàn)過(guò)了,所幸沒(méi)有見(jiàn)到它的前任Win98。其次,數(shù)據(jù)類(lèi)型多樣化,有普通文件型的,Access數(shù)據(jù)庫(kù)的,SQL Server 2005/2008,Oracle9i/11g。以上在我們的職業(yè)生涯中還算是見(jiàn)怪不怪,但遇到梅特勒的熱重分析儀STARe SW,我還是出離驚訝了。這款儀器竟然用的是IBM DB2數(shù)據(jù)庫(kù)。這款不顯山,不露水的IBM的獨(dú)門(mén)武器竟然在實(shí)驗(yàn)室出現(xiàn)了,拿一位IT專(zhuān)業(yè)人士的說(shuō)法,DB2竟然還裝在Win7的系統(tǒng)上。研究過(guò)Oracle,MSSQL,MySQL,還真沒(méi)碰過(guò)DB2。稍微有點(diǎn)遺憾的是,我們常規(guī)的實(shí)驗(yàn)室里MySQL還是比較罕見(jiàn)的,這次依然沒(méi)有遇見(jiàn),但做生物信息學(xué)的朋友想必是非常熟悉的。由于有一些大型質(zhì)譜,儀器產(chǎn)生的數(shù)據(jù)單個(gè)文件就非常大。這其中大的可以有2-3個(gè)G,小的也有好幾百兆。正是由于儀器數(shù)據(jù)類(lèi)型的復(fù)雜性,導(dǎo)致實(shí)現(xiàn)所有儀器數(shù)據(jù)自動(dòng)備份的工作一直停滯不前。儀器數(shù)據(jù)類(lèi)型我們?cè)趯?shí)施備份工作前首先就要了解的信息,以及其所依賴(lài)的操作系統(tǒng)。
數(shù)據(jù)備份從技術(shù)上來(lái)講,特別是對(duì)于一個(gè)公司成熟的IT部門(mén),并非是困難的事情。但制藥行業(yè)屬于需要合規(guī)的行業(yè),與數(shù)據(jù)完整性,產(chǎn)品質(zhì)量,患者安全相關(guān)的IT行為是需要合規(guī)的。這里說(shuō)說(shuō)我們?nèi)绾魏弦?guī)地進(jìn)行實(shí)驗(yàn)室數(shù)據(jù)自動(dòng)備份系統(tǒng)的搭建。GMP一個(gè)理念是事前有規(guī)范可循,事后有記錄可查。拿數(shù)據(jù)備份來(lái)說(shuō),我們要在備份開(kāi)始之前,說(shuō)明備份策略制定地依據(jù),包括備份的頻率,備份的方式(增量還是全備),備份冗余數(shù)據(jù)的清除。這就要求我們對(duì)需要備份的系統(tǒng)進(jìn)行”系統(tǒng)影響性”評(píng)估,評(píng)估該系統(tǒng)業(yè)務(wù)和法規(guī)符合上的影響強(qiáng)弱,從而決定其備份的強(qiáng)弱。
備份策略確定好之后,接下來(lái)還要調(diào)查備份的對(duì)象。備份的對(duì)象既有法規(guī)要求的,也有用戶(hù)自己要求的。法規(guī)要求的是原始數(shù)據(jù)和相關(guān)審計(jì)追蹤記錄,應(yīng)用軟件的相關(guān)事件記錄,例如用戶(hù)的登陸,登出,密碼修改,權(quán)限變動(dòng)等等。用戶(hù)自己從業(yè)務(wù)角度要求的,包括儀器配置信息,分析方法,報(bào)告模板,導(dǎo)出的報(bào)告等等。在我們這次實(shí)際的備份數(shù)據(jù)調(diào)查中,發(fā)現(xiàn)研究人員不會(huì)去關(guān)注那些法規(guī)要求的審計(jì)記錄,而對(duì)于方法,報(bào)告這些與其日常工作相關(guān)的比較關(guān)心,希望能進(jìn)行自動(dòng)的備份。我想這其實(shí)很正常,研發(fā)人員建立這些模板其實(shí)是花了非常多時(shí)間的。沒(méi)有這些模板,日常的分析工作甚至都無(wú)法開(kāi)展。如果將來(lái)更換電腦或系統(tǒng)恢復(fù),大家當(dāng)然不希望去重新建一遍。那些已生成的分析報(bào)告有現(xiàn)成的總比將來(lái)重新從系統(tǒng)里生成一遍來(lái)得簡(jiǎn)單,更何況將來(lái)還不知道會(huì)發(fā)生何種變化,當(dāng)初的分析方法是不是還在,軟件版本是不是一致等等。講這些,其實(shí)是希望大家在做備份時(shí),不要只顧及法規(guī)監(jiān)管的要求,我們還要考慮業(yè)務(wù)的需要。
業(yè)務(wù)上需要備份的數(shù)據(jù)易于識(shí)別,但法規(guī)要求的數(shù)據(jù)卻不那么容易發(fā)現(xiàn)。很多采用文件存儲(chǔ)數(shù)據(jù)的儀器工作站一般都會(huì)將數(shù)據(jù)操作的審計(jì)追蹤記錄與原始文件放在一起,而軟件的事件記錄采用單獨(dú)文件存放。在這種情況下,我們就需要準(zhǔn)確定位這些存放應(yīng)用系統(tǒng)日志的文件。總的說(shuō)來(lái),主要在三個(gè)目錄下:一是軟件的安裝目錄,二是C盤(pán)下的ProgramData下,三是在Users的目錄下。以我們做的一臺(tái)戴安離子色譜為例,變色龍7.2的系統(tǒng),數(shù)據(jù)分為SQL Server 2008數(shù)據(jù)庫(kù)和原始數(shù)據(jù)。Chromeleon 的數(shù)據(jù)審計(jì)追蹤都存放在數(shù)據(jù)庫(kù)里,而儀器的使用日志則在C盤(pán)下的ProgramData里。由此決定備份時(shí)需要備份三個(gè)位置的數(shù)據(jù)。對(duì)于合規(guī)的數(shù)據(jù)備份來(lái)講,在實(shí)施備份之前需要對(duì)每臺(tái)儀器進(jìn)行備份數(shù)據(jù)調(diào)查,說(shuō)明法規(guī)要求的數(shù)據(jù)以及業(yè)務(wù)需要的數(shù)據(jù)的存放位置,出具備份數(shù)據(jù)調(diào)查報(bào)告;這樣后期的備份計(jì)劃才是有根據(jù)的。調(diào)查的過(guò)程請(qǐng)大家可以咨詢(xún)廠家,畢竟只有廠家最熟悉自家的系統(tǒng),并且還要對(duì)獲得的信息進(jìn)行再確認(rèn)。除了上面講的數(shù)據(jù)備份,大家不要忘了產(chǎn)生數(shù)據(jù)的軟件也要備份。今后系統(tǒng)崩潰后恢復(fù)重建要用,做數(shù)據(jù)恢復(fù)測(cè)試時(shí)也要用到。翻箱倒柜找安裝光盤(pán)的經(jīng)歷還是記憶猶新的。找東西,往往在搬家之后變得尤為戲劇化。找不到光盤(pán),找廠商可能也沒(méi)用。太古老的東西,別人要么也沒(méi)有,或者不想給你而想重新賣(mài)給你。在這個(gè)炎熱的夏日,幾臺(tái)基于Oracle 9i的舊Empower版本的安裝光盤(pán)就找不到了,托了一些關(guān)系也沒(méi)有弄到。實(shí)在沒(méi)有辦法,基于我們對(duì)Oracle技術(shù)的掌握,冒險(xiǎn)在原機(jī)上做的恢復(fù)測(cè)試。很多Waters單機(jī)的用戶(hù)會(huì)采用軟件本身提供的導(dǎo)入導(dǎo)出工具來(lái)進(jìn)行簡(jiǎn)單的備份與還原測(cè)試,但這種測(cè)試是建立在原機(jī)使用環(huán)境還完好存在的情況下。實(shí)際上,如果存儲(chǔ)介質(zhì)出現(xiàn)問(wèn)題,Empower軟件可能根本打不開(kāi),也不會(huì)給你導(dǎo)入的機(jī)會(huì)。在這個(gè)項(xiàng)目中,我們?yōu)榭蛻?hù)實(shí)現(xiàn)的是所有Empower單機(jī)的全部數(shù)據(jù)自動(dòng)備份。由于備份方式不一樣,所以軟件提供的導(dǎo)入,導(dǎo)出功能我們用不到。不巧的是,其中有一臺(tái)Empower的電腦每次啟動(dòng)需要半個(gè)多小時(shí),想將其虛擬化出來(lái)也總是失敗,已經(jīng)處于十分危險(xiǎn)的境地。
一套分布式的備份系統(tǒng),從GAMP5的角度劃分,可以歸到第4類(lèi),屬于可配置的軟件。驗(yàn)證第四類(lèi)的軟件,我們最好擬定一個(gè)驗(yàn)證計(jì)劃,說(shuō)明驗(yàn)證的策略,相關(guān)的職責(zé),交付文件以及維持合規(guī)狀態(tài)的必要措施和流程??紤]到這種軟件為分布式部署的方式,需要在儀器終端電腦上安裝,需要根據(jù)系統(tǒng)影響性評(píng)估和備份數(shù)據(jù)調(diào)查結(jié)果進(jìn)行備份任務(wù)的配置。備份任務(wù)的配置參數(shù)將影響到數(shù)據(jù)是否按照計(jì)劃,有效地復(fù)制到備份設(shè)備上。作為第4類(lèi)地軟件,我們有必要針對(duì)其功能進(jìn)行風(fēng)險(xiǎn)分析。風(fēng)險(xiǎn)分析的點(diǎn)包括備份客戶(hù)端在儀器工作站的安裝是否會(huì)干擾儀器的正常運(yùn)行,備份任務(wù)是否會(huì)失效,備份任務(wù)是否會(huì)受到實(shí)驗(yàn)人員有意無(wú)意的更改,儀器工作站電腦在備份時(shí)間段被意外關(guān)機(jī),備份任務(wù)是否能應(yīng)對(duì)網(wǎng)絡(luò)臨時(shí)中斷以及備份服務(wù)器宕機(jī),服務(wù)器的備份數(shù)據(jù)是否受到不受限制的訪(fǎng)問(wèn),以及備份數(shù)據(jù)的有效性等等。以上風(fēng)險(xiǎn)點(diǎn),一方面要通過(guò)后續(xù)的備份系統(tǒng)驗(yàn)證流程進(jìn)行確認(rèn),另一方面要通過(guò)相關(guān)的SOP進(jìn)行規(guī)范管理,以期將風(fēng)險(xiǎn)降到最低。風(fēng)險(xiǎn)識(shí)別是一個(gè)不斷遞增的過(guò)程,初次的風(fēng)險(xiǎn)分析必然不能涵蓋所有的風(fēng)險(xiǎn)點(diǎn),并且根據(jù)選擇的備份工具的不同,同樣會(huì)存在一些風(fēng)險(xiǎn)細(xì)節(jié)上的差異。就拿我們這次的做的自動(dòng)備份來(lái)說(shuō),為了應(yīng)對(duì)數(shù)據(jù)庫(kù)備份而產(chǎn)生的冗余備份數(shù)據(jù),原本我們用Dos命令寫(xiě)了一個(gè)按照時(shí)間段進(jìn)行冗余數(shù)據(jù)清除的批處理程序。也就是下面的代碼,自動(dòng)刪除7天以前的備份數(shù)據(jù)。
forfiles /p E:\DataBackup\OnlineBackup /m *.* /d -7 /c “cmd /c del @file”
初看起來(lái)沒(méi)有問(wèn)題,但在實(shí)際操作過(guò)程中發(fā)現(xiàn),這個(gè)命令是建立在備份系統(tǒng)一直處于平穩(wěn)運(yùn)行的前提條件下。如果一旦備份系統(tǒng)運(yùn)行出現(xiàn)問(wèn)題,例如超出7天都沒(méi)有產(chǎn)生新的備份,那么之前所有的備份文件都會(huì)被刪除,一份都不會(huì)留下。為了應(yīng)對(duì)這個(gè)問(wèn)題,我們考慮編寫(xiě)更復(fù)雜的Dos命令,但考慮到可維護(hù)性,最后采用Windows自帶的PowerShell寫(xiě)了一個(gè)保留最新的N份數(shù)據(jù)的程序,其余的則刪除,避免了備份數(shù)據(jù)全部被清空的風(fēng)險(xiǎn)。說(shuō)了這么多,其實(shí)就是要求我們?cè)谧鯣xP數(shù)據(jù)備份時(shí)需要進(jìn)行風(fēng)險(xiǎn)評(píng)估,并將風(fēng)險(xiǎn)點(diǎn)體現(xiàn)在后續(xù)的驗(yàn)證方案和SOP中。
從GAMP5的V模型出發(fā),除了驗(yàn)證計(jì)劃,風(fēng)險(xiǎn)評(píng)估,還需要有FS,即功能說(shuō)明規(guī)范。對(duì)于成熟的商業(yè)化系統(tǒng),我們的建議是不需要專(zhuān)門(mén)去起草功能說(shuō)明。功能說(shuō)明應(yīng)該是廠商做的事。廠商的技術(shù)白皮書(shū),功能設(shè)計(jì)說(shuō)明,用戶(hù)手冊(cè)都可以視作GAMP5中的FS(功能規(guī)范)的體現(xiàn)。相比FS,我們將CS(配置說(shuō)明)視為一個(gè)非常重要的文件。這份文件應(yīng)該說(shuō)明備份系統(tǒng)的架構(gòu),相關(guān)的基礎(chǔ)軟硬件配置,包括涉及的儀器工作站計(jì)算機(jī)的配置以及備份服務(wù)器的配置,備份數(shù)據(jù)所對(duì)應(yīng)的備份任務(wù)名稱(chēng),備份策略,郵件通知等。
自動(dòng)備份的實(shí)現(xiàn)多半是技術(shù)性的工作。文件型的數(shù)據(jù)可以采用全備+差異/增量的方式。采用SQL Server數(shù)據(jù)庫(kù)存儲(chǔ)的數(shù)據(jù),則采用我們備份軟件自帶的數(shù)據(jù)庫(kù)自動(dòng)備份功能,導(dǎo)出為bak文件后就可等同一般的文件進(jìn)行處理了。這里值得一提的是,實(shí)驗(yàn)室各種儀器用的SQL Server數(shù)據(jù)庫(kù)都是SQLServer Express版,完整版的SQL Server是自帶自動(dòng)備份功能的。我們?cè)趪?guó)內(nèi)很多企業(yè)看到實(shí)驗(yàn)室的分析人員經(jīng)常對(duì)數(shù)據(jù)庫(kù)類(lèi)型的儀器采用了錯(cuò)誤的備份方法。有些實(shí)驗(yàn)室的管理員不清楚數(shù)據(jù)放在什么地方,而找到數(shù)據(jù)存放位置的卻采用強(qiáng)行拷貝數(shù)據(jù)庫(kù)文件.mdf的方法進(jìn)行備份。在數(shù)據(jù)庫(kù)處于連接讀取的狀態(tài)進(jìn)行拷貝,拷貝出的文件大概率是不可用的。
在實(shí)施自動(dòng)備份方案的過(guò)程中。我們發(fā)現(xiàn)一臺(tái)戴安的離子色譜的原始數(shù)據(jù)和數(shù)據(jù)庫(kù)文件有兩處。詢(xún)問(wèn)之后是因?yàn)橹匦卵b過(guò)軟件。原來(lái)不知道怎么處理,就封存在原來(lái)的路徑下。新裝軟件重新選擇數(shù)據(jù)存儲(chǔ)的路徑。打開(kāi)變色龍工作站只能看到重新安裝軟件后樣品檢測(cè)數(shù)據(jù),而老數(shù)據(jù)被凝固在角落里,無(wú)人問(wèn)津。用戶(hù)不知道如何去查看這些之前的舊數(shù)據(jù)??吹竭@里,實(shí)在于心不忍,數(shù)據(jù)遷移雖然不在本次的項(xiàng)目工作范疇內(nèi),我們還是將老數(shù)據(jù)掛到了變色龍系統(tǒng)下面。打開(kāi)Chromeleon7,根目錄下多了個(gè)新柱子。其實(shí)對(duì)變色龍的CDS,我一直還是很認(rèn)可的,上手容易,用戶(hù)界面友好,合規(guī)性也不錯(cuò),在三足鼎立的形勢(shì)下,堪稱(chēng)性?xún)r(jià)比之良器。
所有的基于SQL Server的工作站通過(guò)我們的自動(dòng)備份軟件都好解決。唯獨(dú)Waters的一系列單機(jī)版Empower讓我們淚奔。Empower網(wǎng)絡(luò)版是支持自動(dòng)備份的,但單機(jī)版不提供該項(xiàng)功能,只能手動(dòng)導(dǎo)出原始數(shù)據(jù)。從數(shù)據(jù)存儲(chǔ)格式上來(lái)說(shuō),Empower屬于Oracle數(shù)據(jù)庫(kù)+文件類(lèi)型的。以前做過(guò)Oracle真實(shí)集群,對(duì)Oracle的備份還是比較了解的。要解決單機(jī)Empower的自動(dòng)備份問(wèn)題,就只能從Oracle 數(shù)據(jù)庫(kù)層面做備份。作為關(guān)系數(shù)據(jù)庫(kù)領(lǐng)域的龍頭企業(yè),Oracle本身提供了非常完善的備份工具,那就是RMAN??蛻?hù)本身購(gòu)買(mǎi)了企業(yè)版的Veritas NetBackup備份工具。雖然Veritas NBU針對(duì)Oracle本質(zhì)上也是使用RMAN,但其提供了備份參數(shù)配置模板,便于初學(xué)者上手。我本人還是比較喜歡自由的編碼方式。令人不解的是,客戶(hù)處的Veritas NBU針對(duì)自身企業(yè)級(jí)的OA,ERP等基于Oracle的大型信息管理系統(tǒng)備份手到擒來(lái),但對(duì)6臺(tái)單機(jī)Empower卻怎么也連不上。做RMAN備份的前提是要將Oracle設(shè)置為歸檔模式。在設(shè)置過(guò)程中,我們發(fā)現(xiàn)Oracle無(wú)法啟動(dòng)到Mount狀態(tài),數(shù)據(jù)庫(kù)連接直接中斷,從而無(wú)法開(kāi)啟歸檔模式。接連幾臺(tái)UPLC,HPLC,ACQUITY QDa都出現(xiàn)這種問(wèn)題。查遍了中文網(wǎng)絡(luò)中的資料無(wú)法搞定,Google又被廢了,Bing了一個(gè)周末,國(guó)外資料查了一圈也沒(méi)有頭緒。這都是沒(méi)有系統(tǒng)深入學(xué)習(xí)過(guò)Oracle惹的禍,遇到新問(wèn)題時(shí)一籌莫展。經(jīng)過(guò)周末兩天的煎熬,周日夜幕快落下的時(shí)候,我差不多快要放棄了,考慮用expdp命令了。Expdp本身是我無(wú)法接受的,一則這個(gè)命令并非Oracle官方認(rèn)可的數(shù)據(jù)庫(kù)備份方式,二則前幾年我用Expdp導(dǎo)出的數(shù)據(jù)再導(dǎo)入時(shí)發(fā)生了嚴(yán)重的報(bào)錯(cuò),導(dǎo)致用戶(hù)數(shù)據(jù)無(wú)法恢復(fù)。很多IT人員喜歡用Expdp命令來(lái)做數(shù)據(jù)的備份,但恰恰就屬于誤用,Expdp本身是用來(lái)做數(shù)據(jù)遷移的,并非用來(lái)做備份,且數(shù)據(jù)導(dǎo)出的效率不高。對(duì)于比較大的數(shù)據(jù)導(dǎo)入存在失敗的風(fēng)險(xiǎn),至少本人就經(jīng)歷過(guò)。如果有實(shí)驗(yàn)室用這種方式做基于oracle數(shù)據(jù)庫(kù)儀器的備份,還請(qǐng)盡快更換成Oracle建議的方法。拋除雜念,觀照內(nèi)心有時(shí)候就是解決問(wèn)題的良方。在遍尋仙方無(wú)果,只能靠自身修為做最后一搏。梳理數(shù)年來(lái)學(xué)到的點(diǎn)點(diǎn)滴滴,編織推演,恍然大悟,改動(dòng)幾個(gè)參數(shù)之后,順利啟動(dòng)為歸檔模式,自動(dòng)備份水到渠成?,F(xiàn)在想來(lái),出現(xiàn)這種問(wèn)題是因?yàn)镋mpower的Oracle安裝并非標(biāo)準(zhǔn)化的,而是屬于Empower的一個(gè)子安裝包,里面的配置參數(shù)是經(jīng)過(guò)特殊設(shè)置的。是不是Waters有意為之不得而知。國(guó)內(nèi)如此多的單機(jī)版Empower是不是都有這個(gè)問(wèn)題亦不知。
技術(shù)的問(wèn)題講了這么多,我們還是回到合規(guī)的問(wèn)題上來(lái)。按照V模型,CS確定之后,就要進(jìn)行安裝確認(rèn)。IQ對(duì)于一套備份系統(tǒng)來(lái)說(shuō)是比較簡(jiǎn)單的,主要是確認(rèn)備份軟件的安裝環(huán)境,安裝后的啟動(dòng)正常,備份服務(wù)器的配置確認(rèn)以及備份計(jì)劃任務(wù)的實(shí)際配置與CS中的要一致。
OQ 主要包含了三個(gè)方面的內(nèi)容。一是確認(rèn)數(shù)據(jù)是否按照設(shè)定的時(shí)間自動(dòng)上傳,二是數(shù)據(jù)的恢復(fù)驗(yàn)證,檢查恢復(fù)后數(shù)據(jù)文件在宏觀上是否一致(包括大小,數(shù)量),是否能由原軟件讀取而且信息與原工作站上一致。對(duì)于前者,我們進(jìn)行了一個(gè)任務(wù)周期的備份跟蹤檢查。例如備份任務(wù)是每天一個(gè)差異備份,每周日一個(gè)全備份。那么我們需要確認(rèn)每天產(chǎn)生了一個(gè)差異備份,到了周日這天產(chǎn)生了一個(gè)全備份。對(duì)于后者,數(shù)據(jù)是否能夠恢復(fù)不僅取決于所備份的數(shù)據(jù),還與支持?jǐn)?shù)據(jù)運(yùn)行的環(huán)境有關(guān),包括操作系統(tǒng)和應(yīng)用程序以及相關(guān)的配置信息。經(jīng)此一役,客戶(hù)已經(jīng)將軟件的納入了管理計(jì)劃。同時(shí),客戶(hù)采用 Veritas備份工具對(duì)各個(gè)儀器工作站都進(jìn)行了運(yùn)行環(huán)境鏡像的備份,通過(guò)這些鏡像可在物理機(jī)上直接恢復(fù)原系統(tǒng)。考慮到風(fēng)險(xiǎn)和系統(tǒng)重建的難易程度,數(shù)據(jù)恢復(fù)我們采用原機(jī)恢復(fù)和異機(jī)恢復(fù)兩種方式進(jìn)行。
對(duì)于純文件型的數(shù)據(jù),可以直接恢復(fù)到原機(jī)進(jìn)行讀取測(cè)試。在確認(rèn)備份兩端的一致性時(shí),我們和客戶(hù)起了小小的爭(zhēng)議??蛻?hù)是IT部牽頭的,對(duì)于這種比較大小和數(shù)量是否一致的方式覺(jué)得太Low了,采用MD5碼進(jìn)行對(duì)比會(huì)更精確。MD5碼在數(shù)據(jù)識(shí)別方面確實(shí)非常有效,只不過(guò)在一個(gè)封閉的網(wǎng)絡(luò)環(huán)境里,用MD5碼去確認(rèn)有些過(guò)于謹(jǐn)慎了。事實(shí)上,備份軟件的文件傳輸和傳輸結(jié)尾會(huì)檢查和確認(rèn)數(shù)據(jù)的完整性。最終妥協(xié)的結(jié)果是,我們對(duì)抽取的最早,中間和最近三個(gè)時(shí)間段的三份數(shù)據(jù)進(jìn)行MD5碼比對(duì),并采用原軟件進(jìn)行讀取測(cè)試。MD5碼一致,然后軟件能打開(kāi)就OK,不需要像以前一樣還要在打開(kāi)的數(shù)據(jù)中去比較信息是不是一致。
對(duì)于數(shù)據(jù)庫(kù)類(lèi)型的數(shù)據(jù),一般建議重新搭建一個(gè)測(cè)試環(huán)境,再將數(shù)據(jù)庫(kù)文件導(dǎo)入進(jìn)行測(cè)試。環(huán)境搭建的方式可在一個(gè)新系統(tǒng)中重新安裝軟件,也可采用將原系統(tǒng)轉(zhuǎn)換成虛擬機(jī)的方式進(jìn)行。Waters的單機(jī)Empower工作站最早是通過(guò)轉(zhuǎn)換虛擬機(jī)做恢復(fù)測(cè)試的,但后來(lái)應(yīng)客戶(hù)要求,我們采用Oracle RMAN備份出來(lái)的數(shù)據(jù)集在另外一臺(tái)計(jì)算機(jī)上從軟件安裝開(kāi)始,再進(jìn)行數(shù)據(jù)導(dǎo)入,恢復(fù)成跟原機(jī)一模一樣的的系統(tǒng),包括所有的數(shù)據(jù),用戶(hù),權(quán)限,配置,證書(shū)都是一模一樣的,而采用手動(dòng)導(dǎo)出數(shù)據(jù)的備份無(wú)法做到這一點(diǎn)。這種僅通過(guò)備份數(shù)據(jù)得到跟之前一致的應(yīng)用系統(tǒng)已經(jīng)接近災(zāi)難恢復(fù)了。當(dāng)然,我想用戶(hù)考慮這么做還是非常有意義的,因?yàn)橐坏┏鰡?wèn)題,多半就是災(zāi)難性的。
OQ到此并未結(jié)束,我們之前在風(fēng)險(xiǎn)評(píng)估時(shí)所識(shí)別到的風(fēng)險(xiǎn),也要在OQ 中去體現(xiàn),這一塊并不困難,在此不再贅述。
OQ結(jié)束之后我們就起草了驗(yàn)證總結(jié)報(bào)告。驗(yàn)證總結(jié)報(bào)告的編寫(xiě)應(yīng)該與驗(yàn)證計(jì)劃中要做的事情進(jìn)行對(duì)應(yīng)。
備份系統(tǒng)的PQ事實(shí)上并不需要起草專(zhuān)門(mén)的驗(yàn)證方案去驗(yàn)證,因?yàn)槲覀冊(cè)贠Q中就已經(jīng)對(duì)每臺(tái)儀器的做了備份任務(wù)的運(yùn)行確認(rèn)。相對(duì)OQ 而言,PQ應(yīng)該從OQ結(jié)束備份系統(tǒng)放行,一直持續(xù)到備份系統(tǒng)的退役。性能確認(rèn)是一個(gè)長(zhǎng)期的過(guò)程。在驗(yàn)證計(jì)劃中,需要就如何維護(hù)備份系統(tǒng)處于合規(guī)狀態(tài)進(jìn)行規(guī)定,其中就要說(shuō)明PQ如何執(zhí)行,其他的諸如變更管理,人員培訓(xùn),偏差處理,需要的支持性SOP一一列出。PQ基本的做法是進(jìn)行日常的監(jiān)控,異常事件報(bào)告,變更的執(zhí)行和評(píng)估,定期的恢復(fù)測(cè)試,包括將系統(tǒng)設(shè)置為備份任務(wù)成功后或失敗時(shí)自動(dòng)發(fā)送郵件通知,以上均是PQ的表現(xiàn)形式。
實(shí)驗(yàn)室電子數(shù)據(jù)的備份管理,是保障數(shù)據(jù)安全和完整性的重要方面之一。一個(gè)成功的備份系統(tǒng)是由備份的軟件,硬件以及備份策略構(gòu)成的。同時(shí),一個(gè)備份系統(tǒng)運(yùn)行得好不好還與這個(gè)系統(tǒng)的可管理性密不可分。例如國(guó)內(nèi)藥廠很多采用手動(dòng)備份,就是可管理性比較差的典型。我們看到很多客戶(hù)的儀器的手動(dòng)備份工作并未按預(yù)定的計(jì)劃進(jìn)行。而且手動(dòng)備份往往間隔時(shí)間比較長(zhǎng),因此無(wú)法應(yīng)對(duì)在間隔期內(nèi)發(fā)生的數(shù)據(jù)丟失問(wèn)題。加之儀器的數(shù)據(jù)日積月累,數(shù)量不斷增加,備份人員采用增量備份還要對(duì)數(shù)據(jù)進(jìn)行挑選,工作量也大大增加,容易出現(xiàn)遺漏。備份的執(zhí)行是一個(gè)方面,備份數(shù)據(jù)的管理則會(huì)更加混亂。而采用自動(dòng)備份,可管理性則會(huì)大大增強(qiáng),一則系統(tǒng)會(huì)自動(dòng)地進(jìn)行全備,增量和差異備份(不出意外地話(huà)),對(duì)備份數(shù)據(jù)進(jìn)行管理和冗余的計(jì)劃性清除,并且會(huì)有日志記錄備份的情況。在備份成功或失敗也會(huì)有相應(yīng)的郵件提醒,備份的可控性得到有效提高。隨著信息化,以及計(jì)算機(jī)系統(tǒng)應(yīng)用水平的提升,手動(dòng)備份將會(huì)成為歷史,監(jiān)管部門(mén)也會(huì)對(duì)采用手動(dòng)備份提出更多的挑戰(zhàn),一些國(guó)外的客戶(hù)甚至已經(jīng)完全不接受手動(dòng)備份的操作方式。
在備份的工具的選擇上,客戶(hù)把Veritas備份一體機(jī)定位在企業(yè)級(jí)大型信息管理系統(tǒng)的備份上,例如公司的財(cái)務(wù)系統(tǒng),文檔管理系統(tǒng),LIMS系統(tǒng)以及CDS系統(tǒng)等,各單機(jī)版儀器的備份則采用我們提供的備份系統(tǒng)。
最后提一提SOP,客戶(hù)在項(xiàng)目開(kāi)始的時(shí)候并沒(méi)有數(shù)據(jù)備份相關(guān)的SOP。在備份項(xiàng)目實(shí)施的過(guò)程中我們與客戶(hù)一起逐步地建立了這些操作規(guī)程,包括“實(shí)驗(yàn)室數(shù)據(jù)備份與恢復(fù)管理規(guī)程“,計(jì)算機(jī)軟件管理規(guī)程,以及各臺(tái)儀器的恢復(fù)規(guī)程用于發(fā)生數(shù)據(jù)丟失時(shí)或系統(tǒng)崩潰時(shí),如何利用備份數(shù)據(jù)恢復(fù)系統(tǒng)的操作步驟。
從去年9月項(xiàng)目結(jié)束到現(xiàn)在已經(jīng)有大半年的時(shí)間,我們這套LabSync實(shí)驗(yàn)室數(shù)據(jù)自動(dòng)備份系統(tǒng)運(yùn)行一直都非常穩(wěn)定,各類(lèi)儀器的數(shù)據(jù)都能自動(dòng)地上傳,消除了長(zhǎng)久以來(lái)隱患。
對(duì)于此文,有任何建議或疑問(wèn),也可寫(xiě)信與我們聯(lián)系bob.yang@labwind.com