無塵粉碎系統(tǒng) 脈沖式氣流混合系統(tǒng) 自動提升料斗混合機 無塵投料站 噸袋卸料機 真空輸送設備 計量分裝機 CIP清洗單元 代理設備—干法制粒機
摘要:近年來,隨著低值大宗氨基酸產品產業(yè)逐漸向發(fā)展中國家轉移,我國已成為世界氨基酸發(fā)酵產業(yè)大國,氨基酸需求量不斷增加,應用范圍不斷拓展。由于氨基酸發(fā)酵屬于技術密集型產業(yè),涉及的化工單元操作比較多,因此,保證關鍵工藝參數的可控性和重現性對連續(xù)自動化生產至關重要。為了提高發(fā)酵過程分析和控制水平,提高產品產率和轉化率,采用基于化學計量學的近紅外光譜技術的分析過程,建立一個穩(wěn)定、可靠的氨基酸發(fā)酵過程預測模型,實時監(jiān)測發(fā)酵過程中各參數的濃度,為氨基酸發(fā)酵生產過程優(yōu)化與自動化控制奠定了理論基礎。
關鍵詞:近紅外光譜;化學計量學分析;氨基酸發(fā)酵;預測模型
一、引言
近年來,隨著低值大宗氨基酸產品產業(yè)逐漸向發(fā)展中國家轉移,我國已成為世界氨基酸發(fā)酵產業(yè)大國,氨基酸需求量不斷增加,其應用范圍不斷拓展。當前,發(fā)酵過程分析的重點問題是及時地自動監(jiān)測各大關鍵工藝參數,對數據的最終結果進行統(tǒng)計、整理、分析,同時要反映出實際控制工藝的整體操作環(huán)節(jié),切實保障批次之間的控制工藝能夠統(tǒng)一,產品的品質無可挑剔,降低廢品出現的可能性,節(jié)省勞動力方面的支出以及避免人力所導致的誤差,落實及時化的產品通過幾率,大大縮減整體生產周期,這將更有益于工藝優(yōu)化以及交接。近年來,近紅外光譜技術廣泛地應用在發(fā)酵領域的諸多方面,主要集中在發(fā)酵底物和終產品的檢測方面,而應用于發(fā)酵過程監(jiān)測和自動控制的研究基本處于空白。
(一)氨基酸發(fā)酵產業(yè)
氨基酸發(fā)酵產業(yè)歸根結底來說屬于技術密集型產業(yè),它所觸及的化工單元操作極為繁多,西方發(fā)達國家以往常用的間斷型非持續(xù)化的制造方法已逐步被替換為效率顯然更優(yōu)化的連續(xù)化自動生產方法。國內的氨基酸產業(yè)在控制技術層面上一般表現得較為滯后,制造階段依然將人力控制作為常有的方式,電腦技術的運用起始時間相對比較晚,普及率也極為一般。針對氨基酸發(fā)酵這一問題來說,明確保障關鍵工藝參數本身的可操控特性以及重現特性對于連續(xù)化自動生產而言極為必要。氨基酸發(fā)酵的整體過程的要點大體上被歸納為如下內容:
第一,在各方面始終堅持純培養(yǎng),包括設備、培養(yǎng)液以及空氣滅菌處理:對于發(fā)酵的整體過程而言,不管是屬于分批次的發(fā)酵還是連續(xù)性的發(fā)酵,其第一大準則就是在實操進行期間內一定要堅持純培養(yǎng),唯有堅持這一點方能確保常規(guī)化的生產過程,氨基酸發(fā)酵亦不能區(qū)別對待。
第二、對發(fā)酵過程實施整體的控制,比如pH、溫度、通氣以及消泡沫:對發(fā)酵過程實施控制的目的是要令其保障菌體能夠用最佳速度發(fā)育,并實現其產物的無異?;铣?/span>[1]。發(fā)酵過程從根本上能夠劃分成兩個重要的階段:一個是生長期(即從細胞初始化地生長直至指數生長完為止),一個是生產期(即指數生長完直到細胞開啟代謝過程并累積了氨基酸為止)。
第三、產物的形成(溶氧以及代謝):氨基酸的發(fā)酵其實是消耗氧氣的一個過程,因此,產物生產和溶氧之間有著極大的關聯[2],諸如此類的氨基酸發(fā)酵過程避免不了地需要足量的氧氣,使其符合細胞呼吸的條件,發(fā)酵液所具有的溶氧壓力則必須要維持在0.0003的大氣壓以上方可獲得高產量。
(二)近紅外光譜分析技術
近紅外光譜分析技術(Near Infrared Spectroscopy)作為“綠色檢測技術”克服了傳統(tǒng)分析方法檢測速度慢、樣品處理步驟復雜等缺點,被廣泛應用于制藥、食品、石油化工等領域。該技術可根據有機物含氫基團(主要包括C-H,N-H,O-H,S-H)對近紅外光譜吸收的差異區(qū)分不同物質并測定其濃度。NIR光譜儀擁有多種檢測終端,如光纖探頭、液體流通池、積分球等,可以采用透射(透反射、漫透射)、反射(漫反射)等檢測方法進行測定。NIR測定對樣品要求簡單,可以直接測定(一般不進行預處理或者簡單預處理,如除氣和過濾等),且測定速度快,可以進行多理化參數同時分析,結果可靠,非常適合生產中的PAT要求[3]。NIR光譜技術在生物發(fā)酵應用場景整體組成如圖1所示。
圖1 NIR光譜技術在生物發(fā)酵應用場景
二、基于化學計量學的近紅外光譜技術分析
基于化學計量學的近紅外光譜分析的基本信息流程處理環(huán)節(jié)主要有:多元信息采集,多元數據關鍵特征提取及多元數據建模。根據不同環(huán)節(jié)在預測模型性能中的作用,主要有以下幾種技術分析方法。
(一)數據采集
樣本數據采集是近紅外建模分析的第一步,對預測模型關系信息和范圍信息起決定性作用。實際信息采集過程通常包括三個環(huán)節(jié):代表性樣本選擇、光譜信息測量和參比值測量。因此,從以下幾個方面進行數據采集方法的介紹。
1、選擇代表性樣品
選擇具有一定范圍的樣品類型信息,其中樣品的化學范圍信息構成參比值的結構范圍,濃度成分范圍和物理空間范圍分別構成樣品的濃度范圍和空間范圍。簡單說,就是選擇樣品時需要同時考慮深度和縱度,其中深度表示參比值的大小范圍,縱度則表示相同濃度下不同產地或產區(qū)樣品的數目。
2、測定光譜數據
建模數據集中通常包含確定信息和不確定信息,其中確定信息是預測模型關聯中對應于參比值的光譜特征,其可靠程度決定了預測模型的準確度和精確度。確定信息測量一般需要考慮儀器校正、預熱、樣品擺放、光纖是否損壞、燈源(特指鹵鎢燈)是否有效等等,而不確定信息一般是指光譜數據集中各樣品光譜測定所用的儀器參數、進樣參數與環(huán)境參數等可能變動的信息,這些不確定信息的變動范圍決定了預測模型應對樣品光譜測量時的應變能力,即決定了預測模型的穩(wěn)健性。
3、測定參比值
所有光譜定量分析預測模型的基礎是建立光譜變量和參比值之間的關系預測模型,但是近紅外屬于間接測量,其參比值通過標準物樣品的真值獲得,而實際分析過程中則通常是采用標準方法測定建模樣品中的樣品參比值,不同實驗人員的操作規(guī)范性、實驗環(huán)境以及儀器的校正使用都對分析結果產生隨機誤差和系統(tǒng)誤差,導致獲取的參比值通常含有誤差。
(二)數據處理與關聯分析
實驗獲取的近紅外光譜數據在建模之前需要進行預處理,目的是提高數據質量;然后,進行特征工程以壓縮信息規(guī)模,進而提高信息表征能力;最后,基于化學計量學建模分析預測模型。
1、 數據預處理
數據預處理包括很多方面,譬如異常樣本剔除、光譜背景校正、去噪、樣本范圍確定以及樣品參比值正態(tài)分布檢驗。首先,需要考慮異常樣本剔除問題,通常來說,光譜吸光度、參比值偏大或偏小的一般屬于異常樣本,如果兩者同時偏大或偏小,則有可能是異常樣本,也有可能是范圍邊緣樣本,此時需要謹慎對待;然后,對剔除異常樣本的數據進行光譜預處理,主要有歸一化、移動窗口平滑、 SavitZky-Golay(SG)卷積平滑、 SG求導、標準正態(tài)變量校正(SNV)和多元散射校正(MSC)等[4-9],下一步根據文獻確定分析變量的范圍,最終確定建模樣本。
2、數據特征工程
預處理后的光譜數據維度較高,無法直接進行建模分析,需要進行變量的特征工程處理確定特征變量。特征工程泛指從數據中提取需要的特征變量,現有的方法主要有偏 最 小 二 乘 (Partialleast Squares, PLS)、主 成 分 分 析 (Principal Component Analysis,PCA)、線性 判 別 分 析 (Linear Discriminant Analysis,LDA)、正交線性判別分析(Orthogonal Linear Discriminant Analysis,OLDA)等不同方法[10-12],針對不同的對象可采用合適的方法。其中,PCA是目前應用范圍較廣的分析方法之一,但是其解釋性較弱,現在也有應用卷積神經網絡和循環(huán)神經網絡做近紅外光譜分析的,結果通常比較漂亮,但是很難用數學去表達其處理過程。
3、建模與模型應用
近紅外預測模型的最后一步是建模分析及應用,其中建模過程是指建立特征和參比值矩陣的關聯模型,分為線性和非線性方法,對于基于儀器的預測模型而言,所有的工作都集合在一起,整個過程全部都按照設定程序執(zhí)行;對于預測模型應用,通常需要確定分析樣品光譜是否在分析范圍之內。
按照上述思路,基于化學計量學近紅外光譜分析的基本技術思路是:建立與應用容變性的關系模型,以解決光譜變動對分析結果的影響。其中,容變性模型是指關系模型的關系可靠性與模型分析范圍的容變性,即前面所述的關系信息和范圍信息。由圖2可知,相比于常規(guī)光譜分析,近紅外光譜分析過程在建立關系模型的同時,也需要采集與處理模型范圍信息,并根據分析結果進行反向優(yōu)化模型結構和模型參數等,實現模型優(yōu)化。
圖2 常規(guī)光譜分析與近紅外光譜分析技術思路對比
三、近紅外光譜技術在氨基酸發(fā)酵過程應用
(一)近紅外光譜對色氨酸發(fā)酵L-色氨酸質量濃度定量分析預測
文獻[13]提出將偏最小二乘算法(PLS)L-色氨酸近紅外光譜預測模型作為實驗參考對象;采用Tensor37傅里葉近紅外分析儀采集發(fā)酵液近紅外光譜L-色氨酸樣本,采用11種預處理方法處理,選擇不同預處理下最合適波數范圍,結合PLS算法以及的條件下建立最優(yōu)L-色氨酸濃度定量分析預測模型。表1展示了不同光譜預處理方式對應的預測模型性能評估指標結果值。
表1 不同光譜預處理條件下的L-色氨酸濃度最優(yōu)模型
從表1可知,最終選擇模型的構建方法為:預處理方法為二階導數,波數范圍為6101.8-5450cm-1,再結合偏最小二乘算法建立校正模型。二階導數可以消除由于氣泡、細胞的懸濁物存在所引起的基線漂移,加強光譜的微小差異。
(二)近紅外光譜對谷氨酸發(fā)酵乳酸質量濃度定量分析預測
文獻[14]采用近紅外光譜技術結合偏最小二乘的方法建立并優(yōu)化谷氨酸溫度敏感突變株發(fā)酵過程中乳酸濃度預測模型。首先,采用近紅外分析軟件OPUS7.0分別在全圖譜和波數為6000-8000 cm-1條件下利用原始光譜和不同光譜預處理方式,建立和優(yōu)化發(fā)酵液中乳酸濃度校正模型,所得各模型參數如表2所示。
表2 不同光譜預處理和波數范圍條件下乳酸濃度最優(yōu)模型
從表2可知,作為評價模型的重要指標,RMSECV值越小,說明所建模型的預測能力越強;對全圖譜范圍及不同預處理條件下各模型RMSECV值分析后可知,當預處理為1st+SNV時RMSECV值、RPD值以及決定系數(R2)分別為0.822g/L、3.5和0.753,優(yōu)于其他模型;而在波數為6000-8000cm-1范圍內,預處理為1st+SNV時RMSECV值最?。?/span>0.544g/L),說明全圖譜中含有大量噪音,對模型有一定影響,而在6000-8000cm-1范圍內有利于提取光譜有效信息,適合模型的建立。表3展示了在光譜預處理為1st+SNV條件下,選擇不同波數范圍進一步優(yōu)化乳酸濃度校正模型各項參數結果。
表3 1st+SNV條件下不同波數范圍對乳酸濃度模型的影響
從表3可知,模型28中RMSECV值(0.482g/L)低于其他模型,R2為0.912,較模型18有所提高。因此,5500-6000cm-1和4200-4900cm-1兩個特征區(qū)域所蘊含的有效信息有利于模型優(yōu)化。因此,結合偏最小二乘的方法,在光譜預處理為一階導數+矢量歸一化(1st+SNV)、波數為5500-7500cm-1+4200-4900cm-1條件下獲得最優(yōu)乳酸濃度預測模型。
(三)近紅外光譜對異亮氨酸發(fā)酵異亮氨酸質量濃度定量分析預測
文獻[15]提出利用近紅外分析儀和相關近紅外軟件,建立谷氨酸棒桿菌發(fā)酵過程中異亮氨酸質量濃度的近紅外預測模型;采用近紅外分析軟件OPUS7.0,分別在全波長和7400-9100cm-1波數范圍內選擇原始光譜和不同光譜預處理的方法,建立異亮氨酸質量濃度PLS最優(yōu)校正模型,模型各項參數結果如表4所示。
表4 不同光譜預處理的異亮氨酸質量濃度模型
由表4可知,在相同光譜預處理條件下7400-9100cm-1波數范圍內所建立模型RMSECV值均小于全波長;當光譜預處理為減去一條直線時,相比其他預處理RMSECV值最小為1.73g/L,決定系數達到0.997,因此,結合偏最小二乘法,在波數為7400-9100cm-1,減去一條直線作為光譜預處理的條件,獲得異亮氨酸質量濃度最優(yōu)近紅外近紅外預測模型。
四、近紅外光譜技術應用前期與展望
近紅外光譜技術在氨基酸發(fā)酵過程中以物質濃度預測模型為基礎,可以結合代謝網絡定量分析結果、分析菌體生長、產物合成和基質消耗的動力學特征,以溫度、PH值、攪拌轉速及溶解氧濃度等環(huán)境變量為狀態(tài)變量,以底物、重要中間代謝物及目標產物等生化指標變量為證據變量,基于合適時間單位對不確定性、非線性的發(fā)酵過程進行實時建模。為了更好的檢測氨基酸發(fā)酵過程中底物消耗、產物積累等數據,基于化學計量學可以逐步建立和調整獲得最優(yōu)化的氨基酸發(fā)酵過程參數模型數據庫;在發(fā)酵過程中引入近紅外光譜技術可以提高生產過程可控性,實現生產的連續(xù)化,降低成本、提高生產效率,使得產品更加符合GMP要求。
參考文獻:
[1]王志仁.氨基酸發(fā)酵[J].發(fā)酵科技通訊,1981(2):002.
[2]謝微.含氧化合物紅外光譜信息特征的研究[D].四川大學,2006.
[3]嚴衍祿,編.近紅外光譜分析基礎及應用[M].北京:中國輕工業(yè)出版社,2005.
[4] BAITie-cheng,WANGTao,etal.Spectroscopy and Spectral Analysis,2019,39(4):1323-1328.
[5] Anastassia Baxevani,Krzysztof Podgorski.Communications in Statistics-TheoryandMethods,2018,13(2):448.
[6] NikonovA V,Davletshin R V,Iakovleva N I,etal.Journal of Communications Technology and Electronics,2017 on conversion(9):1048.
[7] Tong Peijin,Dua Yiping,Zheng Kaiyi,etal.,Chemometrics and Intelligent Laboratory Systems,2015,143:40.
[8] Li Wenbing,Lu Jidong,Dong Meirong,etal.Energy& Fuels,2018,32(1):24.
[9]Taddeuccia T N,Haighta R C,Leea H Y,etal.Nuclear Data Sheets,2015,123:135.
[10] Mendes T O Junqueira G M A,Porto B L S,etal.JournalofRamanSpectroscopy,2016,47(6):692.
[11] Konstantinos E Parsopoulos,Michael N Vrahatis.Particle Swarm Optimization and Intelligence.1 sted.Hershey,New York:Informa-tion Science Reference,2010.
[12] Qin H,Ma J Y,Chen S J,etc.Infrared Technology,2015,1(37):78.
[13]郭宇飛,蘇毅,徐慶陽.基于近紅外檢測技術建立發(fā)酵過程中L-色氨酸濃度預測模型[J].生物技術通訊,2016(3).
[14]桂勇利,等.基于近紅外技術谷氨酸發(fā)酵過程中乳酸濃度預測模型的建立[J].食品與發(fā)酵工業(yè),2014(8).
[15]郭宇飛,石拓,徐慶陽.異亮氨酸發(fā)酵過程中濃度近紅外預測模型的建立[J].發(fā)酵科技通訊,2017(3).