
目前,我們的日常生活中接觸到的工業化學物質大約超過100,000種,其中一些可能對人體健康產生不利影響。
化學物質的安全性通常通過動物試驗、細胞試驗、微生物試驗等生物檢測來評估。然而,在考慮時間、勞動力、物質成本和動物倫理等多種因素時,以這種方式測試如此大量的化學物質是不現實的。
▌定量構效關系(QSAR)
為了實現可持續發展目標,需要一種能夠迅速準確識別有害化學物質的有效篩選工具。定量構效關系(Quantitative Structure Activity Relationships,QSAR)是一種計算機模擬方法,它主要基于各種分子描述符和模型算法,建立化合物的結構與其理化性質,生物學活性,毒理學效應,環境行為和歸趨等的定性/定量關系,即根據目標物質的化學結構特征預測其生理效應或理化性質等,具有快速高效的特點,能夠有效節約測試成本。
QSAR是目前國內外一個活躍的研究領域,美國環境保護署(United States Environmental Protection Agency,簡稱US EPA)就基于QSAR開發了針對化學物質毒性預測的軟件——Toxicity Estimation Software Tool (T.E.S.T)。
▌T.E.S.T
T.E.S.T軟件可根據大量的數據處理和統計識別目標化合物中潛在的有毒基團,還能快速地分析與目標物質結構相似的化合物的毒性,進一步綜合預測目標物質的毒性。
T.E.S.T界面簡潔,操作簡單,并且軟件內配有指南,易上手,用戶可通過CAS號、SMILES碼、物質名稱、InChi碼、DTXSID或是手動繪制載入化學物質結構,然后選定預測終點與方法,更改結果輸出路徑后即可進行預測,軟件預測完畢會自動生成結果報告。

T.E.S.T軟件用戶界面與基本操作流程
T.E.S.T的預測終點包括毒性和理化性質兩大類別。
毒性預測終點:
預測終點 | 介紹 |
LC50(Fathead minnow 96-hr) | 96小時導致50%黑頭呆魚(Fathead minnow)死亡的水中試驗化學物質濃度(mg/L)。 |
LC50(D. magna 48-hr) | 48小時導致50%大型蚤(Daphnia magna)死亡的水中試驗化學物質濃度(mg/L)。 |
LC50(T. pyriformis 48-hr) | 48小時對50%梨形四膜蟲(Tetrahymena pyriformis)生長產生抑制作用的水中試驗化學物質濃度(mg/L)。 |
LC50(Oral rat) | 導致50%的大鼠口服后死亡的化學物質量 (mg/kg bw)。 |
生物富集因子 (Bioaccumulation factor) | 達到平衡狀態時,化合物在生物體內濃度與環境介質中濃度的比值。 |
發育毒性 (Developmental toxicity) | 化學物質是否會對人類或動物產生發育毒性效應。 |
鼠傷寒沙門氏桿菌回復突變試驗 (Ames mutagenicity) | 如果化學物質在鼠傷寒沙門菌菌株(Salmonella typhimurium)中誘導回復突變菌落生長,則該化合物為致突變物。 |
理化性質預測終點:
預測終點 | 介紹 |
標準沸點 (Normal boiling poin) | 化學物質在標準大氣壓(1個大氣壓)下沸騰的溫度(℃) |
蒸汽壓 (Vapor pressure) | 在25℃的密閉條件中,與固體或液體處于相平衡的蒸氣所具有的壓強(mmHg)。 |
熔點 (Melting point) | 化學物質從固體變為液體的溫度(℃)。 |
閃點 (Flash point) | 化學物質與外界空氣形成混合氣與火焰接觸時發生閃火并立刻燃燒的最低溫度 |
密度 (Density) | 單位體積質量(g/cm3) |
表面張力 (Surface tension) | 液體表面層由于分子引力不均衡而產生的沿表面作用于任一界線上的張力(dyn/cm)。 |
熱導率 (Thermal conductivity) | 物質傳導熱量能力的量度值 (mW/mK)。 |
黏度 (Viscosity) | 流體對流動所表現的阻力(cP) |
水溶性 (Water solubility) | 化學物質溶于液態水中形成均相溶液的濃度(mg/L)。 |
預測方法:
T.E.S.T內包含了Chi連接指數、Kappa形狀指數、2D結構特征等14類,共計797個描述符。
同時,T.E.S.T的預測方法有5種,即層次聚類法、單一模型法、基團貢獻計算法、最近鄰法、一致性評價方法。用戶可依據自身需求選擇和合適的預測方法來增加預測結果的可信度。
方法 | 介紹 |
層次聚類法 (Hierarchical method) | 使用來自幾種不同聚類模型的預測加權平均值來預測化學物質的毒性。 |
單一模型法 (Single model method) | 使用適合訓練集的多元線性回歸模型進行預測(使用分子描述符作為獨立變量)。 |
基團貢獻計算法 (Group contribution method) | 使用適合訓練集的多元線性回歸模型進行預測(使用分子片段計數作為獨立變量)。 |
最近鄰法 (Nearest neighbor method) | 通過取訓練集中與測試化學物質最相似的3種化學物質的平均值來預測目標化學物質的毒性。 |
一致性評價方法 (Consensus method) | 通過取上述QSAR方法預測毒性的平均值來預測化學物質的毒性(預測結果在各自方法的適用范圍內)。 |
模型擬合度:
用戶在進行QSAR預測時往往最關心的是預測結果的準確性。T.E.S.T.指南文件指出,如果QSAR模型滿足以下條件,則認為該模型具有可接受的預測能力:

R2是真實值與預測值之間的相關系數(即為不過原點回歸時相關系數的平方),R02是回歸曲線截距為零時真實值和預測值之間的相關系數(即為過原點回歸時相關系數的平方),k是回歸曲線截距為零時的回歸方程系數。公式(1)(2)都是對線性回歸模型的擬合度量,滿足(1)(2)公式條件,即說明模型擬合度較好,具有良好的預測能力。
指南文件介紹了軟件中各個QSAR模型的統計參數,本文以LC50(fathead minnow 96-hr)毒性終點和標準沸點(Normal boiling point)的測試集結果為例介紹T.E.S.T中的模型性能。
LC50(fathead minnow 96-hr)測試集結果:


LC50(fathead minnow 96-hr)測試集結果顯示,五種方法的R2均滿足公式(1)的條件,且一致性評價方法的結果最好。單一模型法、基團貢獻計算法、一致性評價方法不滿足公式(2)的條件。
依據T. E. S. T.指南指出不滿足這些條件的模型本身并非絕對無效的,其預測結果是相對保守的,應該謹慎使用。
標準沸點(Normal boiling poin)測試集結果:


單一模型法不適用于標準沸點的預測,因此沒有其測試集結果,其余四種方法的三種指標均符合公式(1)(2)的條件。總的來說,標準沸點的測試集預測統計整體是很好的。
應用域介紹:
對于一個可靠的QSAR預測結果而言除了關注模型預測能力外,還需確定目標化合物是否在該模型的應用域范圍內。應用域的功能就是界定能夠被QSAR模型可靠預測的化合物,也可理解為模型適用化合物的集合,通常可通過可從4方面來表征模型的應用域:
①描述符變化范圍;②結構相似性;③機理相似性;④代謝轉化途徑和產物,
若目標化合物的上述特征在QSAR模型的應用域內,則預測結果具有良好的可靠性;反之,則預測結果不具備良好的可靠性。
以3-氯-2-甲基苯胺(CAS:87-60-5)的IGC50(T. pyriformis 48-hr)預測為例,如下圖所示,3-氯-2-甲基苯胺均在層次聚類法建立的多個預測模型的應用域范圍內,即Applicability Domain的一列結果均為“OK”,因此模型的總體預測結果相對可靠。
若目標化合物預測結果此列并非“OK”,而顯示為“Rmax constraint not met”、“Model ellipsoid constraint not met”或是某個結構片段超出應用域范圍,其預測結果須謹慎使用。

綜上所述,T.E.S.T是一款由US EPA官方研究開發的QSAR毒性預測軟件,可以根據化合物的結構信息預測其潛在毒性及理化性質,其中包括較為常見的7種毒性預測終點和9種理化性質預測終點,并且具有5種預測方法,預測能力較好,結果可信度較高,但在使用的過程中仍需要對目標物質和預測結果進行專家評估以得出專業準確的結論。
在使用方面,軟件整體安裝簡單,操作便捷,用戶界面友好,并且配有較為詳細的用戶指南。隨著US EPA地不斷更新與完善,目前TSET已經更新至5.1.2版本,適用于Windows和macOS系統。更詳細的內容請參考軟件指南User’s Guide for T. E. S. T. (Toxicity Estimation Software Tool) Version 5.1。
軟件鏈接:Toxicity Estimation Software Tool (T.E.S.T) | US EPA

參考文獻:
[1] Honma M. An assessment of mutagenicity of chemical substances by (quantitative) structure-activity relationship. Genes Environ. 2020;42:23.
[2] De P, Kar S, Ambure P, et al. Prediction reliability of QSAR models: an overview of various validation tools. Arch Toxicol. 2022;96(5):1279-1295.
[3] U.S. EPA (2020). User’s Guide for T.E.S.T (version 5.1) (Toxicity Estimation Software Tool): A Program to Estimate Toxicity from Molecular Structure.
[4] 唐睿,張松林,粱云明,等. 毒性評估軟件T.E.S.T及其在農業污染化合物QSAR研究中的應用[J]. 安徽農業科學,2010,38(36):20878-20879,20882
[5] US EPA. Environmental Optimization Using the Waste Reduction Algorithm. 2011 4/18/16]; Available from: nepis.epa.gov/Exe/ZyPURL.cgi?Dockey=P100DZKT.TXT.
[6] Martin TM, Harten P, Young DM, et al. Does rational selection of training and test sets improve the outcome of QSAR modeling?. J Chem Inf Model. 2012;52(10):2570-2578.
[7] 王中鈺,陳景文,傅志強,等.QSAR模型應用域的表征方法[J].科學通報,2022,67(3):255-266.
[8] 陳景文,李雪花,于海瀛,王亞南,喬顯亮.面向毒害有機物生態風險評價的(Q)SAR技術:進展與展望[J].中國科學(6期):461-474[2024-01-16]
※ 以勒申明:
本文內容來源:由以勒標準翻譯整理。以勒標準尊重知識產權,如轉載內容涉及版權問題,煩請聯系我們及時處理。翻譯/整理不易,凡轉載或引用本網站內容,請注明來源:杭州以勒標準,感謝您的支持!更多法規資訊實時跟蹤,可搜索“以勒標準”官方微信公眾號,獲取第一手法規資訊,掌握最佳貿易時機!
< 上一個:專家文章|走進計算毒理學:QSAR從原理到應用
> 下一個:ICH M7(R2)指導原則的介紹與解讀
0571-8519 0521
157875742
infor@jirehstandard.com