基因體研究技術概論


講題: Mole
cular Modeling.   June 12, 2001

以類比方法 ( Homology ) 預測蛋白質分子三維結構

本章的目的:
基本觀念部份

應用部份:


目錄:

第一節 緒論
第二節 類比方法的原理與程序
第三節 Biosym 的類比方法實例練習
第四節 Swiss-Model 的結構預測實例練習
第五節 Modeler 的結構預測實例練習
 


第一節 緒論

在分子生物實驗中,蛋白質和核甘酸的序列鑑定已經是一個例行的工作。根據Protein Identification Newsletter 的統計,每年被鑑定出的蛋白質序列資料數遠超過被解讀出三維結構的蛋白質分子資料數。這是因為要解出一個蛋白質分子的三維結構,必需具有完備的x-光晶體或是多維度NMR光譜實驗分析結果。但是,蛋白質分子的性質,例如: 純化程度,量的多寡,溶解度,….等等,這些都是決定是否能夠獲得有效分析結果的因素。通常分子生物實驗相當耗時,不一定能夠獲得結果。所以有許多蛋白質分子有詳細的序列資料,但是,其三維結構仍然未被解出。

當前一些結構生物學家最感興趣的是想藉著由蛋白質分子的胺基酸序列來預測其三維結構。目前一般用來預測蛋白質分子結構的流程,彙整於(圖一)。本章僅討論類比方法,其他方法將在高階課程中討論。本章使用的方法為啟發式 ( heuristic ) 的類比方法 ( Homology ),這方法使用已知蛋白質分子(參考蛋白質分子)結構的資料與分子動力學的運算來預測未知蛋白質分子(目標蛋白質分子)的結構。這個方法的基本假設為未知蛋白質分子與已知蛋白質分子的結構是相似的(Homologous)屬相同種源,可以直接地取已知蛋白質分子的骨架,來當作未知蛋白質分子的模板(Template)。目前蛋白質分子的結構資料庫如Brookhaven Protein Data Bank,約有5000個蛋白質分子的結構資料,可以提供相關資料作為類比方法的比較。

建立一個合理的蛋白質分子模型,需符合下列條件:

1.  可靠的或可信度高的
2.  能夠和x-光晶體或是多維度NMR光譜實驗分析結果比較
3.  能夠符合實驗結果及蛋白質分子結構的特徵
4.  能夠提供分子結構與生物功能之間關係的詳細資料
 


 

(圖一)
摘自  http://www.bmm.icnet.uk/people/rob/CCP11BBS/
 
 


第二節 類比方法的原理與程序

啟發式的類比方法是根據目標蛋白質分子與已知蛋白質分子屬相同種源,利用已知蛋白質分子結構的資料,配合能量最佳化及分子力學的運算,來預測未知結構蛋白質分子的結構。
蛋白質分子的三級摺疊結構主要是由二級的結構單位?螺旋、?摺片、鬆散分子鏈和轉折堆積排列構成。一般蛋白質分子核心部份的分子骨幹由不包含鬆散分子鏈的二級結構單位密集堆積而成。如此方式蛋白質立體堆積排列的自由度相對提高。實際上,蛋白質分子的三級摺疊方式並不多,屬相同種源的蛋白質分子結構有相當程度的穩定度和相似的三級摺疊式樣,不會因其中某些胺基酸被取代或更換而有太大的變化。若將兩具有序列類比程度的胺基酸序列做某些胺基酸的取代或更換,其分子結構上的類比關係仍然存在。不會因分子核心某些胺基酸被更換而影響三級摺疊的特徵,但是其物理化學的性質會受到影響。以水溶性的球形蛋白質為例,其內部核心緊密多為厭水性的胺基酸序列,而在蛋白質分子的表面則多為親水性的胺基酸序列。根據這些特性及已知的資料,尋找結構守恆區域建立目標蛋白質分子的骨幹,亦即取已知蛋白質分子的骨架,來當作目標蛋白質分子的模板。
以類比方法建立一個蛋白質分子模型的原理與程序,可分成下列七個步驟:
 

1. 選擇適當的參考蛋白質分子 -- Reference Proteins
2. 決定結構守恆區域 -- Structurally Conserved Regions (SCRs)
3. 對齊目標蛋白質分子和參考蛋白質分子的胺基酸序列 -- Alignment
4. 根據結構守恆區域建立目標蛋白質分子的骨幹
5. 產生各結構守恆區域之間鬆散分子鏈的結構 -- Loop, Turn
6. 目標蛋白質分子結構修正微調
7. 三維分子結構的驗證
 
 

步驟一:選擇適當的參考蛋白質分子

假如參考蛋白質分子尚未知,則可以由下列兩個資料來源尋找:Protein Sequence Databases (NBRF和Swiss-Prot)和DNA Databases (Genbank 和EMBL Data Library)。(範例二 之3)是一個序列資料尋找操作過程的實例。選擇適當的參考蛋白質分子時,要考慮參考蛋白質分子和目標蛋白質分子的序列類比程度及已知參考蛋白質分子結構的準確度。一個合理的模型建立至少需已知一個參考蛋白質分子結構及序列類比程度高於25%以上,否則單以類比方法來建立合理模型成功率不高,需要藉助其他方法,如圖一流程或實驗配合。
 

步驟二:決定參考蛋白質分子的結構守恆區和對齊目標蛋白質和參考蛋白質分子的胺基酸序列

一般屬相同種源的蛋白質分子間具有結構守恆的特性。當序列相等百分比值愈高表示參考蛋白質分子相似性愈高。多數雙硫鍵(Cys-Cys)的位置是絕對守恆的。結構非守恆區多發生在鬆散分子鏈及分子表面上。利用對齊目標蛋白質和參考蛋白質分子的胺基酸序列來決定目標蛋白質分子序列中所對應於核心分子骨幹及鬆散分子鏈的各個段落,對產生正確三維結構有關鍵性的影響。序列類比程度愈高愈容易找到對齊兩序列的參考點。當序列類比程度大於50%時,很容易將兩序列對齊。可以利用已發展出的程式,例如:BLAST、Modeler、Profile-3D等等,可以將對齊兩胺基酸序列的工作自動化。類比程度低於50%時,則需充分資料或實驗配合才能得到可靠的對齊序列。在進行序列類比的比對時,主要困難之處在於確認序列中適當的基準點。這些基準點必須都同時存在於參考和目標蛋白質分子胺基酸序列之中,並具有結構和功能上的重要性,這些基準點提供兩蛋白質分子正確的結構對應關係。找尋基準點的方法有:將參考及目標蛋白質分子與同種源內其他蛋白質分子序列排列比對,以各序列對應相同的序列段落作為基準點,再將比對的參考蛋白質分子的結構重疊,確認出雙硫鍵的位置,或進行特定位置的胺基酸更換,或在參考和目標蛋白質分子做生物活性測量實驗等等,都有助於基準點的確認。在對齊兩胺基酸序列時,只有在轉折和鬆散分子鏈的區域內才可進行胺基酸段落的插入、刪除和更換,厭水性的胺基酸大多限制在蛋白質分子核心部份的分子骨幹上。

當類比程度小於25%時,要將兩胺基酸序列對齊是相當困難的,需利用其他方法輔助來尋找足夠數目的基準點,來建立兩序列合理的結構對應關係,這些方法如流程圖一,包括決定序列一級結構式樣、光譜實驗分析估計二級結構單位的數量、預測二級結構、和蛋白質摺疊辨認及分類等等。當類比程度低於10%時,唯使用先驗式方法可以能量函數計算出可能的分子構形。當類比程度很低時,可以同時找幾個合理的胺基酸序列對齊的方式,再根據這幾個對齊的方式建立幾個分子模型,然後再以實驗或蛋白質特性來篩選出一個合理正確的模型。
 

步驟三:根據結構守恆區域建立目標蛋白質分子的骨幹

利用參考分子的核心部份分子骨幹的結構為基礎,將胺基酸換成目標蛋白質分子對應位置的胺基酸。在核心部份分子骨幹上,胺基酸更換只會改變分子二級結構的相對位置和取向,不會影響三級摺疊結構的一般特性。通常在這個區域要做間斷區的插入或胺基酸刪除的機率很小,經修改後可再利用位能函數來調整各胺基酸的位置。為避免造成分子核心部份分子骨幹結構的重大改變,這部份的修改是胺基酸分別逐一進行的。進行胺基酸插入或更換時,要同時決定該胺基酸支鏈部份的位置。被更換胺基酸支鏈部份的一個或多個扭角χ的值是採用原參考分子所對應胺基酸支鏈部份的扭角值。支鏈中其他部份的扭角值,則從蛋白質結構資料庫中找最合理的值代入。外加入胺基酸時,其支鏈部份的所有扭角值都給予適當的數值。當所有原子都給予座標值之後,再以分子力學能量最小化方法來消除原子重疊的問題。
 

步驟四:產生各結構守恆區域之間鬆散分子鏈的結構

目前用來決定鬆散分子鏈的原子座標有三種方法:(1)假如其中的參考蛋白質分子與目標蛋白質分子的鬆散分子鏈相同長度而且互相對應,則我們可以直接複製參考蛋白質分子的座標給目標蛋白質分子。(2)由已知結構資料庫中搜尋,找出符合此段最相似的結構,再複製此段座標給目標蛋白質分子。(3)重新產生一個分子鏈(de novo),此方法是利用能量計算方式產生合理的原子座標。
方法(1)和(2)皆是直接由資料庫搜尋的方法很快,能產生4~6個胺基酸的分子鏈,或由重複出現的結構式樣中相等大小的分子鏈之結構中找尋,這方法的適用範圍受限於已知蛋白質結構資料庫的應用。一般小段的序列具較小的分子構形空間,容易在已知蛋白質結構資料庫中找尋,比較適合這種方法。並且以能量計算方法計算這分子片段合理的分子構形空間中重要的區域,以系統式或隨機式的方式進行搜尋,用這種方式可建立長度到9個胺基酸序列的分子鏈,同時可產生和已知相似結構以外的分子構形,增加結構的多樣性。

長段序列具較大的分子構形空間,以能量計算方法計算這分子片段合理的分子構形空間需要很大的計算量。要減低計算量,這部份的計算可分成兩個過程,第一部份僅考慮分子骨幹部份忽略支鏈部份,如glycine和proline的支鏈部份保留到碳原子,其他皆以alanine處理,然後做能量最小化計算,找出合理的分子骨幹構形。第二部份再考慮將支鏈部份結構,以能量最小化的方式計算各支鏈部份的分子構形。同時必須考慮鄰近支鏈部份的影響,需將所有鄰近支鏈同時處理。可用模擬退火法(Simulated Annealing)來得到合理的最低能量分子構形。因為蛋白質分子鬆散部份的分子鏈大多出現在分子的表層部份,在決定這部份的分子構形時要考慮和溶劑分子的作用。

一般資料庫搜尋和能量計算方法是配合使用的。先由資料庫提供近似的結構再以能量最小化或分子運動方法做調整。在搜尋的過程中也可配合能量計算增加搜尋的效率。通常蛋白質分子的主要活性位置多在核心區,鬆散部份的重要性不如核心部份的重要性,例如酵素分子的活性位置具有關鍵性,這些活性區域通常不是在表層鬆散的部份,因此鬆散部份結構的準確程度對於某些分子結構和功能關係之研究影響不大。
 

步驟五:目標蛋白質分子結構修正微調

這個步驟包含蛋白質分子N- 和C- 端座標的產生,檢查van der Waals重疊區,測量重疊的原子距離如果有嚴重的重疊可以稍微調整,移動支鏈,片段修補結構守恆區與鬆散分子鏈或結構守恆區與結構守恆區間的鍵長及扭角角度的修正,可以執行能量最小化及分子動力學方法來修正此段達到合理化,重複步驟將所有的片段修補。弛緩鬆散分子鏈間立體重疊區域,亦可以執行能量最小化及分子動力學方法來修正此段達到合理化,重複步驟將所有的鬆散分子鏈間立體重疊區域修補。

在產生鬆散分子鏈結構階段可能得到數個合理的分子構形,若不只一段的分子鏈各具有幾種可能的分子構形,則要考慮各段落分子構形的組合構形,再進行整體的結構調整和修正。若鬆散部份的結構來自資料庫,資料庫現存的資料可能無法適當代表可用的分子構形空間,因此要在這個階段利用分子運動學方法來修改分子結構,並藉此辨出能量最低的分子構形。
 

步驟六:三維分子結構的驗證

利用類比方法建立分子模型的準確度必須能夠和x-光晶體或是多維度NMR光譜實驗分析結果比較及和該蛋白質已知的實驗數據比較和評估,例如與溶劑分子的接觸性,二級結構單位的堆積密度,厭水性或親水性,電荷分佈或極性胺基酸的位置,分子靜電位場分佈和溶解自由能等等實驗測量值有助於檢驗預測的分子模型是否合理。另外用分子動力學方法來探測是否所得到的分子構形是在穩定的能量最小的區域或是在很淺的局部能量最小區域,也有助於檢驗預測的分子模型是否合理,以上這六個步驟是一個週期,需要反覆幾次的預測和校正檢驗的程序,最後才得到可靠的分子模型。
 


第三節 Biosym 的類比方法實例練習

首先,確定所使用的工作站已經裝有InsightII/Biosym,Homology/Biosym,Protein Database和Sequence Database。

範例一: 建立一個Baboon Alpha Lactalbumin (ALC) 蛋白質分子模型

目標蛋白質分子資料: alc.seq
 參考蛋白質分子資料: C型lysozymes: pdb1lyz.ent, pdb1ihl.ent, pdb1hel.ent, pdb1ghl.ent, pdb1lz1.ent

Step 1: 進入SGI的UNIX操作系統

 (出現InsightII視窗,在視窗左上方Module點一下,出現模組一欄,在 Homology 模組點一下,即出現Homology的模組功能列在InsightII視窗正上方的第二列,如圖二。)
 Module ? <Biosym /Homology>
 

 Step 2: 讀取參考蛋白質分子結構與目標蛋白質分子序列資料

 Viewer Module  < Molecule/Get>
 Get File Type: PDB ON
 File name: pdb1lyz.ent, pdb1ihl.ent, pdb1hel.ent, pdb1ghl.ent, pdb1lz1.ent
 Execute
 或<File/Restore_Folder>
 Folder name: Homology_lyso.psv
 Execute
 (所選取的五種參考蛋白質分子三維結構顯示在螢幕中。)

 Homology Module  <Sequences/Extract>
 Extract Molec Name: *
 Execute
 (所有參考蛋白質分子的序列顯示在序列視窗中,以大寫表示有原子座標。)
 <Sequences/Get>
 Files: alc.seq
 Execute
 (所選取目標蛋白質分子的序列顯示在序列視窗中,以小寫表示無原子座標。見圖三。)
 

 Step 3: 對齊參考蛋白質分子序列與重疊結構守恆區域

 根據結構相似性(Structural Similarity),使用<Alignment/Structure>去對齊參考蛋白質分子間的序列,然後重疊(Superimpose)結構守恆區域。
 Homology Module  <Alignment/Structure>
 Mode: Automatic
 Seq to Align 1: LH1
 Seq to Align 2: L
 Seq to Align 3: IHL
 etc.
 Execute
 Cancel

 (在圖形視窗中參考蛋白質分子將會重疊一起,圖四TBL_RMS_FAMILY的視窗出現,圖表中每一格表示結構間的RMS值,左上格的RMS值表示平均值。RMS值小於1 ? 表示參考蛋白質分子間有高度的結構守恆特性。在資料區中顯示序列相等值愈高表示參考蛋白質分子相似性愈高。此例:RMS deviation=0.6318及99.2%序列相等值。並且雙硫鍵(Csy-Csy)的位置是絕對守恆的,可以由圖形看出。在序列視窗中,序列將會自動對齊。在結構守恆區建立框格,並且重疊結構守恆區。結構非守恆區大多發生在鬆散分子鍊及表面上,可以藉由參數的調整來提昇結構守恆。)
 

 Step 4: 對齊目標蛋白質分子與參考蛋白質分子序列,尋找結構守恆區域

 根據序列相似性(Sequences Similarity)對齊目標蛋白質分子序列與參考蛋白質分子序列,然後尋找結構守恆區域。
Homology Module  <Alignment/Pairwise_Sequence>
   Seq. Align Mode: Automatic
   Scoring Matrix: Mutation
   Seq. 1: ALC
   Seq. 2: LZ1
   Gap Penalty: 6
   Gap length penalty: 1.65
   Execute

在資料區顯示序列相等的百分比,例如ALC與LZ1有37.7%序列相等。執行時會自動插入或刪除間斷區(Gap)在結構非守恆區。Gap penalty是一個啟發式的參數,他能夠在序列對齊時決定間斷區插入或刪除的可能性。Gap penalty太低時會造成重疊區域有偏差,可以提高此值來修正偏差。最佳的Gap penalty值與序列的關係及使用運算的Scoring矩陣有關。
可以藉由<Molecule/Color>來檢查突變胺基酸的環境與性質及間斷區的插入或刪除是否合理,否則改變參數再重新<Alignment/Pairwise_Sequence> 一遍,例如:LZ1的13、14(KR)位置對應在ALC為Gap,由圖形檢查13、14(KR)位在分子表面上直接與溶劑接觸,允許Gap產生對應在ALC上。同理LZ1的120、126(QD)位在分子表面上直接與溶劑接觸,對應在ALC為Gap合理。然而,LZ1的31位在分子內部及3條螺旋鍊中,不適合插入間隔影響分子結構堆積的緊密度。改變Gap penalty為10,則LZ1的31位置對應的Gap消除了。通常極性的胺基酸多在表面,而非極性的胺基酸多在蛋白質分子內部。見圖五。
 

 Step 5: 產生目標蛋白質分子結構守恆區域的座標

 將序列框格固定化,以利下一步座標的決定。
Homology Module  <Boxes/Initialize >
   Residue Number 1: ALC: (目標蛋白質分子的胺基酸)
   Residue Number 2: LZ1: (參考蛋白質分子的胺基酸)
   Execute
(在資料區內有similarity score值表示被框起的區段相似性的程度,高的similarity score值表示被框起的區段相似性的程度愈高。將序列框格向左右延展直到達到最高的similarity score值。)
Homology Module  <Boxes/Freeze>
   Box Number: *
   Execute

Homology Module  <Sequences/Assigncoords>
   segment definition: SCR
   Box Number: 5
   Execute
(以序列框格為主,直接複製參考蛋白質分子的座標給目標蛋白質分子。)
 

Step 6: 鬆散分子鏈(Loop)結構非守恆區域座標的產生

決定鬆散分子鏈的座標有三個方法:

(1)  假如其中的參考蛋白質分子與目標蛋白質分子的鬆散分子鏈相同長度而且互相對應,則我們可以直接複製參考蛋白質分子的座標給目標蛋白質分子。
 如果方法(1)不能適用,則可以採用下列方法(2)或(3):

(2)  由已知結構資料(Protein DataBank)中尋找,找出符合此段最相似的結構,再複製此段座標給目標蛋白質分子。
Homology Module  <Loop/Search>
Start residue: ALC:10
Stop residue: ALC:14
Flex Residues: 3
Preflex Residues: 7
Postflex Residues: 9
Execute

(3)  重新產生一個分子鏈(de novo)。
Homology Module  <Loop/Generate>
Start residue: ALC:10
Stop residue: ALC:14
Flex Residues: 3
Convergence: 0.05
Internal Overlap: 0.8
External Overlap: 0.8
Closure Iterations: 1000
Execute
Homology Module  <Loop/Display>
Display loop 1 ON
<Loop/AssignCoords>
Execute

重複(2)或(3)的步驟將所有的鬆散分子鏈建立,可以Energy minimization,Molecular dynamics,Conformational searches和Side chain rotamer來修正此段達到合理化。見圖六。
 

Step 7 : 結構的修正與微調

N- 和C- 端座標的產生:
Homology Module  <Refine/EndRepair>
Sequence Molecule: ALC
Execute

檢查van der Waals Overlaps:
Viewer Module  <Measure/Bump>
Monitor Off
Bump Option: Intra
Molecule Spec: ALC
Overlap: 0.8
Execute
(在資料區顯示重疊的原子位置。)

顯示重疊區域:測量資料區重疊的原子距離
Viewer Module  <Molecule/Color>
<Measure/Distance>
Monitor On
Monitor Mode : Add
Execute

移動支鏈:
Viewer Module  <Transform/Torsion >
Definition Mode: Outward
Torsion Atom 1 and Atom 2
<F7>調Torsion angle
儲存新的支鏈座標:<Transform/Torsion >
Torsion Operation: Clear
Update Mode: Keep
Bump_Check: On
如果有嚴重的重疊區可以<Builder/Modify/Geometry>調整。

片段修補:SCR與LOOP或SCR與SCR間鍵長及扭角角度的修正
<Refine/SpliceRepair>
  Activation: Add
  Subset Groups: All
可以執行DISCOVER來修正此段達到合理化,重複步驟將所有的片段修補。

弛緩鬆散分子鏈間立體重疊區域:
Homology Module  <Refine/Relax>
   Sequence Molecue: Object
   relaxsubset: Loop_All_Atoms
   Activation: Add /clear /delete /list
   Execute
   Run DISCOVER
可以執行DISCOVER來修正此段達到合理化,重複步驟將所有的鬆散分子鏈間立體重疊區域修補。

鬆散分子鏈間的結構探討:尋找最佳化結構(Global minimized)
Homology Module  <Refine/Explore >
   Sequence Molecule: Object
   Sutset name: Loop
   Number of Cycles: 5
   Computation Mode: Command File
   Execute
   Run DISCOVER
(比較弛緩前後鬆散分子鏈立體結構分析。)
 

Step 8 : 目標蛋白質分子結構與X-光晶體結構的比較

Viewer Module  <Molecule/Get>
Molecule: pdb1alc.ent
Execute
以 <Object/Blank> 將其他分子隱藏
<Transform/Superimpose>
Superposition mode: Trace
Source spec:
Target spec:
Execute

在資料顯示區有RMS值比較。見圖七和圖八。
 
 


第四節 Swiss-Model 的結構預測實例練習

首先,確定所使用的電腦能上網路及裝有Netscape,我們將由網路上提供的工具來建立蛋白質分子的三維結構。

範例二:建立mouse FAS antigene ligand 蛋白質分子模型

1). 由Netscape進入Swiss-Model系統

 http://expasy.hcuge.ch/swissmod/SWISS-MODEL.html
Swiss-Model: An Automated Knowledge-based Protein Modelling Server

2). 由Swiss-Protein Database獲得mouse FAS antigene ligand 蛋白質分子的序列

http://expasy.hcuge.ch/cgi-bin/sprot-swmodel-sub?FASL_MOUSE
http://expasy.hcuge.ch/cgi-bin/get-sprot-entry?P41047
或Swiss-Model/SWISS-MODEL REPOSITORY

3). 選擇已知參考蛋白質分子作為模版(Template)(Search)

http://expasy.hcuge.ch/swissmod/SM-BLAST.html
或Swiss-Model/Search
進入 SWISS-MODEL Blast-Find the Appropriate Modelling Template
 Enter Sequence in FASTA format: (貼上或輸入要分析的序列)
 Submit Request(按一下即開始尋找,有一資料頁顯示SWISS-
MODEL template Selection: Select among these templates to submit a modelling request。)

4). 填入有關資料,遞出SWISS-MODEL的申請 (First Approach model)

http://expasy.hcuge.ch/swissmod/PROMODSERV.html
或Swiss-Model/First Approach model
進入 Create and Send a SWISS-MODEL Request

輸入E-mail address: yourname@school.edu.tw
 Name: Yourname
 Title of Request: FASL
 以下擇一填入:

 1. Swiss-Prot ID code to model: P41047
 2. Raw Protein Sequence: (由此貼上或輸入要分析的序列)
 Result Options: Verbose or Short
 Send Request(按一下即開始執行,有一資料頁顯示提出是否完成。)

產生幾個結果檔案標題如下,內容省略之:

(1)  Subject: Welcome_to_SwissModel
(2)  Subject: SwissModel-Build-AAAa13898 (ProMod command file) 見圖九。
(3)  Subject: SwissModel-SeqAli-AAAa13898 (Multiple Sequence Alignment file)
(4)  Subject: SwissModel-ProsaII-AAAa13898
(5)  Subject: SwissModel-LastModelProfile-AAAa13898
(6)  Subject: SwissModel-BlastRes-AAAa13898
(7)  Subject: SwissModel-FastaLog-AAAa13898
(8)  Subject: SwissModel-LastModelProsaII-AAAa13898
(9)  Subject: SwissModel-LastModel-AAAa13898

檔案(9)含有建立的蛋白質原子的座標及所使用參考分子的相關資料。
利用InsightII <Molecule/Get>和<Display>,可以將蛋白質分子顯示出。
 

問題一:摘自http://expasy.hcuge.ch/swissmod/SM_FAQ.html
Do I need to optimise my model with the OPTIMISE mode?
This mode is useful only if you are not satisfied with the automated sequence alignment generated by Swiss-Model.

5). 獲得結構最佳化模型,遞出申請表 (OPTIMISE mode)

http://expasy.hcuge.ch/swissmod/PROMODSERVO.html
或Swiss-Model/Optimise models
進入?Create and Send a SWISS-MODEL Request?
輸入E-mail address: yourname@school.edu.tw
 Name: Yourname
 Title of Request: FASL
 Sequence Alignment file in ProMod format: (貼上由First Approach
modelling產生的Multiple sequence alignment file:SwissModel-SeqAli-AAAa13898)
 ProMod command file: (貼上由First Approach modelling產生的
ProMod command file:SwissModel-Build-AAAa13898)
 Result Options: Verbose or Short
 Send Request(按一下即開始執行,有一資料頁顯示提出成功。)
產生的分析結果,請自行與First Approach model的結果比較。
 

範例三:在PC/Macintosh上應用類比方法,建立mouse FAS antigene ligand 蛋白質分子模型

利用Swiss-Pdb Viewer程式顯示分子結構與分析生物活性位置。
由http://www.expasy.ch/spdbv/mainpage.htm
或Swiss-Model/Swiss-Pdb Viewer
按一下(Download) 取得Swiss-Pdb Viewer 2.2程式軟体,安裝在個人電腦上
按一下spdbv22.exe  開始執行,進入SPdbV22視窗。
 

實例自行練習:

(以下部份摘自http://www.pdb.bnl.gov/expasy/spdbv/text/modeling.htm)

Tutorial : Homology Modelling

In this example, we will make a model for the part of the mouse FAS antigene ligand (swissprot entry P41047), which is known to be similar to the tumor necrosis family.

Step by Step
 


A page containing the best templates appears. In this case, 11TNR, and 12TUN.
 


 11TNR and 12TUN should now be superimposed
 


FASL should now be "wrapped" around 11TNR.


Threading FASL onto 11TNR



 
 

You can see that there is a long "false" bond, corresponding to the gap. If you measure this lenght, it should be of 13.940?. You can see that the gap is probably badly placed (considering the appareance of the loop, and the alignment with 12TUN). We will fix this.
 


The gap length is now of 12.088?, and seems better placed. You can now repeat the process with any other parts of the protein, insert gaps if you wish (by selecting the amino-acid where you want to insert a gap and hitting the "space" key) or deleting gaps with the "backspace key". Note however that this will affect the whole alignment, not just the selected part as for the arrows keys.

Validating your alignment and submitting a modelling request
 


第五節 Modeller 的結構預測實例練習

參考來源:http://guitar.rockdefeller.edu/ftp/pub/modeller/modeller4.README

Modeller is a program used for homology or comparative modeling of protein 3D structure by user providing an alignment of a sequence to be modeled with known related structured and Modeller will automatically calculate a full-atom model.

Principle:
Modeller models protein 3D-structure by Satisfaction of spatial restraints of model protein and reference proteins. These restraints include homologous structures(comparative modeling), NMR experiments(NMR refinement), rules of secondary structure packing(combinatorial modeling), cross-linking experiments, fluorescence spectroscopy, image reconstruction in electron microscopy, site-directed mutagenesis, residue-residue or atom-atom potentials of mean force, etc. The optimization is carried out by employing methods of conjugate gradients and molecular dynamics with simulated annealing.

Setup and run automated homology modelling program
Procedures:

1)  Generate a sequence alignment between unknown protein and reference proteins
2)  Setup input for modeler program and background job

Step by Step

1)  Read in reference protein
2)  Read a sequence file of model protein
3)  Align the sequence of the unknown protein to those of the reference proteins
4)  Manually adjust the sequence alignment
5)  Create Modeler input file
6)  Make Modeler batch background job and submit job
 
 


參考文獻:

1. EMBL database; European Molecular Biology Laboratory, Postfach 10.2209, D-6900 Heidelberg, Fed. Republic of Germany.

2. PIR/NBRF database;National Biomedical Research Foundation, Georgetown University Medical Center, USA

3. Protein Identification Newsletter (National Biomedical Tesearch Foundation, USA), 6, 1-2 (1988).

4. GenBand database; IntelliGenetics, Inc., 700E1 Camino Real, Mountain View, CA 94040.

5. Lipman, D.J.; Pearson, W.R. ‘Rapid and Sensitive Protein similarity Searches,’ Science, 227, 1435 (1985).

6. Peitsch, M.C. Protein Modelling by E-mail. Bio/Technology 1995, 13, 658-660.

7. Peitsch, M.C. ProMod and Swiss-Model: Internet-based tools for automated comparative protein modelling. Biochem Soc Trans 1996, 24, 274-279.

8. Blundell, T.L.; Sibanda, B. L.; Sternberg, M.J.E.; Thornton, J.M. ‘Knowledge-based prediction of protein structures and the design of novel molecules,’ Nature, 326, 347 (1987).

9. Blundell, T.L.; Carney, D.; Gardner, S.; Hayes, F.; Howlin, B.; Hubbard, T.; Overington, J.; Singh, D.A.; Sibanda, B.L.;Sutcliff, M. ‘Knowledge-based protein modelling and design’. Eur. J. Biochem., 172, 513 (1988).

10. Biosym, Molecular Simulation Incorporation.

11. Sali, A.; Blundell, T.L. J. Mol. Biol. 234, 779 (1993).