中科院天津工業(yè)生物所攜手亞馬遜云科技推動生物計算設計領域發(fā)展

4月3日消息,近日,中國科學院天津工業(yè)生物技術研究所(以下簡稱天津工業(yè)生物所)與亞馬遜云科技聯(lián)合在天津舉辦“生物計算設計”溝通會,就生物技術與信息技術(BT+IT)結合助力合成生物學發(fā)展的現(xiàn)狀和未來進行溝通交流。

早在2019年天津工業(yè)生物所成立了生物設計中心平臺實驗室,并圍繞生物計算設計開始與亞馬遜云科技共同探索生物技術和信息技術(BT+IT)相結合的技術體系,以進一步推動合成生物學發(fā)展,以期能夠為在健康、能源、農業(yè)和環(huán)境等領域的科學研究提供技術支撐。至今已推出了全球首個基于圖數據庫的大腸桿菌調控代謝關系知識圖譜ERMer和全流程高通量編輯序列設計云平臺AutoESD等20多項生物計算設計網站工具。基于無服務器技術的云原生的開發(fā)方式較傳統(tǒng)方式大幅縮短開發(fā)時間,總體運行成本大幅降低,使得團隊可以專注于業(yè)務代碼和創(chuàng)新。

基于圖數據庫的大腸桿菌調控代謝關系知識圖譜ERMer

細胞中的代謝調控非常復雜,一個特定的細胞功能往往由一系列不同類型的代謝途徑調控相互作用決定。例如,氨基酸的代謝通常由不同類型的相互作用組成的反饋或前饋回路來調節(jié)。由于缺乏對這些調控關系的全局性認識,對細胞進行代謝重塑時常觸發(fā)胞內復雜調控而無法達到預期目標,這是目前細胞工廠構建中的存在的共性問題。

通常不同類型的調控數據散落在各個不同的數據庫,生物學家很難通過僅關注與所研究的代謝物/蛋白質密切相關的一兩類相互作用來識別這種復雜調控級聯(lián)關系。因此,將這些不同類型的調控相互作用匯集在一起,并提供方便的交互方式,將極大的方便生物學家挖掘和理解生物體內的復雜調控關系。

對于這樣的需求,傳統(tǒng)的關系型數據庫往往只能以非直接的方式來表示數據之間的關系,識別這種類型的復雜調控級聯(lián)關系需要額外操作步驟且效率不高。相比之下,圖數據庫更適合這類異質性數據的管理和處理復雜查詢。

天津工業(yè)生物所生物設計中心團隊聯(lián)合亞馬遜云科技團隊在計算生物學國際期刊Nucleic Acids Research上發(fā)表文章,發(fā)布了全球首個基于圖數據庫Amazon Neptune的大腸桿菌調控代謝關系知識圖譜ERMer。ERMer實現(xiàn)了多種復雜調控級聯(lián)或模式的快速檢索和可視化,讓科研人員能夠以交互式、無需編程的方法探索完整的大腸桿菌調控圖譜。例如用戶可以通過指定代謝物-基因、最大搜索長度、最短或最全搜索方法,快速得到所有調控鏈路,有助于用戶發(fā)現(xiàn)新的調控模式以及一些潛在的代謝工程靶點(調控策略)。
這打破了傳統(tǒng)的低效數據檢索方式,有效增強用戶和圖譜的人機交互,大大降低了使用門檻。

為充分發(fā)揮知識圖譜的價值,生物設計中心團隊進一步基于圖神經網絡技術進行推理,以實現(xiàn)轉錄因子預測和轉錄因子靶點預測等功能,這將有助于挖掘潛在的關鍵調控因子和調控靶點,構建新的調控代謝網絡,為研究人員提供新的思路和方向。

基于云原生Serverless應用架構開發(fā)的AutoESD云平臺 實現(xiàn)自動化和高通量的編輯序列設計

模塊化、標準化,是所有工程學科的基礎,也是合成生物學與傳統(tǒng)代謝工程的主要區(qū)別。工程學的可控性,意味著其將能夠與各種軟硬件進行結合,從而走向自動化與高通量,擺脫過往勞動密集型的研究模式,獲得更高的技術迭代能力。而對于這個過程,除了針對元件工具以外,將合成生物學的相關實驗流程進行模塊化、標準化,也是自動化研究當中不可或缺的一環(huán)。

面向大批量微生物遺傳操作,天津工業(yè)生物所生物設計中心團隊開發(fā)得到了第一個能夠支持多種操作類型、任意基因組位點和跨物種進行精確、自動化和高通量編輯序列設計的云平臺AutoESD。

通過對遺傳操作技術的模塊化解構與標準化處理,AutoESD實現(xiàn)了全流程、自動化的編輯序列設計,支持多種基于篩選標記的同源重組技術變種,理論上支持所有基因組序列已知的微生物,并可以在單批次任務中處理針對不同目標序列(CDS 或基因間區(qū)域)的多種類型的遺傳操作(敲除、插入和替換)。用戶僅需要在網站界面,選擇參考基因組和遺傳操作技術,上傳目標操作序列與用戶自己的載體和篩選標記序列,AutoESD即可自動實現(xiàn)編輯序列設計供用戶下載,并可通過網站進行可視化分析。此外,AutoESD還提供失敗任務原因分析、同源序列脫靶風險評估等功能,用戶可以根據這些結果,更改默認的參數,進行優(yōu)化再設計。

AutoESD 的開發(fā)采用了基于云端的無服務器架構,確保了高可靠性、穩(wěn)健性和可擴展性,能夠在幾分鐘內并行處理包含上千個編輯序列設計目標的數百個設計任務。開發(fā)人員利用Amazon Step Functions實現(xiàn)可視化的工作流管理,實現(xiàn)了編輯序列設計工作流的串聯(lián),從而實現(xiàn)應用的快速構建和更新,同時快速查詢處理異常任務;利用Amazon Lambda無服務計算將不同的引物設計、同源臂設計等編輯序列設計模塊封裝打包,滿足了具體功能的模塊化開發(fā)要求,并方便地對功能模塊進行管理和共享;利用Amazon DynamoDB提供毫秒級的動態(tài)資源響應性能,并自動擴展所需資源以應對增加的業(yè)務需求。這些Serverless服務幫助天津工業(yè)生物所團隊進一步簡化運維,使得開發(fā)人員可以專注于業(yè)務代碼和創(chuàng)新,與傳統(tǒng)開發(fā)方式相比,開發(fā)時間縮短了75%,總體擁有成本降低50%。

未來,天津工業(yè)生物所團隊希望基于亞馬遜云科技先進的服務技術和能力,開展更多“BT+IT”的研發(fā)工作,進一步助力研究所在合成生物領域的科研探索。此外,也期望通過亞馬遜云科技的全球科研領域輻射能力,提升天津工業(yè)生物所生物計算設計方面的國際影響力,為世界各國的合成生物學科研工作者提供優(yōu)質服務。

天津工業(yè)生物所生物設計中心主任馬紅武表示:“中國科學院天津工業(yè)生物技術研究所肩負著國家工業(yè)生物技術發(fā)展的重任,并正在加速利用云計算推動相關技術的研發(fā)和成果落地。亞馬遜云科技提供的圖數據庫和Serverless服務,突破傳統(tǒng)的開發(fā)模式、提升研發(fā)效率、不斷優(yōu)化云上成本,生物技術和信息技術相結合的技術體系將進一步推動合成生物領域的發(fā)展和創(chuàng)新。”

亞馬遜云科技中國區(qū)商用與公共市場事業(yè)部總經理李曉芒表示:“亞馬遜云科技為全球數千家生命科學領域客戶提供云服務和行業(yè)解決方案,助力從實驗室到真實世界,全面加速生命科學數字化創(chuàng)新。我們很高興能夠與天津工業(yè)生物所一道,通過云技術和深厚的行業(yè)實踐推動合成生物學領域的技術進步,開拓生物制造產業(yè)的數字化創(chuàng)新路徑。”

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2023-04-03
中科院天津工業(yè)生物所攜手亞馬遜云科技推動生物計算設計領域發(fā)展
近日,中國科學院天津工業(yè)生物技術研究所(以下簡稱天津工業(yè)生物所)與亞馬遜云科技聯(lián)合在天津舉辦“生物計算設計”溝通會。

長按掃碼 閱讀全文