Menggabungkan Lebih dari 1.000 Genom Manusia dengan Biaya Terjangkau: Metode Baru Mendorong Masa Depan Kedokteran

0c67270c24f802ef9521b9d080dcd0ee Merakit Lebih dari 1.000 Genom Manusia dengan Hemat Biaya: Metode Baru Memberdayakan Masa Depan Kedokteran

(SeaPRwire) –   HANGZHOU, China, April 3, 2026 — Sebuah tim peneliti yang dipimpin oleh Zhen-Xing Endowed Professor Jian Yang di School of Life Sciences, Westlake University, bersama para kolaborator, mempublikasikan temuan terbaru mereka di Nature pada tanggal 1 April. Studi ini secara inovatif mengembangkan metode perakitan genom yang diinformasikan oleh pangenom (pangenome-informed genome assembly – PIGA). Dengan menggabungkan strategi pengurutan hibrida yang hemat biaya dari pembacaan panjang dan pendek, tim berhasil membangun pangenom untuk lebih dari seribu individu. Pencapaian ini menembus keterbatasan pangenom sampel kecil sebelumnya dan menyediakan infrastruktur fondasi yang kritis untuk penelitian medis dan genetika populasi.

Sejak penyelesaian Human Genome Project, genom referensi linier tunggal (seperti GRCh38) telah berfungsi sebagai fondasi untuk penelitian biomedis. Namun, latar belakang genetik individu manusia bervariasi secara signifikan, dan genom referensi tunggal tidak dapat menangkap tingkat keragaman genetik penuh di seluruh populasi. Hal ini menyebabkan bentuk-bentuk kompleks variasi genetik, seperti varian struktural (SVs) dan ulangan berdampingan (tandem repeats – TRs), diabaikan dalam analisis tradisional. Untuk mengatasi tantangan ini, peneliti mengusulkan konsep pangenom—koleksi urutan genom yang mewakili keragaman genetik suatu populasi.

Sementara kemajuan dalam pengurutan pembacaan panjang (long-read sequencing) telah memungkinkan perakitan genom diploid berkualitas tinggi, biaya pengurutan yang tinggi telah membatasi ukuran sampel pangenom sebelumnya hanya pada beberapa dozen individu. Ukuran sampel yang kecil seperti ini tidak cukup untuk memperkirakan secara akurat frekuensi varian genetik dalam populasi atau untuk mengatasi varian frekuensi rendah dan wilayah kompleksitas tinggi. Oleh karena itu, mengembangkan strategi konstruksi pangenom yang hemat biaya untuk populasi berskala besar telah menjadi persyaratan mendesak untuk mengatasi dampak fungsional dari varian kompleks dan meningkatkan diagnostik klinis.

Tim Yang telah lama mendedikasikan diri untuk penelitian metodologis dalam genetika statistik, genomik, dan analisis big data dari sifat kompleks manusia. Dengan mengembangkan metode komputasi yang efisien, tim secara konsisten mengatasi tantangan inti dalam memproses data genomik berskala besar. Alat analisis yang dikembangkan oleh tim, seperti GCTA-GREML, SMR, dan gsMap, telah diadopsi secara luas secara global. Untuk mengatasi tantangan dalam membangun pangenom berskala besar, tim peneliti mengembangkan alur kerja perakitan genom yang diinformasikan oleh pangenom (PIGA) (Gambar 1). Tidak seperti pendekatan perakitan de novo, yang mengandalkan data pengurutan dari sampel individu, PIGA mengadopsi kerangka kerja yang dipandu oleh pangenom untuk mengintegrasikan informasi urutan di seluruh kohort. Ini sepenuhnya memanfaatkan strategi pengurutan hibrida yang hemat biaya berdasarkan data pengurutan genom seluruhnya (whole-genome sequencing – WGS) pembacaan pendek Illumina dan pembacaan panjang PacBio dengan cakupan moderat. Pendekatan ini secara substansial mengurangi biaya pengurutan sambil memungkinkan perakitan genom dari data cakupan moderat, sehingga memberikan jalur teknis baru yang praktis untuk studi pengurutan hibrida skala populasi di masa depan.

Dengan menerapkan metode ini, tim peneliti membangun pangenom manusia terbesar di dunia hingga saat ini, terdiri dari 1.116 genom diploid dengan nilai kualitas rata-rata (QV) 46. Pangenom mengidentifikasi 405,3 juta pasangan basa (Mb) urutan non-referensi yang tidak ada dalam referensi saat ini (GRCh38 dan CHM13). Perlu dicatat, tim memberikan anotasi 26,2 Mb dari urutan ini sebagai gen fungsional dan elemen regulasi yang diprediksi, sangat memperluas pemahaman kita tentang urutan non-referensi dalam genom manusia.

=

Dengan memanfaatkan kumpulan data perakitan berskala besar, para peneliti menyusun katalog komprehensif variasi genetik. Selain 35,4 juta varian kecil, katalog ini menangkap berbagai macam varian kompleks, termasuk 110.530 SV, 485.575 TR, dan 0,86 juta varian bersarang yang tertanam dalam urutan non-referensi.

Menggunakan katalog ini, tim mengkarakterisasi variasi yang relevan secara medis pada berbagai skala (Gambar 2), termasuk SV yang mengubah gen, ekspansi TR patogenik, variasi kluster gen, dan haplotip gen HLA. Temuan ini menunjukkan bahwa katalog varian 1KCP menyediakan referensi penting untuk skrining klinis mutasi patogenik.

Dengan mengintegrasikan data ekspresi gen, tim melakukan pemetaan lokus sifat kuantitatif ekspresi pan-varian (pan-variant expression quantitative trait loci – eQTL). Mereka mengidentifikasi 3.256 eQTL yang melibatkan varian kompleks (SV, TR, dan varian bersarang), mengklarifikasikan kompleksitas regulasi dari berbagai jenis varian ini.

Bersama-sama, studi ini secara signifikan memajukan pemahaman kita tentang varian genetik kompleks dan implikasi fungsionalnya, membangun paradigma baru untuk penelitian kesehatan manusia dan studi pangenom pada spesies lain.

Mahasiswa Ph.D. Yifei Wang dan Research Assistant Professor Zhongqu Duan adalah penulis pertama bersama dari studi ini. Professor Jian Yang adalah penulis terakhir. Karya ini didukung oleh National Natural Science Foundation of China, National Key R&D Program, Program Zhejiang “Pioneer & Leading Goose”, dan New Cornerstone Science Foundation. Sumber daya komputasi disediakan oleh High-Performance Computing Center di Westlake University.

Grup riset Professor Jian Yang didedikasikan untuk mengembangkan metode genetika statistik dan bioinformatika. Dengan menganalisis secara mendalam data genomik dan multi-omik dari kohort populasi berskala besar, mereka bertujuan untuk mengungkap arsitektur genetik dan mekanisme molekuler yang mendasari penyakit kompleks, menerjemahkan penemuan ini menjadi strategi baru untuk diagnosis penyakit, penemuan target obat, dan kedokteran presisi.

Tautan terkait:
Tautan makalah: https://www.nature.com/articles/s41586-026-10315-y
Situs web lab Jian Yang: https://yanglab.westlake.edu.cn/

Kontak media:
Chi Zhang
media@westlake.edu.cn 
+86-15659837873

SUMBER Westlake University

Artikel ini disediakan oleh penyedia konten pihak ketiga. SeaPRwire (https://www.seaprwire.com/) tidak memberikan jaminan atau pernyataan sehubungan dengan hal tersebut.

Sektor: Top Story, Daily News

SeaPRwire menyediakan distribusi siaran pers real-time untuk perusahaan dan lembaga, menjangkau lebih dari 6.500 toko media, 86.000 editor dan jurnalis, dan 3,5 juta desktop profesional di 90 negara. SeaPRwire mendukung distribusi siaran pers dalam bahasa Inggris, Korea, Jepang, Arab, Cina Sederhana, Cina Tradisional, Vietnam, Thailand, Indonesia, Melayu, Jerman, Rusia, Prancis, Spanyol, Portugis dan bahasa lainnya.