Trí tuệ nhân tạo (Artificial intelligence – AI) không ngừng đổi mới và phát triển, gần đây, công nghệ này còn giúp các nhà thực vật học hiểu rõ hơn về đối tượng nghiên cứu của họ. Mô hình Plant RNA-FM được hỗ trợ bởi AI có khả năng dịch ngôn ngữ của đời sống thực vật.
Được tạo ra bởi sự hợp tác giữa Trung Tâm John Innes (John Innes Centre) và các nhà khoa học máy tính tại University of Exeter, mô hình Al được thiết kế để hiểu các trình tự và mô hình cấu trúc của “ngôn ngữ” di truyền từ thực vật, đặc biệt tập trung vào RNA thực vật (RNA được chiết xuất từ thực vật).
Axit ribonucleic (Ribonucleic acid – RNA) là một phân tử có trong tất cả các tế bào sống, đóng vai trò quan trọng trong quá trình tổng hợp protein và các chức năng khác của tế bào.
RNA đóng vai trò quan trọng trong việc biểu hiện và điều hòa gen bên trong tế bào, khiến nó trở nên cần thiết để hiểu cách thực vật phát triển, thích nghi và phản ứng với môi trường sống.
Plant RNA-FM, được cho là mô hình AI đầu tiên thuộc loại này, một bước đột phá công nghệ thông minh, thúc đẩy những khám phá và đổi mới trong khoa học thực vật và trong nghiên cứu về động vật không xương sống và vi khuẩn.
Nhóm nghiên cứu tại Trung Tâm John Innes do Giáo Sư Yiliang Ding đứng đầu về việc nghiên cứu cấu trúc RNA. Họ tìm hiểu về cách RNA có thể gấp lại thành các cấu trúc phức tạp điều chỉnh các chức năng sinh học quan trọng ở thực vật, như sự phát triển của thực vật và phản ứng với những căng thẳng.
Để hiểu rõ hơn về các chức năng ngôn ngữ phức tạp của RNA, họ hợp tác với nhóm của Bác Sĩ Ke Li tại University of Exeter, phát triển Plant RNA-FM, một mô hình được đào tạo trên một tập dữ liệu khổng lồ, gồm 54 tỷ thông tin RNA, tạo nên bảng chữ cái di truyền trên 1,124 loài thực vật.
Các nhà nghiên cứu áp dụng một phương pháp tương tự như cách các mô hình AI, như ChatGPT, được đào tạo để hiểu ngôn ngữ của con người. Plant RNA-FM được dạy từ ngữ dựa trên thực vật bằng cách nghiên cứu thông tin RNA từ các loài thực vật trên toàn thế giới, nhằm cung cấp cái nhìn toàn diện về cách RNA hoạt động trên toàn bộ vương quốc thực vật.
Cũng giống như cách ChatGPT hiểu và phản hồi lại với con người, PlantRNA-FM học cách hiểu ngữ pháp và lý luận của các trình tự và cấu trúc RNA.
“Mặc dù các trình tự RNA trông khá ngẫu nhiên đối với mắt người, nhưng mô hình AI của chúng tôi học cách giải mã các mẫu ẩn bên trong các trình tự này,” Bác Sĩ Haopeng Yu, nhà nghiên cứu sau tiến sĩ trong nhóm của giáo sư Yiliang Ding tại Trung tâm John Innes, cho biết.
“PlantRNA-FM chỉ là một bước khởi đầu. Chúng tôi đang hợp tác chặt chẽ với nhóm của Bác Sĩ Li để phát triển các phương pháp tiếp cận Al tiên tiến hơn nhằm hiểu các ngôn ngữ DNA và RNA ẩn trong tự nhiên. Bước đột phá này mở ra những khả năng mới để hiểu và có khả năng lập trình thực vật, có ý nghĩa sâu sắc đối với việc cải thiện cây trồng và thế hệ thiết kế gen dựa trên AI tiếp theo. AI ngày càng đóng vai trò quan trọng trong việc hỗ trợ các nhà khoa học thực vật nắm rõ các thách thức, từ việc nuôi sống dân số toàn cầu đến phát triển các loại cây trồng có khả năng phát triển mạnh trong điều kiện khí hậu thay đổi,” theo giáo sư Ding.
Nghiên cứu được công bố trên tạp chí Nature Machine Intelligence trong Tháng Mười Hai, 2024.