Phong Vũ Blog

Thứ Tư, 7 tháng 7, 2021

Nhóm nghiên cứu MIT phát triển thành công kỹ thuật lưu trữ và truy xuất dữ liệu DNA tiên tiến, cách làm tương tự Google Search

 admin     tháng 7 07, 2021     No comments   

Trên Trái Đất hiện nay có khoảng 10 nghìn tỷ gigabytes dữ liệu số và mỗi ngày, con người tạo ra khoảng hoảng 2,5 triệu gigabyte dung lượng dưới dạng email, ảnh, cập nhật trạng thái facebook và nhiều dữ liệu số khác. Phần lớn dữ liệu này được lưu trữ trong các trung tâm dữ liệu exabyte (tương đương 1 tỉ gigabytes), có kích thước tương đương nhiều sân bóng đã và có chi phí lên tới 1 tỉ USD để xây dựng và duy trì.

Nhóm nghiên cứu MIT phát triển thành công kỹ thuật lưu trữ và truy xuất dữ liệu DNA tiên tiến, cách làm tương tự Google Search - Ảnh 1.

Một cốc coffee chứa đầy DNA trên lý thuyết có khả năng lưu trữ toàn bộ dữ liệu số trên thế giới

Nhiều khoa học gia tin rằng một giải pháp lưu trữ thay thế nằm ở chính phân tử chứa dữ liệu di truyền của chúng ta: DNA, một sản phẩm tiến hóa có khả năng lưu trữ lượng lớn dữ liệu với mật độ cực lớn. Một cốc coffee chứa đầy DNA trên lý thuyết có khả năng lưu trữ toàn bộ dữ liệu số trên thế giới, theo Mark Bathe, giáo sư kỹ thuật sinh học tại MIT.

“Chúng ta cần những giải pháp mới cho phép lưu trữ lượng dữ liệu khổng lồ ngày càng tích tụ. DNA cũng có mật độ dầy đặc hơn bộ nhớ flash gấp hàng ngàn lần, và một thuộc tính đặc biệt đó là một khi bạn polymer hóa DNA, nó hoàn toàn không tiêu thụ năng lượng. Bạn có thể tạo ra một trình tự DNA và lưu trữ nó mãi mãi”, theo Bathe.

Các nhà khoa học hiện đã chứng minh khả năng mã hóa hình ảnh và tài liệu chữ dưới dạng DNA. Tuy nhiên, chúng ta cần một cách dễ hơn để trích xuất dữ liệu cần truy cập từ một tổ hợp DNA nhiều mảnh. Bathe và các đồng nghiệp đã tìm ra một phương pháp thực hiện điều này bằng cách đóng gói mỗi file dữ liệu thành một khối silica có kích thước 6-micromet và gán nó cho các chuỗi DNA ngắn để dễ dàng truy xuất.

Bằng phương pháp này, các nhà nghiên cứu đã thể hiện khả năng trích xuất chính xác từng file hình ảnh được lưu giữ trong các chuỗi DNA chứa 20 hình. Tính toán cho thấy phương pháp này có thể được áp dụng cho các tổ hợp tới 1020 tệp tin, tức 100.000.000.000.000.000.000 tệp, một trăm tỷ tỷ file.

Bathe là tác giả của nghiên cứu này, được đăng trên tạp chí Nature Materials. Các đồng tác giả khác là thạc sĩ MIT James Banal, cựu nghiên cứu sinh MIT Tyson Shephard và cử nhân Joseph Berleant.

Khả năng lưu trữ ổn định

Nhóm nghiên cứu MIT phát triển thành công kỹ thuật lưu trữ và truy xuất dữ liệu DNA tiên tiến, cách làm tương tự Google Search - Ảnh 2.

Các hệ thống lưu trữ dữ liệu số mã hóa dữ liệu thành các chuỗi nhị phân 0 và 1. Dữ liệu có thể được mã hóa tương tự trong DNA, nhưng với 4 neucleotide là A,T,G, C thay cho 0 và 1. Ví dụ, C và G có thể tượng trưng cho 0, còn A và T có thể đại diện cho giá trị 1.

DNA có một số thuộc tính tối ưu khác: cực bền bỉ, dễ dàng tổng hợp và lập trình (tuy rằng tốn kém). Ngoài ra, nhờ mật độ lớn - mỗi nucleotide, tương đương 2 bit, chỉ có kích thước 1 nanomet khối, khiến cho 1 exabyte dữ liệu DNA có thể hoàn toàn nằm gọn trong lòng bàn tay.

Một chướng ngại đối với lưu trữ dữ liệu DNA đó là chi phí tổng hợp DNA. Hiện tại, để ghi 1 petabyte (1 triệu gigabyte) vào DNA, quá trình sẽ tốn tới 1 nghìn tỷ USD. Để có thể cạnh tranh với giải pháp lưu trữ dữ liệu từ tính, Bathe ước tính chi phí tổng hợp DNA cần giảm đi tối thiểu 6 con số. Bathe cho biết anh hy vọng có thể đạt được cột mốc này sau một hoặc hai thập kỷ nữa, tương tự như việc chi phí ổ flash đã giảm mạnh sau vài thập kỷ.

Nhóm nghiên cứu MIT phát triển thành công kỹ thuật lưu trữ và truy xuất dữ liệu DNA tiên tiến, cách làm tương tự Google Search - Ảnh 3.

20 hình được lưu trong thử nghiệm.

Khó khăn trong trích xuất dữ liệu

Bên cạnh chi phí, một vấn đề khác với việc sử dụng DNA để lưu dữ liệu là khó khăn trong việc trích xuất chính xác file bạn muốn. Bathe so sánh việc này với mò kim đáy bể. Hiện tại, dữ liệu DNA được trích xuất sử dụng phản ứng chuỗi polymerase (PCR). 

Mỗi file dữ liệu bao gồm một trình tự DNA sẽ phản ứng với chất mồi PCR nhất định. Để trích xuất một file nhất định, chất mồi được kết hợp với mẫu DNA để nhận diện chuỗi đích. Tuy nhiên, phương pháp này có phương sai nhất định và sử dụng enzym, khiến phần lớn DNA trong tổ hợp bị phân rã. Bathe nhận xét: “Gần như là bạn đang rút cạn bể để tìm một cái kim dưới đáy.”

Nhóm nghiên cứu MIT phát triển thành công kỹ thuật lưu trữ và truy xuất dữ liệu DNA tiên tiến, cách làm tương tự Google Search - Ảnh 4.

Để khắc phục khó khăn, nhóm đã phát triển một phương pháp khác bao gồm việc đóng gói mỗi file vào một phân tử silica nhỏ. Mỗi gói sẽ được gán nhãn bằng một chuỗi DNA đơn đại diện cho nội dung của file. Để trình diễn kỹ thuật này với chi phí thấp, các nhà nghiên cứu mã hóa 20 hình ảnh khác nhau vào chuỗi DNA dài 3.000 nucleotides, tương đương 100 bytes. 

Mỗi tệp tin được dán một mã vạch cụ thể đại diện cho một khái niệm nhất định. Khi cần trích xuất một hình ảnh bất kỳ, họ lấy các mẫu DNA và cho phản ứng với chất mồi tương ứng với khái niệm cần tìm kiếm. Nhờ đó, các gói dữ liệu không phản ứng có thể dễ dàng được đưa trở lại kho lưu trữ. Phương pháp này áp dụng logic Boolean cơ bản, cho phép khả năng tìm kiếm tương tự như khi bạn tìm ảnh trên Google.

“Ở thử nghiệm chứng minh tính hiệu quả công nghệ, chúng ta đã đạt tốc độ tìm kiếm 1 kilobyte/giây. Tốc độ tìm kiếm của hệ thống được quyết định bởi kích thước mỗi gói dữ liệu, bị hạn chế bởi chi phí tổng hợp DNA. Nếu chi phí tổng hợp DNA trở nên phải chăng hơn, chúng ta có thể tối đa hóa kích thước dữ liệu lưu trữ trong mỗi gói”, Banal, tác giả chính của nghiên cứu nhận định.

Nhóm nghiên cứu MIT phát triển thành công kỹ thuật lưu trữ và truy xuất dữ liệu DNA tiên tiến, cách làm tương tự Google Search - Ảnh 5.

Trong tương lai, các file sẽ có hình dạng như thế này?

Bathe cho rằng phương pháp lưu trữ dữ liệu này có thể hữu ích đối với lưu trữ “lạnh”, khi mà dữ liệu không được truy cập nhiều. Nhóm nghiên cứu đang bắt đầu một công ty khởi nghiệp có tên Cache DNA, tập trung phát triển các công nghệ lưu trữ DNA dài hạn nhằm áp dụng cho cả lưu trữ dữ liệu DNA lẫn lưu trữ các mẫu DNA trong nghiên cứu.

Theo lời giáo sư di truyền George Church hiện đang công tác tại Harvard và không tham gia nghiên cứu mới, đây là "một bước nhảy vọt lớn trong quản lý tri thức và kỹ thuật tìm kiếm dữ liệu". Ông nhận định nghiên cứu mới tận dụng được công nghệ và công cụ sẵn có để đưa khả năng lưu trữ dữ liệu DNA lên một tầm cao mới, một cách tiếp cận khác với phương pháp truyền thống mà vẫn hiệu quả.

Nghiên cứu này được tài trợ bởi Phòng nghiên cứu Hải quân, Quỹ Khoa học Quốc qua Mỹ và Phòng nghiên cứu Quân sự Mỹ.

Theo MIT

Adblock test (Why?)


Xem Chi Tiết Ở Đây >>>
Bạn có thể quan tâm:
>> Năm lý do khiến bạn nên mua một chiếc AirPods Max
>> Tai nghe Galaxy Buds2 đang được chế tạo, thiết kế có nhiều nâng cấp
>> Loa 7.1 Là Gì? Hệ Thống Âm Thanh 7.1 Được Sắp Xếp Như Thế Nào?
  • Share This:  
  •  Facebook
  •  Twitter
  •  Google+
  •  Stumble
  •  Digg
Gửi email bài đăng nàyBlogThis!Chia sẻ lên XChia sẻ lên Facebook
Bài đăng Mới hơn Bài đăng Cũ hơn Trang chủ

0 Comments:

Đăng nhận xét



Popular Posts

  • Hướng dẫn cách xóa tài khoản Facebook vĩnh viễn, không thể khôi phục lại
    Làm sao để xóa vĩnh viễn tài khoản Facebook khi không còn muốn sử dụng Facebook nữa, bài viết này sẽ hướng dẫn bạn. Facebook hiện nay đã v...
  • 5 Buildings To Visit in University Campuses (Singapore)
    In Singapore, you can visit a lot of places to appreciate architecture. This list is composed of my top five structures to visit in universi...
  • Monsoon trip to Raigad Fort – King of Forts
    I have been to the Raigad fort twice for a day trip but had never explored the entire fort. In this monsoon, a 2 day trip to the Raigad fort...
  • Itinerary India & Kashmir April 2019 (Day 1)
    Fakta mengenai Kashmir :  95% penduduk Kashmir adalah Muslim. Tak payah risau makanan di sana, semuanya halal.  Penduduk Kashmir sanga...
  • Bombay To Beijing By Bicycle-- A Guest Post By Russell McGilton
    The first time I arrived in India it was 1969 and the world was changing around me and inside me. I drove in my VW van from Europe and I sta...
  • The Island of FÖHR - every village a home
    Föhr - every village a home: What's that all about? I'm not able to figure out Föhr's strongest suit - there are so many great t...
  • Trip to Phansad Wildlife Sanctuary and Revdanda
    After a trip to Blackbuck national park Velavadar, I wanted to visit one more wildlife sanctuary. Due to lack of leaves, I decided to visit ...

Copyright © Phong Vũ Blog | Powered by Blogger
Design by Hardeep Asrani | Blogger Theme by NewBloggerThemes.com | Distributed By Gooyaabi Templates