Amazon đang giúp các nhà nghiên cứu phân tích di truyền học như thế nào?

Huỳnh Dũng Thứ năm, ngày 29/12/2022 09:38 AM (GMT+7)
Nền tảng Amazon Web Services (AWS) đã ra mắt công cụ khả dụng Amazon Omics, giúp các nhà nghiên cứu lưu trữ và phân tích dữ liệu omic như trình tự gen DNA, RNA và protein trong cơ thể người.
Bình luận 0

Khi dịch vụ chăm sóc sức khỏe ngày càng được số hóa, các nhà khoa học, bác sĩ và nhà nghiên cứu phải cố gắng giải mã lượng dữ liệu chưa từng có để cá nhân hóa dịch vụ chăm sóc một cách đầy đủ. Bởi lượng thông tin khổng lồ dành cho các chuyên gia này thường vượt quá khả năng tiếp thu và phân tích thông tin của họ.

Vì thế mà nền tảng điện toán đám mây Amazon Web Services (AWS) đã và đang hỗ trợ để thu hẹp khoảng cách đó. Cụ thể, bộ phận Amazon Web Services gần đây đã ra mắt Amazon Omics, là công cụ giúp các nhà nghiên cứu lưu trữ và phân tích dữ liệu omic như trình tự DNA, RNA và protein cơ thể người. Dịch vụ này cung cấp cho các nhà khoa học, bác sĩ và nhà nghiên cứu các cơ sở hạ tầng cơ bản mà họ cần để hiểu một lượng lớn dữ liệu khổng lồ, trên hành trình khám phá khoa học mới cũng như trong điều trị y tế.

Nó cũng giúp tăng tốc nghiên cứu bằng cách sử dụng quy trình làm việc có quy mô linh hoạt và các công cụ điện toán tích hợp, cũng như đảm bảo bảo vệ quyền riêng tư của bệnh nhân đạt đủ điều kiện theo HIPAA, cũng như bằng quyền truy cập và tạo bản ghi dữ liệu tích hợp.

Nền tảng Amazon Web Services (AWS) đã ra mắt công cụ khả dụng Amazon Omics, giúp các nhà nghiên cứu lưu trữ và phân tích dữ liệu omic như trình tự DNA, RNA và protein. Ảnh: @AFP.

Nền tảng Amazon Web Services (AWS) đã ra mắt công cụ khả dụng Amazon Omics, giúp các nhà nghiên cứu lưu trữ và phân tích dữ liệu omic như trình tự DNA, RNA và protein. Ảnh: @AFP.

Bộ phận AWS tạo ra một phần doanh thu đáng kể cho Amazon, thu về 20,5 tỷ USD trong quý thứ ba của năm 2022. Mảng kinh doanh điện toán đám mây này đang mở rộng sang lĩnh vực chăm sóc sức khỏe, và mặc dù AWS không tiết lộ dự báo doanh thu cho các dịch vụ cụ thể mà nền tảng này hỗ trợ, song quy mô thị trường phân tích dữ liệu bộ gen toàn cầu dự kiến sẽ đạt 2,15 tỷ USD vào năm 2030, theo một báo cáo từ Straits Research.

Tiến sĩ Taha Kass-Hout, giám đốc bộ phận y tế thuộc AWS, cho biết phần lớn dữ liệu chăm sóc sức khỏe về bản chất là không có cấu trúc rõ ràng, nghĩa là khoảng 97% trong số đó không được sử dụng ngay lập tức, mà các chuyên gia phải tiến hành lập chỉ mục và hiểu ý nghĩa của thông tin này, tất nhiên đó là một thách thức, đặc biệt là khi các nhà nghiên cứu đang thu thập dữ liệu omic từ hàng chục nghìn bệnh nhân.

Trước khi làm việc tại Amazon, Kass-Hout đã phục vụ hai nhiệm kỳ dưới thời Tổng thống Barack Obama và là giám đốc thông tin y tế đầu tiên tại Cục Quản lý Thực phẩm và Dược phẩm Hoa Kỳ (FDA).

Kass-Hout cho biết, việc giải trình tự một bộ gen người có thể yêu cầu dung lượng lưu trữ từ 80 đến 150 gigabyte, và một số dự án nghiên cứu xử lý tới hàng đơn vị petabyte và exabyte thông tin bộ gen.  

Amazon Omics giúp các nhà nghiên cứu sắp xếp dữ liệu của họ bằng cách cung cấp cho họ ba thành phần phân loại dữ liệu, mà họ có thể tận dụng riêng lẻ hoặc theo nhóm. Tính năng lưu trữ đối tượng nhận biết Omics giúp các nhà nghiên cứu lưu trữ và chia sẻ dữ liệu trình tự thô; công cụ Amazon Omics cũng giúp chạy các quy trình công việc xử lý dữ liệu trình tự gen thô ở quy mô lớn cho đến dữ liệu đầu ra có thể hiểu và sử dụng được; và tính năng Omics Analytics tích hợp kèm lại giúp đơn giản hóa đầu ra của quá trình xử lý trình tự gen trong kho dữ liệu y sinh.

Amazon Omics giúp các nhà nghiên cứu sắp xếp dữ liệu của họ bằng cách cung cấp cho họ ba thành phần phân loại dữ liệu mà họ có thể tận dụng riêng lẻ hoặc theo nhóm. Ảnh: @AFP.

Amazon Omics giúp các nhà nghiên cứu sắp xếp dữ liệu của họ bằng cách cung cấp cho họ ba thành phần phân loại dữ liệu mà họ có thể tận dụng riêng lẻ hoặc theo nhóm. Ảnh: @AFP.

Hiện tại, đã có hơn một chục khách hàng và đối tác đã thử nghiệm phiên bản beta, cũng như sử dụng của dịch vụ Amazon Omics. Đối với Jeffrey Pennington, giám đốc nghiên cứu tin học tại Bệnh viện Nhi đồng Philadelphia, Amazon Omics đã tạo ra một tác động đáng chú ý.

Pennington làm việc tại khoa tin học y sinh và sức khỏe, nơi phải sử dụng dữ liệu và công nghệ để giải quyết các vấn đề về sức khỏe trẻ em. Ông cho biết khoa của ông đã dành 5 năm để mở rộng cơ sở hạ tầng để phân tích dữ liệu omics, và giờ đây khoa của ông không còn vất vả trước khối dữ liệu gen y sinh khổng lồ nữa nhờ công cụ Amazon Omics của Amazon.

Còn ông Boris Oklander, đồng sáng lập và giám đốc công nghệ của C2i Genomics cho biết, Amazon Omics cũng khuyến khích sự cộng tác giữa các nhóm nghiên cứu lớn, các nhóm lâm sàng nhỏ hơn và các công ty dược phẩm.

Vốn dĩ, C2i là một công ty công nghệ sinh học đang nỗ lực sử dụng dữ liệu bộ gen để phát triển các phương pháp điều trị ung thư được cá nhân hóa. Oklander cho biết công ty đã tham gia phiên bản beta của Amazon Omics sau khi cố gắng phát triển công nghệ phân tích dữ liệu của riêng mình nhưng không thành công.

Ông cho biết Amazon Omics đã tạo ra một hệ sinh thái cộng tác giúp các nhà nghiên cứu không cần phải xây dựng một công nghệ phức tạp ngay từ đầu. "Chúng tôi chỉ đang dân chủ hóa ngành dữ liệu y sinh. Loại dịch vụ này là thứ cho phép chúng ta mở khóa giá trị trong các khoản đầu tư mà những người chơi khác nhau trong không gian này đang tìm cách thực hiện".

Dịch vụ này cung cấp cho các nhà khoa học, bác sĩ và nhà nghiên cứu các cơ sở hạ tầng cơ bản mà họ cần để hiểu một lượng lớn dữ liệu khổng lồ, trên hành trình khám phá khoa học mới cũng như trong điều trị y tế. Ảnh: @AFP.

Dịch vụ này cung cấp cho các nhà khoa học, bác sĩ và nhà nghiên cứu các cơ sở hạ tầng cơ bản mà họ cần để hiểu một lượng lớn dữ liệu khổng lồ, trên hành trình khám phá khoa học mới cũng như trong điều trị y tế. Ảnh: @AFP.

Các công ty công nghệ lớn khác đã phát triển các công cụ tương tự. Điển hình là Microsoft, khi nền tảng điện toán đám mây Azure đã ra mắt Microsoft Genomics vào năm 2018 để giúp các nhà nghiên cứu diễn giải dữ liệu do công nghệ gen tạo ra. Hay Công nghệ Cloud Life Science của Google cũng cho phép các nhà nghiên cứu xử lý dữ liệu y sinh ở quy mô lớn.

Ông Boris Oklander còn nói: "Nếu thập kỷ trước là về quá trình số hóa mà ngành khoa học đời sống và sức khỏe đã trải qua, thì tôi thực sự tin rằng thập kỷ tới là về việc hiểu dữ liệu này theo cách hiện tại với sự hỗ trợ của nghệ-nơi chúng ta có thể sớm tìm ra phương pháp trị liệu mới, chẩn đoán mới, liệu pháp nhắm mục tiêu hơn".

Mời các bạn đồng hành cùng báo Dân Việt trên mạng xã hội Facebook để nhanh chóng cập nhật những tin tức mới và chính xác nhất.
Tin cùng chuyên mục
Xem theo ngày Xem