Các nhà nghiên cứu tại Viện Salk đã tạo ra một bước đột phá trong lĩnh vực di truyền học bằng cách phát triển công cụ ShortStop, sử dụng học máy để khám phá các vùng DNA thường bị bỏ qua trong quá trình tìm kiếm các microprotein có thể đóng vai trò quan trọng trong bệnh tật. Công cụ này đã giúp các nhà khoa học xác định được các vùng DNA có khả năng mã hóa cho microprotein và dự đoán khả năng sinh học của chúng một cách hiệu quả.

ShortStop hoạt động dựa trên nguyên tắc phân loại microprotein thành hai loại: chức năng và không chức năng. Quá trình phân loại này được thực hiện dựa trên dữ liệu huấn luyện từ các bộ dữ liệu ngẫu nhiên được tạo ra bởi máy tính. Bằng cách so sánh các microprotein tìm thấy với các mẫu giả, ShortStop có thể nhanh chóng quyết định liệu một microprotein mới có khả năng chức năng hay không. Điều này không chỉ giúp tiết kiệm thời gian và tiền bạc trong việc tìm kiếm các microprotein liên quan đến sức khỏe và bệnh tật mà còn mở ra những cơ hội mới cho việc nghiên cứu.
Khi áp dụng ShortStop vào một bộ dữ liệu đã được công bố trước đó, các nhà nghiên cứu đã xác định được 8% microprotein có khả năng chức năng. Điều này cho phép họ ưu tiên các microprotein này cho việc theo dõi tiếp theo. Công cụ này cũng giúp xác định các microprotein bị bỏ qua bởi các phương pháp khác, bao gồm cả một microprotein đã được xác nhận bằng cách phát hiện trong các tế bào và mô của con người. Thành công của ShortStop trong việc xác định các microprotein chức năng tiềm năng đã chứng minh giá trị của công cụ này trong lĩnh vực di truyền học.
Các nhà nghiên cứu đã sử dụng ShortStop để phân tích dữ liệu di truyền từ các khối u phổi của con người và mô lân cận bình thường. Kết quả là danh sách các microprotein tiềm năng chức năng đã được tạo ra. Trong số các microprotein mà ShortStop tìm thấy, một số nổi bật đã được biểu hiện nhiều hơn trong mô khối u hơn mô bình thường. Điều này cho thấy chúng có thể đóng vai trò là dấu ấn sinh học hoặc microprotein chức năng cho ung thư phổi.
Việc xác định microprotein liên quan đến ung thư phổi này không chỉ chứng minh giá trị của ShortStop mà còn cho thấy tiềm năng của học máy trong việc ưu tiên các ứng viên cho nghiên cứu và phát triển điều trị trong tương lai. Các nhà nghiên cứu hy vọng rằng ShortStop sẽ giúp họ tìm ra các microprotein mới liên quan đến sức khỏe và bệnh tật. Từ đó, những con đường mới cho việc chẩn đoán và điều trị các bệnh như ung thư và Alzheimer có thể được mở ra.
Thông tin chi tiết về nghiên cứu này có thể được tìm thấy tại Viện Salk. Việc phát triển công cụ ShortStop và ứng dụng của nó trong nghiên cứu di truyền học đại diện cho một bước tiến quan trọng trong việc hiểu rõ hơn về vai trò của microprotein trong sức khỏe và bệnh tật.