Tích hợp dữ liệu và mô hình máy tính học
Theo cách truyền thống, việc giám sát và đánh giá chất lượng nước là lấy mẫu và phân tích tại chỗ nhưng phương pháp này đòi hỏi kinh phí cao, tốn thời gian và nhân lực, đồng thời không thể bao phủ trên diện rộng hoặc theo dõi liên tục. Để khắc phục những hạn chế này, dựa trên việc ứng dụng công nghệ viễn thám đang dần phổ biến trong giám sát chất lượng nước hiện nay, cùng xu hướng phát triển của trí tuệ nhân tạo, nhóm nghiên cứu đã đưa ra giải pháp tích hợp dữ liệu vệ tinh Sentinel-2 với các mô hình học máy hiện đại như Random Forest, Gradient Boosting hay AdaBoost...
Theo đó, các chỉ số quan trọng đánh giá chất lượng nước biển được xác định đồng bộ, liên tục và trên diện rộng như nhiệt độ mặt nước, độ đục, nồng độ diệp lục-a và nhu cầu oxy hóa học. Trong đó, diệp lục-a là chỉ số chính để xác định mức độ phát triển của thực vật phù du - dấu hiệu chỉ báo về tình trạng ô nhiễm nước. TS Vũ Anh Tuân, Trung tâm Vũ trụ Việt Nam - Viện Hàn lâm Khoa học và Công nghệ Việt Nam, thành viên nhóm nghiên cứu cho biết, kết quả mô hình hóa cho thấy, thuật toán Random Forest cho độ chính xác cao nhất, đặc biệt với thông số nhiệt độ mặt nước. Các chỉ số khác như độ đục và nồng độ diệp lục-a cũng có độ chính xác khá tốt. Tuy nhiên, dự đoán nhu cầu oxy hóa học vẫn còn hạn chế do đây là chỉ số chịu ảnh hưởng bởi nhiều yếu tố phức tạp và biến động mạnh theo thời gian.
Xây dựng các bản đồ phân bố chất lượng nước theo không gian - thời gian thực
Nghiên cứu sử dụng dữ liệu từ 78 ảnh vệ tinh Sentinel-2 chụp từ năm 2019 đến 2023, kết hợp với dữ liệu đo đạc thực địa từ Sở Nông nghiệp và Môi trường tỉnh Quảng Ninh và Cục Quản lý Đại dương và Khí quyển quốc gia Hoa Kỳ (NOAA). Toàn bộ quá trình xử lý và phân tích dữ liệu được thực hiện trên nền tảng Google Earth Engine - hệ sinh thái điện toán đám mây mạnh mẽ hỗ trợ các ứng dụng viễn thám toàn cầu. Tuy nhiên, để khai thác hiệu quả nguồn dữ liệu khổng lồ này, đòi hỏi phải có những công cụ xử lý và phân tích tiên tiến - đây chính là nơi trí tuệ nhân tạo phát huy thế mạnh.

Nhóm nghiên cứu lấy mẫu nước tại các điểm khảo sát.
Đặc biệt, nhóm nghiên cứu đã xác định được những dải phổ quan trọng từ ảnh vệ tinh, giúp tối ưu hóa mô hình và tiết kiệm chi phí trong việc thu thập dữ liệu tương lai. Từ kết quả phân tích, nhóm đã xây dựng bản đồ phân bố chất lượng nước theo không gian và thời gian - công cụ trực quan có giá trị cao trong quản lý tài nguyên và cảnh báo sớm nguy cơ ô nhiễm.
Nghiên cứu cũng đã xác định được các dải phổ quan trọng từ ảnh vệ tinh Sentinel-2, góp phần tối ưu hóa mô hình học máy và giảm thiểu chi phí thu thập dữ liệu trong tương lai. Từ kết quả mô hình, nhóm nghiên cứu đã xây dựng các bản đồ phân bố chất lượng nước theo không gian - thời gian thực, giúp theo dõi biến động và cảnh báo sớm nguy cơ ô nhiễm tại Vịnh Hạ Long. Các bản đồ này có thể được sử dụng trong công tác quản lý tài nguyên nước, hỗ trợ bảo vệ môi trường và định hướng phát triển bền vững khu vực ven biển.
Theo TS Vũ Anh Tuân, nghiên cứu không chỉ mở ra hướng tiếp cận mới trong giám sát chất lượng nước, mà còn góp phần nâng cao năng lực ứng dụng khoa học - công nghệ vào quản lý môi trường biển tại Việt Nam. Dù còn những giới hạn nhất định về dữ liệu thực địa và độ chính xác ở một số chỉ số, hệ thống đã chứng minh tiềm năng lớn nhờ khả năng cập nhật liên tục, phủ rộng không gian và tiết kiệm chi phí vận hành.
Thời gian tới, nhóm nghiên cứu sẽ mở rộng mô hình ra các khu vực ven biển khác trong cả nước. Trong đó, nhóm sẽ tập trung cải thiện độ chính xác của mô hình đối với các chỉ số như nhu cầu oxy hóa và nồng độ diệp lục-a thông qua việc bổ sung dữ liệu thực địa và thử nghiệm các phương pháp phân tích tiên tiến hơn. Đồng thời, tích hợp thêm dữ liệu từ các vệ tinh khác và hệ thống quan trắc hiện trường sẽ giúp tăng độ tin cậy và tính ứng dụng của mô hình.
Lê Hạnh