Phân Tích Dữ Liệu Lượng Mưa ở Pakistan Trong Nửa Thế Kỷ Qua

Nghiên cứu này sử dụng dữ liệu lượng mưa thu thập từ 82 trạm khí tượng khác nhau, phân bố ngẫu nhiên trên khắp Pakistan. Dữ liệu bao gồm các giá trị lượng mưa trung bình hàng năm (dựa trên dữ liệu lượng mưa trung bình hàng tháng) trong khoảng thời gian nửa thế kỷ, từ năm 1961 đến năm 2020. Các nguồn dữ liệu chính bao gồm Cục Khí tượng Pakistan, Cơ quan Bảo vệ Môi trường Pakistan, Viện Phát triển Hydrocarbon Pakistan và Bộ Biến đổi Khí hậu Pakistan.

Để giảm tính chủ quan, độ lệch của dữ liệu cũng được phân tích, cho thấy dữ liệu tổng thể bị lệch dương (hệ số = 3.562). Để giảm độ lệch này, hai phương pháp thường được sử dụng, phép biến đổi logarit và phép biến đổi Box-Cox, đã được áp dụng để so sánh biến đổi dữ liệu. Phép biến đổi logarit giảm độ lệch xuống -2.1337, và phép biến đổi Box-Cox giảm xuống -0.1484 (Hình bổ sung S2); do đó, dữ liệu được biến đổi sau (λ = 0.29) đã được sử dụng cho các phân tích tiếp theo.

Phương Pháp Nội Suy Tối Ưu và Đánh Giá Không Gian Lượng Mưa

Các phương pháp nội suy không gian có thể phụ thuộc vào dữ liệu hoặc thậm chí biến số cụ thể. Do kết quả nội suy không gian nhạy cảm với sự phụ thuộc của phương pháp vào các đặc điểm của bộ dữ liệu có sẵn, việc lựa chọn một phương pháp chính xác và tối ưu hóa các giá trị nội suy là một bước chủ quan nhưng quan trọng để tạo ra các bản đồ phân bố chính xác của các hiện tượng liên tục vốn có như lượng mưa và nhiệt độ. Với sự đa dạng của các phương pháp nội suy hiện có để ước tính các giá trị lượng mưa chưa biết, nghiên cứu này đã phân tích một cách hệ thống các phương pháp nội suy không gian để đánh giá mức độ ảnh hưởng của chúng đến các giá trị lượng mưa ước tính chưa biết. Hầu hết các nghiên cứu hiện có trong lĩnh vực này chỉ cung cấp một so sánh hạn chế về các phương pháp nội suy, dựa trên một hoặc một vài thống kê lỗi được chọn để chọn phương pháp tối ưu. Nghiên cứu này đã phân tích gần như tất cả các phương pháp nội suy được biết đến; hơn nữa, các mô hình khác nhau trong các phương pháp này đã được xem xét để tìm ra phương pháp tối ưu nhất để nội suy dữ liệu lượng mưa trong khu vực nghiên cứu.

Dựa trên đánh giá toàn diện các tài liệu, chúng tôi đã chọn các kỹ thuật nội suy dưới hai loại khác nhau: tất định và ngẫu nhiên. Đối với danh mục ngẫu nhiên, các mô hình bán phương sai khác nhau cũng được xem xét (ví dụ: Circular, Spherical, Exponential, Gaussian, Hole effect, K-Bessel và J-Bessel), vì chúng được biết là có ảnh hưởng đáng kể đến việc dự đoán các giá trị biến khí hậu chưa biết. Trong nghiên cứu này, việc kiểm định chéo tập trung vào ước tính tham số phạm vi đã được sử dụng để tối ưu hóa các mô hình bán phương sai và các tham số liên quan như nugget, sill và range. Phương pháp nội suy diện tích đã bị loại trừ khỏi so sánh này, vì phương pháp đó yêu cầu dữ liệu được gán cho các đa giác (diện tích) và dữ liệu của chúng tôi được thu thập từ các trạm riêng lẻ.

Danh mục tất định đại diện cho bốn phương pháp, bao gồm phương pháp trọng số khoảng cách nghịch đảo (IDW), nội suy đa thức toàn cục (GPI), nội suy đa thức cục bộ (LPI) và hàm cơ sở xuyên tâm (RBF). Ngược lại, danh mục ngẫu nhiên trình bày năm phương pháp bao gồm phương pháp Kriging thông thường (OK), Kriging đơn giản (SK), Kriging phổ quát (UK), Kriging Bayesian thực nghiệm (EBK) và dự đoán hồi quy Kriging Bayesian thực nghiệm (EBKRP). Mục tiêu chung của tất cả các phương pháp nội suy được chọn là ước tính giá trị chưa biết của (hat{Z}) tại điểm (x_{0}).

Phương pháp tất định

Phương pháp trọng số khoảng cách nghịch đảo (IDW) là một trong những phương pháp nội suy cục bộ được sử dụng rộng rãi, chính xác và nhanh chóng nhất. Phương pháp này không yêu cầu các giả định chủ quan hoặc mô hình hóa trước khi chọn mô hình bán phương sai, mang lại lợi thế so với các phương pháp khác, đặc biệt là Kriging. Theo phương pháp này, các giá trị được ước tính bằng cách sử dụng một tổ hợp tuyến tính của giá trị tại điểm được lấy mẫu, được trọng số bởi một hàm nghịch đảo của khoảng cách giữa hai điểm. Phương pháp này giả định rằng các điểm quan sát gần điểm dự đoán hơn thì tương tự hơn so với các điểm ở xa hơn.

Nội suy đa thức toàn cục (GPI) là một phương pháp bề mặt xu hướng toàn cục, trơn tru (không chính xác) và tất định, lý tưởng để giải quyết nhu cầu đưa ra ít quyết định trong bối cảnh các tham số mô hình. Phương pháp tất định này có một giả định cơ bản là mô hình phù hợp trong mỗi bề mặt liên tục được dự đoán đại diện cho các xu hướng bề mặt thay đổi dần dần trong khu vực.

Nội suy đa thức cục bộ (LPI) là một phương pháp linh hoạt hơn GPI, là một phương pháp bề mặt xu hướng cục bộ, nhanh chóng và trơn tru. Thay vì điều chỉnh một đa thức trên toàn bộ khu vực, như trong GPI, LPI điều chỉnh các đa thức khác nhau chồng lên nhau trong một vùng lân cận cụ thể.

Hàm cơ sở xuyên tâm (RBF) là một dạng mạng nơ-ron nhân tạo dựa trên cấu trúc ba lớp chuyển tiếp (tức là lớp đầu vào, lớp ẩn và lớp đầu ra). Các phương pháp nội suy được bao phủ bởi RBF bao gồm spline tấm mỏng, spline dựa trên độ căng, spline được điều chỉnh và hàm đa bậc hai.

Phương pháp địa thống kê

Kriging đơn giản (SK) là một phương pháp nội suy linh hoạt về bản chất và có thể vừa trơn tru vừa chính xác. Do đó, nó tạo ra các bề mặt khác nhau như xác suất, sai số chuẩn và bề mặt dự đoán. SK dựa trên ước tính Kriging. Trong SK, người ta giả định rằng thành phần xu hướng là một hằng số đã biết chính xác cho toàn bộ khu vực nghiên cứu, được ước tính bằng giá trị trung bình của dữ liệu đo được.

Kriging thông thường (OK) còn được mô tả là từ viết tắt BLUE, đại diện cho “ước tính tuyến tính không thiên lệch tốt nhất”. Sự khác biệt duy nhất giữa OK và SK là trong OK, (mu) (hằng số xu hướng chưa biết) cần được ước tính. Một trong những cân nhắc chính của OK là nó giả định rằng các giá trị trung bình vẫn không đổi trên toàn bộ khu vực cần nội suy.

Kriging phổ quát (UK) còn được gọi là Kriging hồi quy, Kriging với xu hướng và Kriging dựa trên trôi dạt bên ngoài. UK còn được gọi là một phần mở rộng đa biến của OK, sử dụng hàm xu hướng tuyến tính hoặc tất định cao hơn (mu left( {x_{i} } right)) thay vì dựa vào hàm xu hướng không đổi (mu).

Kriging Bayesian thực nghiệm (EBK) là một kỹ thuật nội suy mạnh mẽ và đơn giản, đòi hỏi mô hình hóa tương tác tối thiểu. Trong kỹ thuật nội suy địa thống kê này, các khía cạnh khó khăn nhất của việc xây dựng mô hình Kriging được tự động hóa. Điều này ngụ ý rằng, thay vì điều chỉnh các tham số để nhận được kết quả chính xác theo cách thủ công, EBK tính toán các tham số tự động bằng cách sử dụng một quy trình chia nhỏ và mô phỏng.

Dự đoán hồi quy Kriging Bayesian thực nghiệm (EBKRP) là một phương pháp nội suy địa thống kê tương đối mới. Nó là một dạng nâng cao của EBK và xem xét các chỉ số giải thích bổ sung khác nhau (ở định dạng raster) được biết là có ảnh hưởng đến việc ước tính biến phụ thuộc — đóng vai trò là thông tin trước. Trong phương pháp này, phân tích hồi quy được kết hợp với phương pháp Kriging để làm cho các phép nội suy chính xác hơn so với các phép nội suy được ước tính chỉ bằng Kriging và hồi quy. Trong nghiên cứu này, dữ liệu độ cao đã được sử dụng làm biến giải thích do ảnh hưởng của nó đối với lượng mưa.

So sánh các phương pháp nội suy dựa trên nhiều tham số kiểm định chéo

Các tham số khác nhau của kiểm định chéo (một phương pháp thống kê nổi tiếng để đánh giá độ chính xác của dữ liệu nội suy) đã được sử dụng để đánh giá hiệu suất của các phương pháp nội suy khác nhau. Trong kiểm định chéo, hiệu suất của nội suy được xác định bằng cách lặp đi lặp lại việc loại bỏ một giá trị quan sát được khỏi tập dữ liệu và ước tính lại giá trị đó bằng cách sử dụng các giá trị còn lại. Một lỗi được xác định bằng cách ước tính sự khác biệt giữa mỗi giá trị quan sát được (đo được) và giá trị dự đoán. Các thống kê kiểm định chéo được thực hiện trên các lỗi này được kỳ vọng là các ước tính đánh giá hợp lý để so sánh các mô hình nội suy khác nhau và tạo thành cơ sở của quy trình lựa chọn phương pháp. Dựa trên đánh giá tài liệu rộng rãi, chúng tôi tập trung vào sáu phương pháp kiểm định chéo: sai số trung bình (ME), sai số bình phương gốc trung bình (RMSE), Pearson R2 (R2), sai số chuẩn hóa trung bình (MSE), sai số chuẩn hóa bình phương gốc trung bình (RMSSE) và sai số chuẩn trung bình (ASE).

Để tạo điều kiện thuận lợi cho quá trình lựa chọn này, một chỉ số phù hợp (AI) đã được tính toán dựa trên các chỉ số/tham số kiểm định chéo cơ bản và đóng góp của chúng đối với sự phù hợp của một phương pháp nội suy nhất định. Các phương pháp xác thực này được coi là đóng góp tích cực nếu việc tăng giá trị chỉ số dẫn đến phương pháp nội suy phù hợp hơn các phương pháp khác và ngược lại. Trong số các tham số này, việc tăng giá trị tham số (đối với tất cả các tham số trừ R2) cho thấy rằng kỹ thuật nội suy ít phù hợp hơn. Để tính toán AI, các giá trị của tất cả các tham số đã được chuẩn hóa thành không thứ nguyên bằng phương pháp chuẩn hóa tối thiểu-tối đa.

Phân tích thời gian của lượng mưa ở Pakistan

Để phân tích xu hướng lượng mưa theo thời gian ở Pakistan, bài kiểm tra Mann-Kendall và ước tính độ dốc của Sen đã được chọn để đánh giá dài hạn.

Ngoài ra, một thuật toán phát hiện thay đổi chế độ đã được áp dụng để đánh giá xu hướng lượng mưa giữa các thập kỷ ở Pakistan. Thuật toán này dựa trên bài kiểm tra t của Student, nhạy cảm với độ lệch trong các giá trị trung bình chạy liên tiếp của các giá trị biến dưới một độ dài cắt cụ thể (trong trường hợp này là 10 năm). Các chế độ thay đổi này (các biến thể giữa các thập kỷ) đã được phân tích với độ tin cậy 90%. Cả đánh giá dài hạn và ngắn hạn đều được thực hiện ở cấp quốc gia và cấp quốc gia (tỉnh) để cung cấp những hiểu biết chi tiết hơn.

Comments

No comments yet. Why don’t you start the discussion?

Leave a Reply

Your email address will not be published. Required fields are marked *