Trong bối cảnh tối ưu hóa phức tạp, nơi các giải pháp truyền thống gặp khó khăn, các nhà nghiên cứu đang khám phá những cách tiếp cận mới. Một trong những vấn đề hóc búa nhất là bài toán tối ưu hóa tuyến tính số nguyên hỗn hợp (MILP), thường gặp trong các lĩnh vực như vận tải, năng lượng và phân phối. Các thuật toán giải MILP hiện tại, mặc dù hiệu quả trong nhiều trường hợp, nhưng vẫn có thể mất hàng giờ hoặc thậm chí hàng ngày để đưa ra một giải pháp chấp nhận được. Vì vậy, I Find It Difficult To Find A Better Solution To That Problem bằng các phương pháp truyền thống.
Các công ty như FedEx thường phải sử dụng phần mềm chuyên dụng để giải quyết bài toán tối ưu hóa lộ trình giao hàng phức tạp trong mùa lễ. Phần mềm này, được gọi là trình giải MILP, chia bài toán lớn thành các phần nhỏ hơn và sử dụng các thuật toán chung để tìm giải pháp tốt nhất. Tuy nhiên, quá trình này có thể tốn rất nhiều thời gian.
Một nghiên cứu gần đây từ MIT và ETH Zurich đã sử dụng học máy để tăng tốc quá trình này. Các nhà nghiên cứu đã xác định một bước trung gian quan trọng trong trình giải MILP, nơi có quá nhiều giải pháp tiềm năng, làm chậm toàn bộ quá trình. Họ đã sử dụng một kỹ thuật lọc để đơn giản hóa bước này, sau đó sử dụng học máy để tìm giải pháp tối ưu cho một loại bài toán cụ thể.
Cách tiếp cận dựa trên dữ liệu này cho phép các công ty sử dụng dữ liệu của riêng mình để điều chỉnh trình giải MILP cho phù hợp với bài toán cụ thể. Kỹ thuật mới này đã tăng tốc trình giải MILP từ 30 đến 70% mà không làm giảm độ chính xác. Điều này có nghĩa là có thể đạt được một giải pháp tối ưu nhanh hơn hoặc, đối với các bài toán đặc biệt phức tạp, một giải pháp tốt hơn trong một khoảng thời gian hợp lý.
Phương pháp này có thể được sử dụng ở bất cứ nơi nào trình giải MILP được sử dụng, chẳng hạn như bởi các dịch vụ gọi xe, nhà điều hành lưới điện, nhà phân phối vắc-xin hoặc bất kỳ tổ chức nào phải đối mặt với một bài toán phân bổ nguồn lực khó khăn.
Cathy Wu, giáo sư trợ lý phát triển nghề nghiệp Gilbert W. Winslow tại Khoa Kỹ thuật Xây dựng và Môi trường (CEE) và là thành viên của Phòng thí nghiệm Hệ thống Thông tin và Quyết định (LIDS) và Viện Dữ liệu, Hệ thống và Xã hội (IDSS), cho biết: “Đôi khi, trong một lĩnh vực như tối ưu hóa, mọi người thường nghĩ về các giải pháp hoặc là thuần túy học máy hoặc là thuần túy cổ điển. Tôi tin chắc rằng chúng ta muốn có được những gì tốt nhất của cả hai thế giới, và đây là một hiện thân thực sự mạnh mẽ của cách tiếp cận kết hợp đó.”
Bài Toán Khó Giải
Các bài toán MILP có một số lượng giải pháp tiềm năng theo cấp số nhân. Ví dụ, một nhân viên bán hàng lưu động muốn tìm con đường ngắn nhất để ghé thăm một số thành phố và sau đó trở về thành phố xuất phát của họ. Nếu có nhiều thành phố có thể được ghé thăm theo bất kỳ thứ tự nào, số lượng giải pháp tiềm năng có thể lớn hơn số lượng nguyên tử trong vũ trụ.
Wu giải thích: “Những bài toán này được gọi là NP-khó, có nghĩa là rất khó có khả năng có một thuật toán hiệu quả để giải chúng. Khi bài toán đủ lớn, chúng ta chỉ có thể hy vọng đạt được một số hiệu suất dưới mức tối ưu.”
Một trình giải MILP sử dụng một loạt các kỹ thuật và thủ thuật thực tế có thể đạt được các giải pháp hợp lý trong một khoảng thời gian hợp lý.
Một trình giải điển hình sử dụng phương pháp chia để trị, đầu tiên chia không gian các giải pháp tiềm năng thành các phần nhỏ hơn bằng một kỹ thuật gọi là phân nhánh. Sau đó, trình giải sử dụng một kỹ thuật gọi là cắt để thắt chặt các phần nhỏ hơn này để chúng có thể được tìm kiếm nhanh hơn.
Cắt sử dụng một tập hợp các quy tắc để thắt chặt không gian tìm kiếm mà không loại bỏ bất kỳ giải pháp khả thi nào. Các quy tắc này được tạo ra bởi một vài chục thuật toán, được gọi là bộ tách, đã được tạo ra cho các loại bài toán MILP khác nhau.
Wu và nhóm của cô nhận thấy rằng quá trình xác định sự kết hợp lý tưởng của các thuật toán bộ tách để sử dụng, bản thân nó là một bài toán với một số lượng giải pháp theo cấp số nhân.
Cô nói: “Quản lý bộ tách là một phần cốt lõi của mọi trình giải, nhưng đây là một khía cạnh chưa được đánh giá cao của không gian bài toán. Một trong những đóng góp của công trình này là xác định bài toán quản lý bộ tách như một nhiệm vụ học máy ngay từ đầu.”
Thu Hẹp Không Gian Giải Pháp
Cô và các cộng tác viên của mình đã đưa ra một cơ chế lọc làm giảm không gian tìm kiếm bộ tách này từ hơn 130.000 tổ hợp tiềm năng xuống còn khoảng 20 tùy chọn. Cơ chế lọc này dựa trên nguyên tắc lợi nhuận cận biên giảm dần, nguyên tắc này nói rằng lợi ích lớn nhất sẽ đến từ một tập hợp nhỏ các thuật toán và việc thêm các thuật toán bổ sung sẽ không mang lại nhiều cải thiện.
Sau đó, họ sử dụng một mô hình học máy để chọn sự kết hợp tốt nhất của các thuật toán từ trong số 20 tùy chọn còn lại.
Mô hình này được đào tạo với một tập dữ liệu cụ thể cho bài toán tối ưu hóa của người dùng, vì vậy nó học cách chọn các thuật toán phù hợp nhất với nhiệm vụ cụ thể của người dùng. Vì một công ty như FedEx đã giải quyết các bài toán định tuyến nhiều lần trước đây, nên việc sử dụng dữ liệu thực tế thu thập được từ kinh nghiệm trong quá khứ sẽ dẫn đến các giải pháp tốt hơn so với việc bắt đầu lại từ đầu mỗi lần.
Quá trình học tập lặp đi lặp lại của mô hình, được gọi là contextual bandits, một hình thức học tăng cường, bao gồm việc chọn một giải pháp tiềm năng, nhận phản hồi về mức độ tốt của nó và sau đó thử lại để tìm một giải pháp tốt hơn.
Cách tiếp cận dựa trên dữ liệu này đã tăng tốc trình giải MILP từ 30 đến 70% mà không làm giảm độ chính xác. Hơn nữa, tốc độ tăng lên tương tự khi họ áp dụng nó cho một trình giải mã nguồn mở đơn giản hơn và một trình giải thương mại mạnh mẽ hơn.
Trong tương lai, Wu và các cộng tác viên của cô muốn áp dụng phương pháp này cho các bài toán MILP phức tạp hơn nữa, nơi việc thu thập dữ liệu được gắn nhãn để đào tạo mô hình có thể đặc biệt khó khăn. Cô nói, có lẽ họ có thể đào tạo mô hình trên một tập dữ liệu nhỏ hơn và sau đó điều chỉnh nó để giải quyết một bài toán tối ưu hóa lớn hơn nhiều. Các nhà nghiên cứu cũng quan tâm đến việc giải thích mô hình đã học để hiểu rõ hơn về hiệu quả của các thuật toán bộ tách khác nhau.