Trasformazione di A* in ricerca di percorsi multi-agente (prima fase - preferenza di mappa)
Nel regno dell'intelligenza artificiale, intraprendiamo un viaggio affascinante lungo il percorso dei "sistemi a agenti multipli" - un'evoluzione intrigante dal classico algoritmo A* al Multi-Agent Reinforcement Learning (MARL). Questa serie di articoli ci guiderà in un tour coinvolgente, partendo dalla ricerca del percorso ottimale per agenti multipli e progressivamente abbandonando le assunzioni.
La nostra prima tappa è A*, un algoritmo rinomato progettato per risolvere il problema del percorso. È uno strumento semplice ma potente che trova il percorso più breve tra due punti per un agente singolo, sotto le assunzioni di tempo discretizzato, azioni deterministiche e conoscenza completa del mondo.
Mentre procediamo, incontriamo il problema del Multi-Agent Pathfinding (MAPF), un'estensione di A* che affronta la sfida di trovare il percorso più breve per più agenti senza collisioni. Il fattore di ramificazione esponenziale che deriva dall'estensione di A* a MAPF è stato un ostacolo nel campo. Tuttavia, soluzioni innovative come la rilevazione dell'indipendenza (ID) e la decomposizione degli operatori (OD), proposte da Standley, sono state fondamentali per affrontare questo problema.
Una di queste soluzioni è CBS (Search Based on Conflicts), un risolvitore a due livelli per MAPF. Funziona cercando nello spazio dei conflitti e utilizzando un risolvitore di livello superiore per cercare l'albero delle costrizioni (CT) e un risolvitore di livello inferiore per trovare un percorso più breve coerente con un insieme di costrizioni. Se viene trovato un conflitto, il risolvitore di livello superiore controlla i conflitti nei percorsi più brevi degli agenti singoli e suddivide il nodo CT corrispondente, generando nodi con costrizioni che evitano il conflitto.
Un'altra linea di lavoro per MAPF implica la riduzione del problema ad altri problemi NP-difficili, come la soddisfacibilità booleana (SAT), la programmazione lineare intera mista (MIP) e la programmazione costrittiva (CP). Questo approccio ha recentemente prodotto algoritmi MAPF estremamente potenti.
La complessità temporale di ICTS (Search Tree Search con costo crescente), un altro risolvitore a due livelli per MAPF, è esponenziale in base alla profondità dell'albero ICT, mentre il tempo di esecuzione di CBS è esponenziale rispetto al numero di conflitti che deve risolvere.
La variante dinamica di MAPF la estende per renderla pratica per una vasta gamma di problemi pratici interessanti, ma non è l'oggetto di questa serie di articoli. Invece, esamineremo il problema generale della pianificazione AI e progressivamente rimuoveremo sempre più assunzioni fino ad arrivare al Multi-Agent Reinforcement Learning.
L'autore di questa serie ringrazia Roni Stern, il suo supervisore della tesi di laurea magistrale, per il suo interesse in questo campo e per gran parte di questa serie di blog. Il periodo di sviluppo degli algoritmi per il Multi-Agent Pathfinding è stato definito in base alla loro applicazione ai problemi offline di Multi-Agent Pickup and Delivery (MAPD), con un focus sui recenti progressi intorno al 2025.
Le due principali metriche per la lunghezza del percorso in MAPF sono la Somma dei Costi e il Tempo di Consegna. Man mano che ci addentriamo nel mondo dei sistemi a agenti multipli, scopriremo di più su queste metriche e gli algoritmi intricati che li rendono possibili.
Restate sintonizzati mentre continuiamo il nostro viaggio nel mondo affascinante dei sistemi a agenti multipli, da A* a MARL, esplorando le complessità e le soluzioni che si trovano al loro interno.
Leggi anche:
- Tre donne anziane, affezionatamente chiamate nonne di Kaha Aden, costituiscono una parte significativa della comunità.
- Treyarch esprime l'ambizione di creare qualcosa di completamente diverso.
- Laureato in ingegneria alla NASA che si impegna a costruire robot per le giunture di marijuana
- WinZO entra nel mercato statunitense con il debutto di ZO TV, dopo la cessazione delle operazioni di gioco con soldi reali in India