AgentScope 1.0 Open Source : un cadre multi-agents contrôlable pour les développeurs, couvrant l’ensemble du cycle de vie de la création, du déploiement et de la surveillance
Il s’agit d’un ensemble d’infrastructure d’IA et de grands modèles conçus pour les développeurs. AgentScope 1.0 utilise une architecture à trois couches pour couvrir la construction et l’orchestration des agents, le déploiement au niveau de la production et l’exécution de la sécurité, le développement visuel et la surveillance et l’évaluation, en mettant l’accent sur la gestion modulaire, asynchrone et intelligente du contexte, en s’adaptant aux flux de travail automatisés avec plusieurs agents et appels d’outils, et en facilitant la collaboration avec des outils d’IA tels que ChatGPT et Claude.
1. Architecture à trois couches et matrice de capacités
1. AgentScope Core : orchestrable, interruptible et évolutif
Le cadre de base adopte une conception hautement modulaire et asynchrone, offrant une utilisation flexible des outils, une interruption et une récupération en temps réel, une gouvernance contextuelle et des politiques de mémoire, et prend en charge la collaboration et le routage multi-agents. Il est pratique d’incorporer ChatGPT et Claude dans l’orchestration unifiée.
2. AgentScope Runtime : bac à sable sécurisé et déploiement en un clic
Leruntime fournit un bac à sable d’outils isolé pour garantir la sécurité de l’exécution du code et du fonctionnement des fichiers. Il dispose de capacités de déploiement, de journalisation et d’observabilité en un clic, et est compatible avec les frameworks d’agents courants et les grands modèles, ce qui permet aux outils d’IA d’être lancés de manière stable dans l’environnement de production.
3. AgentScope Studio : surveillance visuelle du développement et de l’évaluation
Studio fournit aux développeurs un débogage visuel, un suivi des flux d’exécution, une surveillance des changements d’état et de la consommation des ressources, ainsi qu’un système d’évaluation intégré pour aider à localiser rapidement les goulots d’étranglement, reproduire les expériences et optimiser les invites et les stratégies.
2. Ingénierie de l’itinéraire d’atterrissage
1. Processus automatisé de la configuration à la mise en service
Les rôles, les outils, les itinéraires et les SLA sont définis en YAML ou pilotés par la configuration. Entrez dans le bac à sable de sécurité et le système de journalisation de Runtime après le débogage conjoint local. Terminez la lecture, l’évaluation et la précipitation Kanban dans Studio pour obtenir une livraison continue des outils d’IA.
2. Collaborer avec de grands modèles et outils grand public
Mixez ChatGPT et Claude pour effectuer la planification et l’examen sous le même arrangement, puis exécutez des appels d’outils par des modèles spécifiques ; Stabilisez la latence et le débit dans les scénarios de pointe grâce à la limitation de débit, aux nouvelles tentatives, à la mise en cache et aux limites de simultanéité.
(1) Liste des meilleures pratiques
(a) Configurer les invites système et la terminologie pour les agents clés
(b) Configurer des listes blanches, des délais d’expiration et des journaux d’audit pour les outils
(c) Activer la récupération des interruptions et les points de contrôle pour réduire le taux
3. Valeur
orientée métier 1. Stable et contrôlable
Laplanification asynchrone et la récupération des interruptions rendent les tâches longues plus contrôlables ; Le bac à sable de sécurité réduit le risque d’extension excessive et de fuite de données pour répondre aux exigences de conformité.
2. Observable et optimisable
L’observation de bout en bout, de la chaîne d’appels à la consommation de ressources, avec des ensembles d’évaluation et de régression, améliore continuellement la qualité et l’efficacité de l’automatisation de l’apprentissage automatique.
3. Migrable et intégrable
Compatible avec les cadres et les écosystèmes d’outils grand public, il est pratique d’intégrer ChatGPT, Claude, les API internes et les bases de données existantes dans une chaîne d’outils d’IA unifiée.
4. Scénarios applicables et limites
1. Scénarios applicables
Service client multi-tours, assistant de code, gouvernance des données, récupération et reporting, O&M et automatisation des terminaux, recherche et simulation multi-agents, etc.
2. Limites et attention
Lestâches à longue trajectoire doivent contrôler le contexte et le coût ; Les outils externes doivent être minimalement privilégiés et strictement audités ; L’examen humain et la vérification croisée à double modèle sont introduits pour les décisions clés.
Foire aux questions (Q&R)
Q : Comment AgentScope fonctionne-t-il avec ChatGPT et Claude ?
R : ChatGPT est utilisé pour la décomposition des tâches et la planification de la récupération, Claude est utilisé pour la sécurité et l’examen du style, et l’exécution de base est complétée par l’orchestration multi-agents AgentScope et le bac à sable des outils, formant une boucle fermée d’intelligence et d’automatisation.
Q : Quels problèmes spécifiques le sandbox de sécurité de Runtime résout-il ?
R : Placez les opérations de fichiers, l’exécution de code et l’accès au réseau dans un environnement isolé, et coopérez avec les autorisations et les audits pour réduire les risques de données et de sécurité causés par les appels d’outils, ce qui est adapté aux scénarios de conformité d’entreprise.
Q : Quels sont les avantages de l’examen et de la visualisation de Studio ?
A : Observation en temps réel du flux d’exécution et des changements d’état, localisation des goulets d’étranglement et des anomalies ; Combinez des tableaux de bord de lecture et d’indicateurs pour optimiser rapidement les invites, le routage et les stratégies de simultanéité afin d’améliorer la stabilité des outils d’IA.
Q : Quels sont les avantages par rapport à la solution « un seul grand modèle » ?
R : L’orchestration multi-agents et multi-modèles est plus flexible : ChatGPT et Claude sont bons pour la planification et la révision, tandis que d’autres modèles sont bons pour l’exécution et l’appel d’outils ; AgentScope unifie le contexte de gouvernance, les autorisations et la tolérance aux pannes, réduisant ainsi les coûts globaux et les taux d’échec.