L’agent utilisant un ordinateur, également communément appelé agent utilisateur d’ordinateur, est une forme qui a attiré beaucoup d’attention lors des récentes améliorations des capacités de l’agent. La plus grande différence entre lui et les chatbots ordinaires n’est pas qu’il répond plus intelligemment, mais qu’il peut commencer à regarder directement l’écran, reconnaître les éléments de l’interface et utiliser des ordinateurs ou des pages web en cliquant, en tapant, en faisant défiler, etc. En termes simples, il ne se contente pas de vous dire « quoi faire », il commence réellement à le faire pour vous.
Cette capacité est importante car de nombreux systèmes logiciels dans le monde réel ne disposent pas d’API standard prêtes pour l’IA. De nombreux systèmes en arrière-plan, anciennes pages web et flux de travail complexes sont difficiles à automatiser, mais la valeur des agents d’utilisation informatique réside dans le fait qu’ils contournent le principe qu’il doit y avoir une interface spéciale et accomplissent les tâches directement via l’interface graphique.
Pourquoi il est abordé séparément pour en discuter
Parce qu’elle fait progresser l’IA de « l’interaction linguistique » à « l’action de l’interface graphique ». Cela signifie que les limites des capacités de l’IA ne se limitent plus à la génération de texte, mais commencent à vraiment interagir avec les boutons, menus, formulaires et fenêtres dans le monde numérique, ce qui est très pertinent pour l’automatisation, les processus d’entreprise et les systèmes d’agences.
À quels scénarios convient-il ?
Les scénarios courants incluent les tests web, la saisie de doublons, les opérations inter-systèmes, l’automatisation système héritée et les tâches basées sur des processus qui seraient autrement difficiles à traiter rapidement avec la RPA traditionnelle. Ce qui l’attire le plus, c’est qu’il est plus polyvalent.
Pourquoi cela comporte aussi des risques
- Elle touche l’interface réelle et les données réelles
- Le coût des mauvais traitements peut être plus élevé que les erreurs de chat classiques
- Les contrôles de privilèges, les mécanismes de confirmation et les environnements d’isolement deviennent particulièrement importants
Ainsi, la véritable signification des ordinateurs utilisant des agents n’est pas aussi simple que « l’IA clique sur la souris », mais l’IA passe de la compréhension de l’information à l’exécution d’actions. C’est pourquoi il est devenu un concept clé dans la nouvelle série de discussions sur les procurations.