OpenAI a annoncé le lancement d’un programme public Safety Bug Bounty, axé sur les abus d’IA et les risques de sécurité dans ses produits. Le projet complète la prime de sécurité sur les bugs existants et se concentre sur des scénarios autres que les violations de sécurité traditionnelles pouvant causer des dommages réels.
Le champ d’action actuel inclut les risques basés sur des proxys, l’injection de prompts tiers et la fuite de données, la fuite d’informations propriétaires d’OpenAI, ainsi que les questions liées à l’intégrité des comptes et des plateformes. Certains cas nécessitent un taux de réussite de reproduction d’au moins 50 % et doivent refléter des préjudices réels et quantifiables. Les jailbreaks de contenu général, les résultats impolis ou les informations facilement accessibles via la recherche ne sont pas éligibles aux récompenses du programme.
Les participants doivent soumettre via l’application Bugcrowd. OpenAI a indiqué que les signalements seront pris en charge par l’équipe de sécurité et de sûreté, et que certains problèmes pourraient également être transférés au programme initial de prime sur les violations de sécurité.
FAQ
Q : Qu’est-ce que la prime sur les bogues de sécurité d’OpenAI ?
R : Il s’agit d’un programme de prime de sécurité destiné au public qui reçoit spécifiquement des signalements sur les abus d’IA et les risques de sécurité.
Q : Quelle est la différence entre Safety Bug Bounty d’OpenAI et Security Bug Bounty ?
R : Le premier se concentre davantage sur les abus, les préjudices et les scénarios de sécurité modéliques, tandis que le second se concentre davantage sur les vulnérabilités de sécurité traditionnelles.
Q : Quelles questions ne sont pas couvertes par les récompenses d’OpenAI ?
R : Les évasions normales, les contournements stratégiques sans préjudice apparent, et les informations facilement accessibles au public ne sont généralement pas pris en compte.
Q : Comment les chercheurs peuvent-ils participer au Safety Bug Bounty d’OpenAI ?
R : Les chercheurs doivent postuler via la page Bugcrowd et soumettre des documents de reproduction conformément aux règles.