Depuis juin, l’outil de programmation de l’IA Copilot est accessible à tous. Comme l’Opensource transmet des données à sa société mère Microsoft, cela pose des problèmes à certains développeurs. Enter FauxPilot, une plate-forme qui fonctionne de manière indépendante et ne transmet pas (ou beaucoup moins) de données.
Copilot fonctionne avec un codex Open AI, basé sur GPT-3 et entraîné sur des milliards de codes publics dans le dépôt GitHub. Cependant, Microsoft et GitHub ne précisent pas quels dépôts (un emplacement ou une combinaison d’emplacements distribués contenant des données) informent le codex. Cela peut créer des problèmes de sécurité pour les grands développeurs.
Alternative sans transfert de données
Dans un billet de blog publié au début de l’année, Bradley Kuhn (Software Freedom Conservancy) a écrit que « le copyleft de Copilot constitue un défi pour les utilisateurs. À mesure que l’outil gagne en popularité et s’améliore, la responsabilité des utilisateurs augmentera également. Actuellement, ces utilisateurs ne disposent que d’une supposition éclairée pour savoir si une sortie de Copilot est protégée par le droit d’auteur de quelqu’un d’autre. »
FauxPilot, développé par Brendan Dolan-Gavitt (NYU Tandon) n’utilise pas de codex mais repose sur CodeGen de Salesforce. Bien que les utilisateurs de logiciels libres (Free and Open Source Software) puissent ne pas l’apprécier non plus. Car tout comme Copilot, CodeGen est formé sur des sources ouvertes publiques, sans tenir compte des différentes licences.
L’avantage de FauxPilot est qu’il peut exécuter des logiciels assistés par l’IA sur site. « Certains utilisateurs ont des problèmes de sécurité et ne peuvent pas, ne veulent pas ou ne devraient pas envoyer de données via Copilot. Pour eux, il est important de n’utiliser l’outil que localement », explique Dolan-Gavitt.
Plate-forme de recherche
Selon Dolan-Gavitt, FauxPilot est une plate-forme de recherche destinée à former le code afin de générer des résultats plus sûrs. « Une fois que nous y serons parvenus, nous pourrons tester ce code et peut-être le faire avec les utilisateurs de Copilot. La création d’un ensemble de données sans problèmes de sécurité constitue un défi majeur, car ces modèles sont extrêmement dépendants des données », explique Dolan-Gavitt.
Le chercheur indique également que ceux qui utilisent FauxPilot avec l’extension officielle Visual Studio Code Copilot continueront à envoyer des données à GitHub et à Microsoft. Mais pas des requêtes code completion. « Dès que nous aurons notre propre extension VSCode, ce problème sera résolu », a-t-il déclaré.
En bref, FauxPilot n’envoie aucune donnée à Microsoft ou à GitHub. Ceux qui veulent une expérience de travail totalement sans Microsoft avec VSCode devraient utiliser l’extension de FauxPilot dès qu’elle sera prête.