Kebocoran data sulit yang dikumpulkan oleh pembantu AI ke dalam repositori Git

Dengan populariti pembantu AI yang semakin meningkat, pembangun telah menyaksikan peningkatan dalam kes kebocoran data sensitif ke dalam repositori Git awam, selalunya antara maklumat yang disimpan oleh alatan AI dalam pokok kerja projek. Pembantu AI Claude Code, Cursor, Continue, Aider, OpenAI Codex, Copilot, Sourcegraph Cody dan Amazon Q mencipta fail konfigurasi dan direktori setempat dalam direktori root projek, yang boleh menyimpan, antara lain, sejarah operasi dan data konteks.

Fail yang disimpan oleh pembantu AI mungkin mengandungi kunci akses API, rentetan sambungan DBMS, pautan ke sumber dalaman dan kelayakan untuk menyambung ke persekitaran awan. Kelayakan ini diperoleh oleh pembantu AI semasa melaksanakan arahan, selepas bekerja dengan tetapan setempat atau ditangkap dalam konteks berkaitan projek. Bagi pembangun, pengumpulan data sedemikian dalam hierarki fail projek tidak jelas, jadi ramai yang terlupa untuk menambah direktori yang dicipta oleh pembantu AI pada fail .gitignore dan, selepas menerbitkan perubahan, memindahkannya ke repositori Git awam.

Utiliti claudleak dibangunkan untuk mengesan kebocoran sedemikian dalam repositori GitHub awam. Imbasan ujian GitHub mendedahkan bahawa kira-kira 2.4% repositori yang mengandungi subdirektori yang mengandungi tetapan pembantu AI mengandungi kunci atau kelayakan yang sah, yang kesahihannya telah disahkan melalui pemeriksaan berasingan. Pengarang utiliti tersebut menghadapi masalah apabila dia melihat fail bernama ".claude/settings.local.json" dalam repositorinya, yang mengandungi kunci akses dan kata laluan yang melalui pembolehubah persekitaran.

Pembangun yang menggunakan pembantu AI dinasihatkan untuk menambah direktori .claude/, .cursor/, .continue/, .copilot/ dan .aider/ pada fail .gitignore dan mengkonfigurasinya untuk diabaikan melalui penapis global menggunakan arahan "git config --global core.excludesfile file_with_list".

Sumber: opennet.ru

Tambah komen