GitHub hat ein maschinelles Lernsystem implementiert, um nach Schwachstellen im Code zu suchen

GitHub kündigte die Hinzufügung eines experimentellen maschinellen Lernsystems zu seinem Code-Scan-Dienst an, um häufige Arten von Schwachstellen im Code zu identifizieren. In der Testphase ist die neue Funktionalität derzeit nur für Repositories mit Code in JavaScript und TypeScript verfügbar. Es wird darauf hingewiesen, dass der Einsatz eines maschinellen Lernsystems es ermöglicht hat, das Spektrum der identifizierten Probleme erheblich zu erweitern, wobei das System bei der Analyse nicht mehr auf die Überprüfung von Standardvorlagen beschränkt ist und nicht an bekannte Frameworks gebunden ist. Zu den durch das neue System festgestellten Problemen zählen Fehler, die zu Cross-Site-Scripting (XSS), Verzerrung von Dateipfaden (z. B. durch die Angabe von „/..“) und der Ersetzung von SQL- und NoSQL-Abfragen führen.

Mit dem Code-Scan-Dienst können Sie Schwachstellen in einem frühen Stadium der Entwicklung erkennen, indem Sie jeden „Git-Push“-Vorgang auf potenzielle Probleme scannen. Das Ergebnis wird direkt an den Pull-Request angehängt. Zuvor wurde die Prüfung mithilfe der CodeQL-Engine durchgeführt, die Vorlagen mit typischen Beispielen für anfälligen Code analysiert (CodeQL ermöglicht die Erstellung einer Vorlage für anfälligen Code, um das Vorhandensein einer ähnlichen Schwachstelle im Code anderer Projekte zu identifizieren). Die neue Engine, die maschinelles Lernen nutzt, kann bisher unbekannte Schwachstellen identifizieren, da sie nicht an die Aufzählung von Codevorlagen gebunden ist, die bestimmte Schwachstellen beschreiben. Der Preis dieser Funktion besteht im Anstieg der Anzahl falsch positiver Ergebnisse im Vergleich zu CodeQL-basierten Prüfungen.

Source: opennet.ru

Kommentar hinzufügen