Byl vydán systém pro filtrování spamu Rspamd 3.9. Poskytuje nástroje pro vyhodnocování zpráv na základě různých kritérií, včetně pravidel, statistických metod a černých listin, které se používají k určení konečné váhy zprávy, na základě které se rozhodne, zda ji blokovat. Rspamd podporuje prakticky všechny funkce implementované ve SpamAssassinu a má řadu funkcí, které mu umožňují filtrovat e-maily v průměru 10krát rychleji než SpamAssassin a zároveň poskytovat lepší kvalitu filtrování. Kód systému je napsán v jazyce C a je distribuován pod licencí Apache 2.0.
Rspamd je postaven na událostně řízené architektuře a je navržen pro vysoce zatěžované systémy, které zpracovávají stovky zpráv za sekundu. Pravidla pro detekci spamu jsou vysoce flexibilní a v nejjednodušší formě mohou obsahovat regulární výrazy, zatímco ve složitějších situacích je lze napsat v jazyce Lua. Funkcionalitu lze rozšířit a přidat nové typy kontrol pomocí modulů, které lze napsat v jazyce C a Lua. K dispozici jsou například moduly pro ověřování odesílatele pomocí SPF, potvrzování a další metody. doména Ověřování odesílatele pomocí DKIM, generování dotazů do seznamů DNSBL. Pro zjednodušení nastavení, vytváření pravidel a sledování statistik je k dispozici webové rozhraní pro správu.
V nové verzi:
- Bylo vylepšeno nastavení Bayesovského klasifikátoru. Výchozí velikost okna byla zmenšena z 5 na 2 slova, což zlepšuje výkon a snižuje spotřebu úložného prostoru čtyřnásobně, aniž by to ovlivnilo výkon klasifikace spamu. Pro testování klasifikátoru s různým nastavením je k dispozici nástroj „rspamadm classifier_test“.
- Byl přidán modul GPT, který využívá rozhraní OpenAI GPT API pro klasifikaci textu dotazováním velkých jazykových modelů, jako jsou GPT-3.5 Turbo a GPT-4o. Přesnost klasifikace spamu nového modulu je nižší než u Bayesovského klasifikátoru, ale jeho výhodou je, že nevyžaduje předběžné trénování a může zohlednit kontext zpráv, zatímco Bayesovský klasifikátor vyžaduje pro svou efektivitu vysoce kvalitní a vyvážené trénování enginu. Kromě přímé identifikace spamu ve zprávách lze modul GPT použít i k trénování Bayesovského klasifikátoru.
- Byla implementována možnost společného použití modulů known_senders a replies pro označení ověřených odesílatelů, přičemž jako indikátor se používá skutečnost, že jim již byly odeslány odpovědi.
- Ve výchozím nastavení je dynamická změna limitů rychlosti zpráv (dynamický limit rychlosti) spojená s jedním odesílatelem, příjemcem nebo IP adresa.
Zdroj: opennet.ru
