Ново изследване на SentinelOne показва защо много AI‑базирани процеси за анализ на зловреден софтуер дават неточни или подвеждащи резултати. Когато един‑единствен LLM работи върху изхода на само един инструмент за обратен инженеринг, моделът често интерпретира грешки, артефакти и шум като реални функционалности на малуера и ги усилва в крайния отчет.
Според изследователите проблемът не е в „халюцинации“ в класическия смисъл. Моделът прави точно това, което му е възложено, разсъждава върху данните, които получава. Но ако тези данни са шумни, резултатът неизбежно е изкривен. Всеки инструмент за обратен инженеринг има свои особености при парсване, свои артефакти и свои грешки, които LLM‑ът приема за достоверни.
За да проверят докъде стигат ограниченията на съвременните AI модели, екипът на SentinelLABS изгражда многоагентна система, която анализира macOS малуер. Вместо да разчита на един инструмент, системата третира различните платформи като radare2, Ghidra, Binary Ninja и IDA Pro като независими „анализатори“, които трябва да потвърдят или отхвърлят взаимно своите изводи.
Този подход значително повишава точността. Когато инструментите се държат като скептични участници в общ анализ, грешките се филтрират, а консенсусът се изгражда стъпка по стъпка. Изследването показва, че архитектурата на процеса е по‑важна от самия модел – подобренията идват от дизайна на пайплайна, а не от по‑големи или по‑фино настроени LLM‑и.
Основният извод е, че качеството на входните данни е решаващо. Артефакти от декомпилация, странности при парсване на низове и „мъртъв“ код създават шум, който един LLM ще усили, ако системата не е проектирана да го засича и отстранява предварително. Без такъв контрол AI‑базираните отчети могат да изглеждат убедителни, но да бъдат фундаментално погрешни.










