OpenAI реттеуші қысым жағдайында Anthropic-ке қарсы GPT-5.5-Cyber моделін ұсынады.

22 маусымда OpenAI бағдарламалық қамтамасыз етудің осалдықтарын іздеу, тексеру және түзетуге арналған GPT-5.5-Cyber мамандандырылған моделінің толық нұсқасын ресми түрде іске қосты. Бұл релиз өте маңызды сәтте — АҚШ үкіметі экспорттық шектеулер енгізіп, Anthropic компаниясын өзінің озық Claude Fable 5 және Mythos 5 модельдерін қайтарып алуға мәжбүр еткеннен кейін бірден жүзеге асып отыр.
GPT-5.5-Cyber OpenAI компаниясының Daybreak кешенді киберқорғау бағдарламасының негізгі компоненті болып табылады, ол сондай-ақ Codex Security құралын және қауіпсіздік саласындағы жетекші компаниялармен серіктестікті қамтиды. Модель жаппай пайдалануға арналмаған; оған тек авторизацияланған қорғаныс операцияларын орындау үшін тексерілген киберқауіпсіздік мамандары ғана қол жеткізе алады.
Стратегиялық мүмкіндік терезесі
9 маусымда Anthropic Claude отбасының екі нұсқасына қол жеткізуді ашқаннан кейін, AI-қауіпсіздік нарығындағы жағдай түбегейлі өзгерді. 12 маусымда компания АҚШ үкіметінің экспорттық бақылау аясындағы талабы бойынша бұл модельдерді өшіруге мәжбүр болды. Бұл ауыр зардаптарға әкелді: 23 маусымда Legion заң фирмасы АҚШ үкіметіне қарсы талап қойып, Anthropic модельдеріне қол жеткізудің жоғалуы олардың заң құжаттарын дайындау құралдарының жұмысын бұзғанын мәлімдеді.
OpenAI түбегейлі басқа тәсілді таңдады. Компания алдын ала барлық тексерулерді АҚШ федералды құрылымдарымен үйлестіріп, GPT-5.5-Cyper-ді тек тексерілген пайдаланушыларға ғана ашты. Бұл оларға реттеу тәуекелдерін болдырмауға және босаған тауашаны иеленуге мүмкіндік берді.
Техникалық сипаттамалар және бенчмарктар
OpenAI деректері бойынша, GPT-5.5-Cyber мамандандырылған тестілерде әсерлі нәтижелер көрсетеді. CyberGym бенчмаркінде модель 85,6% көрсетті, ал стандартты GPT-5.5 81,8% көрсетті. ExploitGym-де одан да үлкен айырмашылық байқалады: 39,5% қарсы 25,95%. SEC-bench Pro тестінде нәтижелер 69,8% қарсы 63,1% құрады.
Дегенмен, бұл сандардың контекстін түсіну маңызды. CyberGym бақыланатын орталарда белгілі осалдықтарды қайта жаңғыртуға бағытталған, бұл нақты шабуылдардың барлық спектрін қамтымайды. Сонымен қатар, Ұлыбританияның AI Қауіпсіздік Институтының деректері бойынша, The Last Ones корпоративтік шабуылын модельдеу сияқты күрделі көпқадамды сценарийлерде GPT-5.5-Cyber 10 әрекеттің 2-інде тестіден өтті, ал Anthropic-тің жаңартылған Mythos Preview нұсқасы 10 әрекеттің 6-ында сәтті болды.
Бәсекелестермен салыстыру
Anthropic-тің қайтарып алынған Mythos 5 моделімен тікелей салыстыру GPT-5.5-Cyber-дің CyberGym-де одан асып түскенін көрсетеді: 85,6% қарсы 83,8%. Алайда, The Last Ones сияқты күрделірек тестілер бойынша көрініс біркелкі емес. Бұл OpenAI-дің мамандандырылған моделі осалдықтарды қайта жаңғыртудың тар міндеттерінде күшті болғанымен, нақты шабуылдардың кешенді сценарийлерінде Anthropic артықшылығын сақтайтынын көрсетеді.
Экожүйе және қолжетімділік шектеулері
OpenAI сондай-ақ Akamai, Check Point, Cisco, CrowdStrike, IBM, Palo Alto Networks және басқалары сияқты алыптарды қамтитын Daybreak Cyber Partner Program бағдарламасын іске қосты. Сонымен қатар, HackerOne қатысуымен Trail of Bits компаниясымен бірлесіп жасалған ашық бастапқы жобаларға арналған Patch the Planet бастамасы жарияланды. Алғашқы қатысушылардың арасында — cURL, Go, Python және pyca/cryptography.
Менің жағдайды талдауым көрсеткендей, OpenAI іске қосу сәтін стратегиялық тұрғыдан дәл таңдап, Anthropic кеткеннен кейін пайда болған вакуумды толтырды. Алайда, киберқауіпсіздіктегі AI-қарулану жарысы енді ғана басталып жатыр. GPT-5.5-Cyber тар бенчмарктарда басымдық көрсеткенімен, нақты шабуыл сценарийлері әлі де Anthropic-те қалып отыр. Мәселе OpenAI-дің реттеу шектеулері ойын ережелерін қайта өзгерткенге дейін кешенді міндеттерде бәсекелесті қуып жете алатынында.