Загадъчен AI модел развълнува разработчиците: Дали това е най-новият хит на DeepSeek?

Безплатният модел, наречен Hunter Alpha, се появи на платформата OpenRouter на 11 март без никаква информация за разработчика

10:54 | 18.03.26 г.

Снимка: Raul Ariano/Bloomberg

Мощен модел с изкуствен интелект, който се появи анонимно на платформа за разработчици миналата седмица, предизвиква спекулации, че китайският стартъп DeepSeek може би тихо тества системата си от ново поколение преди официалното ѝ пускане, съобщава Ройтерс.

Безплатният модел, наречен Hunter Alpha, се появи на платформата OpenRouter на 11 март без никаква информация за разработчика и по-късно беше описан от платформата като „стелт модел“.

По време на тестове, проведени от Ройтерс, чатботът Hunter Alpha се описа като „китайски модел с изкуствен интелект, обучен предимно на китайски“ и заяви, че данните за обучението му обхващат периода до май 2025 г. – същата крайна точка на знанията, съобщена от собствения чатбот на DeepSeek.

Когато обаче беше попитан за своя създател, системата отказа да идентифицира разработчика си.

„Знам само името си, мащаба на параметрите си и дължината на контекстния си прозорец“, каза чатботът.

Нито DeepSeek, нито OpenRouter са идентифицирали създателя на модела и не са отговорили на запитванията за коментар.

Профилната страница на Hunter Alpha го описва като модел с 1 трлн. параметъра, което означава, че е обучен с помощта на приблизително един трилион регулируеми стойности, които определят как системата обработва езика и генерира отговори. Моделите с повече параметри обикновено изискват значително повече изчислителна мощност, за да функционират.

Системата също така се отличава с контекстен прозорец от до 1 млн. токена – показател за това колко текст може да обработи или запомни един AI модел по време на едно взаимодействие. Един токен съответства приблизително на кратък фрагмент от текст, като например част от дума.

„Комбинацията, която се открои, беше контекстът от 1 млн. токена на Hunter Alpha, съчетан със способност за разсъждение и свободен достъп“, заяви Набил Хауам, инженер, който разработва системи за AI агенти.

„Повечето авангардни модели с такъв контекстен прозорец идват с висока цена при мащабиране“, добави той.

Тези спецификации приличат на очакванията в местните медии за модела V4 от следващо поколение на DeepSeek, за който китайските медии съобщават, че може да бъде пуснат още през април. DeepSeek, подобно на много от китайските си конкуренти, е добре финансиран, макар да има необичайна структура, тъй като компанията майка е количествен хедж фонд (хедж фонд, който разчита на алгоритмични или систематични стратегии, за да взима решенията си – бел. ред.), а не технологичен конгломерат.

Макар че припокриването не установява пряка връзка, то засили спекулациите сред разработчиците, че анонимната система може да е ранна тестова версия на предстоящото издание на DeepSeek.

„Моделът на веригата от мисли вероятно е най-силният сигнал“, каза Даниел Дюхърст, инженер по изкуствен интелект, който анализира модела след пускането му, говорейки за начина, по който AI моделът разсъждава. „Стилът на разсъждение е труден за прикриване и обикновено отразява начина, по който е бил обучен даден модел.“

Мащабът и капацитетът на паметта на Hunter Alpha също съответстват на спецификациите, които циркулират за DeepSeek V4 от началото на тази година, добави той.

Все пак някои разработчици предупредиха, че доказателствата, свързващи модела с DeepSeek, са неокончателни.

„Моят анализ сочи, че Hunter Alpha вероятно не е DeepSeek V4“, казва Умур Озкул, който провежда независими тестове за сравнение на изкуствен интелект, посочвайки разлики в поведението, свързано с токените, и архитектурните модели в сравнение със съществуващите системи на DeepSeek.

Според него спекулациите, свързващи модела с DeepSeek, са разбираеми предвид времето и рекламираните възможности.

Анонимните пускания на модели не са необичайни, тъй като платформи като OpenRouter позволяват на разработчиците да изпращат заявки към десетки AI модели чрез един интерфейс, което ги превръща в популярно място за тестване на нови системи.

Всяка новина е актив, следете Investor.bg и в Google News Showcase.