Мощен модел с изкуствен интелект, който се появи анонимно на платформа за разработчици миналата седмица, предизвиква спекулации, че китайският стартъп DeepSeek може би тихо тества системата си от ново поколение преди официалното ѝ пускане, съобщава Ройтерс.
Безплатният модел, наречен Hunter Alpha, се появи на платформата OpenRouter на 11 март без никаква информация за разработчика и по-късно беше описан от платформата като „стелт модел“.
По време на тестове, проведени от Ройтерс, чатботът Hunter Alpha се описа като „китайски модел с изкуствен интелект, обучен предимно на китайски“ и заяви, че данните за обучението му обхващат периода до май 2025 г. – същата крайна точка на знанията, съобщена от собствения чатбот на DeepSeek.
Когато обаче беше попитан за своя създател, системата отказа да идентифицира разработчика си.
„Знам само името си, мащаба на параметрите си и дължината на контекстния си прозорец“, каза чатботът.
Нито DeepSeek, нито OpenRouter са идентифицирали създателя на модела и не са отговорили на запитванията за коментар.
Профилната страница на Hunter Alpha го описва като модел с 1 трлн. параметъра, което означава, че е обучен с помощта на приблизително един трилион регулируеми стойности, които определят как системата обработва езика и генерира отговори. Моделите с повече параметри обикновено изискват значително повече изчислителна мощност, за да функционират.
Системата също така се отличава с контекстен прозорец от до 1 млн. токена – показател за това колко текст може да обработи или запомни един AI модел по време на едно взаимодействие. Един токен съответства приблизително на кратък фрагмент от текст, като например част от дума.
„Комбинацията, която се открои, беше контекстът от 1 млн. токена на Hunter Alpha, съчетан със способност за разсъждение и свободен достъп“, заяви Набил Хауам, инженер, който разработва системи за AI агенти.
„Повечето авангардни модели с такъв контекстен прозорец идват с висока цена при мащабиране“, добави той.
Тези спецификации приличат на очакванията в местните медии за модела V4 от следващо поколение на DeepSeek, за който китайските медии съобщават, че може да бъде пуснат още през април. DeepSeek, подобно на много от китайските си конкуренти, е добре финансиран, макар да има необичайна структура, тъй като компанията майка е количествен хедж фонд (хедж фонд, който разчита на алгоритмични или систематични стратегии, за да взима решенията си – бел. ред.), а не технологичен конгломерат.
Макар че припокриването не установява пряка връзка, то засили спекулациите сред разработчиците, че анонимната система може да е ранна тестова версия на предстоящото издание на DeepSeek.
„Моделът на веригата от мисли вероятно е най-силният сигнал“, каза Даниел Дюхърст, инженер по изкуствен интелект, който анализира модела след пускането му, говорейки за начина, по който AI моделът разсъждава. „Стилът на разсъждение е труден за прикриване и обикновено отразява начина, по който е бил обучен даден модел.“
Мащабът и капацитетът на паметта на Hunter Alpha също съответстват на спецификациите, които циркулират за DeepSeek V4 от началото на тази година, добави той.
Все пак някои разработчици предупредиха, че доказателствата, свързващи модела с DeepSeek, са неокончателни.
„Моят анализ сочи, че Hunter Alpha вероятно не е DeepSeek V4“, казва Умур Озкул, който провежда независими тестове за сравнение на изкуствен интелект, посочвайки разлики в поведението, свързано с токените, и архитектурните модели в сравнение със съществуващите системи на DeepSeek.
Според него спекулациите, свързващи модела с DeepSeek, са разбираеми предвид времето и рекламираните възможности.
Анонимните пускания на модели не са необичайни, тъй като платформи като OpenRouter позволяват на разработчиците да изпращат заявки към десетки AI модели чрез един интерфейс, което ги превръща в популярно място за тестване на нови системи.


Куриер де Балкан: България блести на международната сцена с Джирото и победа на Евровизия
Голяма бяла акула е заснета в централната част на Средиземно море
Световните конфликти достигнаха връх през 2025 г.
Директорът на „Евровизия“ : България впечатли с изключително бързата реакция на институциите
Зеленски пред „Гардиън“: Русия губи инициативата, а войната постепенно се обръща в полза на Украйна
Петте елемента в изграждането на учителя: Липсата на една брънка скъсва веригата
Великобритания трудно ще възстанови щетите от Brexit върху икономиката си
Износът и вносът на Китай скочиха през май благодарение на AI
Поръчките на петролни супертанкери надминаха рекорда от 2008 г.
Бунтът срещу центровете за данни заплашва бъдещето на AI
Една грешка създаде златните джанти на Subaru
Изкуственият интелект на TikTok вече е в 7 милиона коли
Новото Audi Q7 – само дизел, Matrix LED и три окачвания по избор
Защо фабричните гуми са различни от тези, които си купувате от магазина
BYD се включи в атаката срещу Ferrari
Защитиха пътя към резиденцията на Путин във Валдай с мрежи против дронове
ЕС има тайвански проблем на стойност 2 трилиона долара
Храненето, което помага да отслабнете здравословно
По-голям от "Арли Бърк" : Северна Корея обявява програма за 10 000-тонни разрушители
9 комплимента, които манипулаторите използват