Китайският стартъп DeepSeek работи съвместно с университета „Цинхуа“ за намаляване на обучението, от което се нуждаят неговите модели с изкуствен интелект (AI) в опит да свие оперативните разходи, съобщава Bloomberg.
DeepSeek, която разтърси пазарите с евтиния си модел през януари, си сътрудничи с учени от пекинската институция върху документ, в който подробно се описва нов подход към обучението, за да се направят AI моделите по-ефективни.
Новият метод има за цел да помогне на AI моделите да се придържат по-ефективно към предпочитанията на потребителите, като предлага награди за по-точни и разбираеми отговори, изтъкват учените. Обучението се оказва ефективно за по-бързото решаване на задачи за AI в тесни приложения и сфери.
Разширяването на метода до по-общи приложения обаче се оказва предизвикателство - и това е проблемът, който екипът на DeepSeek се опитва да реши с нещо, което нарича самоопределяща настройка на критиката. Стратегията надмина съществуващите методи и модели, като резултатът показа по-добра производителност с по-малко изчислителни ресурси, се добавя в документа.
DeepSeek нарича тези нови модели DeepSeek-GRM и ще ги пусне на базата на отворен код. Други разработчици на AI, включително китайският технологичен гигант Alibaba Group Holding Ltd. и базираната в Сан Франциско OpenAI, също се стремят към подобряване на възможностите за разсъждение и самоусъвършенстване, докато AI моделът изпълнява задачи в реално време.
Базираната в Калифорния Meta Platforms Inc. пусна най-новата си серия AI модели, Llama 4, през уикенда и ги определи като първите, които използват архитектурата Mixture of Experts (MoE). Моделите на DeepSeek разчитат значително на MoE, за да постигнат по-ефективно използване на ресурсите, а Meta сравни новото си издание с това на китайския стартъп.
DeepSeek не уточнява кога планира да пусне следващия си водещ модел.


Депутатите приеха на първо четене втората порция мерки за овладяване на цените
Как преминаха разговорите между Тръмп и Си Дзинпин?
Във Варна ще строят нова ясла в район "Младост", ремонтът на ДЯ "Щурче" започва през юли
Отстраняват кмета на район "Одесос" ако се докаже злоупотреба с власт
Има избран изпълнител за доставка на подземните контейнери във Варна
Сенатът одобри Кевин Уорш за председател на Фед в оспорвано гласуване
Mythos може да е заплаха, но AI ускорява еволюцията на банковите услуги
Капитал има, но не и навик: защо българите рядко инвестират у нас
„Хелиос Марин“: Искаме да сме нещо като Tesla при яхтите
Цветан Цеков: Надценките по веригата държат храните у нас сред най-скъпите в ЕС
Chery се връща към това, от което VW се отказа
Всяка десета кола e манипулирана – внимавайте с тези модели
Вижте кой ще внася автомобилите на Ebro в България
Китайци искат да правят електромобили с Maserati
Трик с пластилин почиства боята перфектно
Отменят извънредното положение в Унгария, въведено преди 4 години
Над 3 кг златни накити в тайник в кола заловиха на „Лесово“
MrBit Втора лига на живо: Как можете да гледате Пирин срещу Севлиево
Бившият директор на "Гробишни паркове" ще съди Столична община