Meta пусна AI модел за превод на реч между десетки езици

Той има потенциала да стане съществена част от редица нови инструменти на компанията

10:05 | 23.08.23 г.

Снимка: Gabby Jones/Bloomberg

Компанията майка на Facebook – Meta Platforms, пусна модел с изкуствен интелект, способен да превежда и транскрибира реч на десетки езици. Той има потенциала да бъде съществена част от инструменти, които позволяват комуникация в реално време на различни езици, предава Ройтерс.

В публикация в блога си компанията пише, че моделът SeamlessM4T ще поддържа преводи между текст и реч на близо 100 езика, както и пълен превод „говор към говор“ на 35 езика, като комбинира технология, която преди е била достъпна само в отделни модели.

Главният изпълнителен директор Марк Зукърбърг предвижда, че подобни инструменти ще улесняват взаимодействието между потребителите по целия свят в метавселената – набор от взаимосвързани виртуални светове, на които той залага бъдещето на компанията.

Meta прави модела достъпен за обществеността за некомерсиална употреба, гласи още публикацията в блога.

Най-голямата социална мрежа в света пусна вълна от предимно безплатни модели с изкуствен интелект през миналата година, включително голям езиков модел, наречен Llama, който представлява сериозно предизвикателство за патентованите модели, продавани от OpenAI и Google.

Зукърбърг твърди, че една отворена AI екосистема работи в полза на Meta, тъй като компанията може да спечели повече от това.

Независимо от това, Meta е изправена пред подобни правни въпроси като останалата част от индустрията що се касае до данните за обучение, които се ползват при създаването на нейните модели.

През юли комикът Сара Силвърман и двама други автори заведоха дела за нарушаване на авторските им права срещу Meta и OpenAI, обвинявайки компаниите, че използват техни книги като данни за обучаване без позволение.

За модела SeamlessM4T изследователите на Meta посочват, че са събрали аудиоданни за обучение от 4 млн. часа от „сурово аудио, идващо от публично достъпно хранилище на уеб данни“, без да уточняват кое е то.

Говорител на Meta не е отговорил на въпрос относно произхода на аудиоданните.

Текстовите данни са от масиви от информация, създадени миналата година, които извличат съдържание от Wikipedia и свързани уебсайтове, посочват още изследователите.

Всяка новина е актив, следете Investor.bg и в Google News Showcase.