Фактът, че изобщо можем да посещаваме интернет, без да полудеем, се дължи на тях: модераторите на съдържание, които на парче пресяват брутално, нечовешко, прекомерно омразно, расистко и като цяло незаконно съдържание, маркират го и го изтриват. Големите платформи за социални медии отдавна разчитат на тях, често в страни с ниско заплащане. Подобни работни места има и в областта на генеративния изкуствен интелект. Причината е, че хората проверяват отново някои от данните за големите езикови модели като Bard или ChatGPT. Тази обратна връзка от хората е част от процеса на обучение и прави програмите толкова „интелигентни", че те изглеждат човешки за своите потребители.
Че в тази област правилата, на които демонстративно разчита технологичната индустрия, не струват много, показва това изследване на журналиста Алекс Кандровиц в неговия бюлетин Big Technology. Той е разговарял с кениеца Ричард Матенге, който е бил един от онези наблюдатели на съдържанието, работещи от името на OpenAI: той пресява набора от данни за ChatGPT и филтрира неприятните неща. Кантровиц само загатва за нещата, които Матенге и колегите му е трябвало да разгледат, но и това е достатъчно.
Когато през 2021 г. започва да обучава модела GPT на OpenAI, Ричард Матенге усеща, че е попаднал на перфектната позиция. След години работа в сферата на обслужването на клиенти в Найроби, Кения, той най-накрая се занимавал с нещо смислено и с бъдеще. И все пак, макар и обещаваща, позицията го белязала. В продължение на девет часа на ден, пет дни в седмицата, Матенге ръководил екип, който обучава модела на публично съдържание.
По време на работа Матенге и екипът му многократно разглеждали публични текстове и ги обозначавали за модела. Те можели да ги категоризират като материал за сексуално насилие над деца, еротично сексуално съдържание, незаконно, несексуално и някои други опции. Голяма част от прочетеното ги ужасявало. В един пасаж, казва Матенге, се описва баща, който прави секс с животно пред очите на детето си; други включват сцени на изнасилване на деца. Някои от тях били толкова обидни, че Матенге отказвал да говори за тях. „Невъобразимо", казва той.
Видът работа, която Матенге е вършил, е от решаващо значение за функционирането на ботове като ChatGPT и Bard - и за усещането за магичност - но тя е масово пренебрегвана. В процеса, наречен Reinforcement Learning from Human Feedback (Усилващо обучение от човешка обратна връзка), ботовете стават по-умни, когато хората маркират съдържанието, като ги учат как да оптимизират въз основа на тази обратна връзка. Лидерите в областта на ИИ, включително Сам Алтман от OpenAI, оценяват високо техническата ефективност на тази практика, но рядко говорят за цената, която някои хора плащат, за да приведат системите за ИИ в съответствие с нашите ценности. Матенге и неговите колеги са в бизнес края на тази реалност.
Историята, която Кандровиц разкрива, звучи плашещо позната и е също толкова важна: аутсорсинг в бедни страни, ниски заплати - и от двете страни на Атлантическия океан всички се крият, за да избегнат отговорността за травмираните фасилитатори. Само че в случая става дума за онези хора, които като мъченици поемат всички грехове на мрежата само за да можем да имаме „чисто преживяване", когато посегнем към мобилния телефон и сърфираме в социалните мрежи.
Сухото предаване на Кантровиц на комуникацията с OpenAI и Sama, компанията, която е наела Матенге в Кения, звучи кафкиански:
Говорителят на OpenAI заявява, че компанията е потърсила повече информация от Sama за условията на труда. След това Sama е информирала OpenAI, че излиза от сферата на модериране на съдържание. Sama не е отговорила на искането за коментар. Въпреки това Ричард Матенге се гордее, че е работил по бота, който побърква целия свят. А случаят показва как такива истории могат да бъдат толкова сложни.


Правителство, синдикати и работодатели постигнаха съгласие по новия Бюджет 2026
Какво ще бъде времето в събота?
Полицията във Варна излезе с мерки за спокойни студентски празници
"Спартак" пусна билетите за мача с "Левски"
Трима се озоваха в арестите във Варна и региона заради наркотици
Търговските вериги инвестират в устойчивост и адаптация към еврото
Airbus обещават да се справят с проблемите
Airbus намалиха целите си за доставка до края на 2025г
Патерсън: Рискът от заразяване при биткойн не е изчезнал
Над 500% поскъпване за ден: Китай извади нов конкурент на Nvidia
Политик предложи премахване на червения светофар и знаците на пътя
Малка кола на старо с автоматик – ето 4 сигурни предложения
Lexus LFA се завърна като... електромобил
Нова технология на Mercedes прави задните спирачки безсмислени
REST - една малко известна екстра в стари Audi-та и VW-та
Надеждност на пътя – как да изберете правилните носачи за своя автомобил
Бурята „Байрън“ парализира Гърция с наводнения и затваряне на училища ВИДЕО
Леденият парк на София тази зима ще бъде с още по-голяма площ
Борисов вече и в TikTok, надява се Бюджет 2026 да се внесе скоро ВИДЕО
Разбраха се: Тристранката постигна съгласие по Бюджет 2026