Фактът, че изобщо можем да посещаваме интернет, без да полудеем, се дължи на тях: модераторите на съдържание, които на парче пресяват брутално, нечовешко, прекомерно омразно, расистко и като цяло незаконно съдържание, маркират го и го изтриват. Големите платформи за социални медии отдавна разчитат на тях, често в страни с ниско заплащане. Подобни работни места има и в областта на генеративния изкуствен интелект. Причината е, че хората проверяват отново някои от данните за големите езикови модели като Bard или ChatGPT. Тази обратна връзка от хората е част от процеса на обучение и прави програмите толкова „интелигентни", че те изглеждат човешки за своите потребители.
Че в тази област правилата, на които демонстративно разчита технологичната индустрия, не струват много, показва това изследване на журналиста Алекс Кандровиц в неговия бюлетин Big Technology. Той е разговарял с кениеца Ричард Матенге, който е бил един от онези наблюдатели на съдържанието, работещи от името на OpenAI: той пресява набора от данни за ChatGPT и филтрира неприятните неща. Кантровиц само загатва за нещата, които Матенге и колегите му е трябвало да разгледат, но и това е достатъчно.
Когато през 2021 г. започва да обучава модела GPT на OpenAI, Ричард Матенге усеща, че е попаднал на перфектната позиция. След години работа в сферата на обслужването на клиенти в Найроби, Кения, той най-накрая се занимавал с нещо смислено и с бъдеще. И все пак, макар и обещаваща, позицията го белязала. В продължение на девет часа на ден, пет дни в седмицата, Матенге ръководил екип, който обучава модела на публично съдържание.
По време на работа Матенге и екипът му многократно разглеждали публични текстове и ги обозначавали за модела. Те можели да ги категоризират като материал за сексуално насилие над деца, еротично сексуално съдържание, незаконно, несексуално и някои други опции. Голяма част от прочетеното ги ужасявало. В един пасаж, казва Матенге, се описва баща, който прави секс с животно пред очите на детето си; други включват сцени на изнасилване на деца. Някои от тях били толкова обидни, че Матенге отказвал да говори за тях. „Невъобразимо", казва той.
Видът работа, която Матенге е вършил, е от решаващо значение за функционирането на ботове като ChatGPT и Bard - и за усещането за магичност - но тя е масово пренебрегвана. В процеса, наречен Reinforcement Learning from Human Feedback (Усилващо обучение от човешка обратна връзка), ботовете стават по-умни, когато хората маркират съдържанието, като ги учат как да оптимизират въз основа на тази обратна връзка. Лидерите в областта на ИИ, включително Сам Алтман от OpenAI, оценяват високо техническата ефективност на тази практика, но рядко говорят за цената, която някои хора плащат, за да приведат системите за ИИ в съответствие с нашите ценности. Матенге и неговите колеги са в бизнес края на тази реалност.
Историята, която Кандровиц разкрива, звучи плашещо позната и е също толкова важна: аутсорсинг в бедни страни, ниски заплати - и от двете страни на Атлантическия океан всички се крият, за да избегнат отговорността за травмираните фасилитатори. Само че в случая става дума за онези хора, които като мъченици поемат всички грехове на мрежата само за да можем да имаме „чисто преживяване", когато посегнем към мобилния телефон и сърфираме в социалните мрежи.
Сухото предаване на Кантровиц на комуникацията с OpenAI и Sama, компанията, която е наела Матенге в Кения, звучи кафкиански:
Говорителят на OpenAI заявява, че компанията е потърсила повече информация от Sama за условията на труда. След това Sama е информирала OpenAI, че излиза от сферата на модериране на съдържание. Sama не е отговорила на искането за коментар. Въпреки това Ричард Матенге се гордее, че е работил по бота, който побърква целия свят. А случаят показва как такива истории могат да бъдат толкова сложни.


Варна става домакин на фестивал за климат и отговорно хранене
Има големи разлики в грамотността между отделните поколения
Иван Иванов се класира за основната схема на Чалънджъра в Кощице
Психолог: Имахме нужда от тази "Бангаранга", имахме нужда от самочувствие
Радев обсъди партньорството със САЩ с висш US дипломат
AI няма да замени преводачите, а ще ги превърне в негови одитори
Ма: Китайските инвеститори също диверсифицират от Китай
Има ли риск от разпродажба на американски ДЦК? Попитахме експертите
Вушо за причината луксозният туризъм в Азия да е устойчив, част 2
Вушо за причината луксозният туризъм в Азия да е устойчив, част 1
Как екстремната топлина влияе на автомобилните гуми
Китайските ЕV вече владеят над 15% от пазара в Европа
Неудачници: никой не иска да купува тези коли през 2026
Ще принуди ли ЕС компаниите да купуват електромобили?
Стават ли наистина части от Toyota за Lexus
Още утре може да отменят бедственото положение в Габрово
Поредни тежки катастрофи у нас, жена загина край Симитли
9 мита за състоянието, познато като Синдром на поликистозните яйчници
Мистерия: Мъж се качи на грешен самолет и изчезна във Виена
Зендая пак не издаде дали е вдигнала сватба с Том Холанд