Той помогна за тренирането на ChatGPT. В замяна ботът го травмира

Големите платформи за социални медии отдавна разчитат на модераторите, често встрани с ниско заплащане

10:52 | 31.05.23 г.

Снимка: Unsplash.com

Фактът, че изобщо можем да посещаваме интернет, без да полудеем, се дължи на тях: модераторите на съдържание, които на парче пресяват брутално, нечовешко, прекомерно омразно, расистко и като цяло незаконно съдържание, маркират го и го изтриват. Големите платформи за социални медии отдавна разчитат на тях, често в страни с ниско заплащане. Подобни работни места има и в областта на генеративния изкуствен интелект. Причината е, че хората проверяват отново някои от данните за големите езикови модели като Bard или ChatGPT. Тази обратна връзка от хората е част от процеса на обучение и прави програмите толкова „интелигентни", че те изглеждат човешки за своите потребители.

Че в тази област правилата, на които демонстративно разчита технологичната индустрия, не струват много, показва това изследване на журналиста Алекс Кандровиц в неговия бюлетин Big Technology. Той е разговарял с кениеца Ричард Матенге, който е бил един от онези наблюдатели на съдържанието, работещи от името на OpenAI: той пресява набора от данни за ChatGPT и филтрира неприятните неща. Кантровиц само загатва за нещата, които Матенге и колегите му е трябвало да разгледат, но и това е достатъчно.

Когато през 2021 г. започва да обучава модела GPT на OpenAI, Ричард Матенге усеща, че е попаднал на перфектната позиция. След години работа в сферата на обслужването на клиенти в Найроби, Кения, той най-накрая се занимавал с нещо смислено и с бъдеще. И все пак, макар и обещаваща, позицията го белязала. В продължение на девет часа на ден, пет дни в седмицата, Матенге ръководил екип, който обучава модела на публично съдържание.

По време на работа Матенге и екипът му многократно разглеждали публични текстове и ги обозначавали за модела. Те можели да ги категоризират като материал за сексуално насилие над деца, еротично сексуално съдържание, незаконно, несексуално и някои други опции. Голяма част от прочетеното ги ужасявало. В един пасаж, казва Матенге, се описва баща, който прави секс с животно пред очите на детето си; други включват сцени на изнасилване на деца. Някои от тях били толкова обидни, че Матенге отказвал да говори за тях. „Невъобразимо", казва той.

Видът работа, която Матенге е вършил, е от решаващо значение за функционирането на ботове като ChatGPT и Bard - и за усещането за магичност - но тя е масово пренебрегвана. В процеса, наречен Reinforcement Learning from Human Feedback (Усилващо обучение от човешка обратна връзка), ботовете стават по-умни, когато хората маркират съдържанието, като ги учат как да оптимизират въз основа на тази обратна връзка. Лидерите в областта на ИИ, включително Сам Алтман от OpenAI, оценяват високо техническата ефективност на тази практика, но рядко говорят за цената, която някои хора плащат, за да приведат системите за ИИ в съответствие с нашите ценности. Матенге и неговите колеги са в бизнес края на тази реалност.

Историята, която Кандровиц разкрива, звучи плашещо позната и е също толкова важна: аутсорсинг в бедни страни, ниски заплати - и от двете страни на Атлантическия океан всички се крият, за да избегнат отговорността за травмираните фасилитатори. Само че в случая става дума за онези хора, които като мъченици поемат всички грехове на мрежата само за да можем да имаме „чисто преживяване", когато посегнем към мобилния телефон и сърфираме в социалните мрежи.

Сухото предаване на Кантровиц на комуникацията с OpenAI и Sama, компанията, която е наела Матенге в Кения, звучи кафкиански:

Говорителят на OpenAI заявява, че компанията е потърсила повече информация от Sama за условията на труда. След това Sama е информирала OpenAI, че излиза от сферата на модериране на съдържание. Sama не е отговорила на искането за коментар. Въпреки това Ричард Матенге се гордее, че е работил по бота, който побърква целия свят. А случаят показва как такива истории могат да бъдат толкова сложни.

Всяка новина е актив, следете Investor.bg и в Google News Showcase.