Märkningsdata
En undersökning gjord av TIME Magazine avslöjade att OpenAI, för att bygga ett säkerhetssystem mot giftigt innehåll (t.ex. sexuella övergrepp, våld, rasism, sexism etc.), använde utkontrakterade kenyanska arbetare som tjänade mindre än 2 dollar i timmen för att märka giftigt innehåll. Dessa märkningar användes för att träna en modell för att upptäcka sådant innehåll i framtiden. De utkontrakterade arbetarna exponerades för så giftigt och farligt innehåll att de beskrev upplevelsen som "tortyr". OpenAIs outsourcingpartner var Sama, ett utbildningsdataföretag baserat i San Francisco, Kalifornien.
Jailbreaking
ChatGPT försöker avvisa uppmaningar som kan bryta mot deras innehållspolicy. Vissa användare lyckades dock jailbreaka ChatGPT genom att använda olika prompt engineering-tekniker för att kringgå dessa begränsningar i början av december 2022 och lyckades lura ChatGPT att ge instruktioner för hur man skapar en Molotovcocktail eller en atombomb, eller att generera argument i stil med en nynazist. En reporter från Toronto Star hade ojämn personlig framgång med att få ChatGPT att göra provocerande uttalanden kort efter lanseringen: ChatGPT lurades att stödja den ryska invasionen av Ukraina 2022, men även när de ombads att spela med i ett fiktivt scenario vägrade ChatGPT att generera argument för varför Kanadas premiärminister Justin Trudeau var skyldig till förräderi. (wiki)
Publiceringstid: 18 februari 2023