PG modeliai gali nuspėti, ką nusipirksite geriau, nei galite

Turinys:

Trumpai

Naujas tyrimas rodo, kad LLMS gali imituoti žmogaus pirkimo ketinimus, atvaizduodami laisvų tekstų atsakymus į Likerto reitingus per semantinį panašumą.
Metodas pasiekė 90% patikimumo žmogaus testų ir patikimumo, atsižvelgiant į 9 300 realių apklausų atsakymų.
Tyrime keliami klausimai apie šališkumą, apibendrinimą ir tai, kaip toli „sintetiniai vartotojai“ gali atsistoti tikriems žmonėms.

Pamirškite tikslines grupes: Naujame tyrime nustatyta, kad didelių kalbų modeliai gali numatyti, ar norite ką nors nusipirkti ryškiai tikslumu, dramatiškai pralenkdami tradicines rinkodaros priemones.

Manheimo ir Eth Ciuricho universiteto tyrėjai nustatė, kad dideli kalbų modeliai gali atkartoti žmonių pirkimo ketinimus – „kaip tikėtina, kad jūs tai nusipirksite?“ Metrinė mėgėjų mylimoji-laisvo formos tekstas paverčia struktūrizuotus apklausos duomenis.

Praėjusią savaitę paskelbtame dokumente komanda pristatė metodą pavadinimu “Semantinis panašumo reitingas, kuris Konvertuoja neterminuotus modelio atsakymus į skaitmeninius „Likert“ reitingus-penkių balų skalę, naudojamą tradiciniuose vartotojų tyrimuose.

Užuot paprašę modelio pasirinkti skaičių nuo vieno iki penkių, tyrėjai turėjo jį reaguoti natūraliai – „Aš tikrai nusipirkau tai“ arba „galbūt, jei jis būtų parduodamas“ – ir tada išmatuota, kaip semantiškai uždaryti tuos teiginius buvo į kanoninius atsakymus, tokius kaip „Aš būtinai nusipirkčiau tai“ arba „Aš to nepirksiu“.

Kiekvienas atsakymas buvo suskirstytas į įterpimo erdvę į artimiausią nuorodos teiginį, iš tikrųjų paverčiant LLM tekstą statistiniais įvertinimais. „Mes parodome, kad optimizuojant semantinį panašumą, o ne į skaitmenines etiketes, gaunami pirkimo intensyvių paskirstymų, kurie tiksliai atitinka žmonių apklausos duomenis“,-rašė autoriai. „LLM generuojami atsakymai sulaukė 90% pakartotinių žmonių tyrimų patikimumo, išsaugant natūralius požiūrio pokyčius“.

Atliekant 9 300 realių žmonių apklausų atsakymų apie asmens priežiūros produktus bandymuose, SSR metodas sukėlė sintetinius respondentus, kurių Likerto pasiskirstymas beveik atspindėjo originalus. Kitaip tariant: paprašius „galvoti kaip kaip vartotojus“, modeliai padarė.

Kodėl tai svarbu

Išvada galėtų pakeisti, kaip įmonės atlieka produktų testavimą ir rinkos tyrimus. Vartotojų tyrimai yra žinomai brangūs, lėti ir pažeidžiami šališkumo. Sintetiniai respondentai – jei jie elgiasi kaip tikri – galėtų leisti įmonėms ekranuoti tūkstančius produktų ar pranešimų už nedidelę kainą.

Tai taip pat patvirtina gilesnį teiginį: kad LLM semantinės erdvės geometrija koduoja ne tik kalbos supratimą, bet ir požiūrio samprotavimai. Palyginus atsakymus įterpimo erdvę, o ne traktuoti juos kaip pažodinį tekstą, tyrimas parodo, kad modelio semantika gali nustebinti žmogaus sprendimą stebėdama ištikimybę.

Tuo pat metu tai kelia pažįstamą etinę ir metodinę riziką. Tyrėjai išbandė tik vieną produktų kategoriją, palikdami atvirą, ar tas pats požiūris laikysis finansinių sprendimų, ar politiškai apmokestintos temos. Ir sintetiniai „vartotojai“ galėtų lengvai tapti sintetiniais taikiniai: Tie patys modeliavimo būdai galėtų padėti optimizuoti politinį įtikinėjimą, reklamą ar elgesio nuogumus.

Kaip teigė autoriai, „rinkos optimizavimo slėgis gali sistemingai išnaikinti derinimą“-frazė, kuri rezonuoja toli už rinkodaros ribų.

Skepticizmo pastaba

Autoriai pripažįsta, kad jų bandymo sritis-asmeninės priežiūros produktai-yra siauri ir gali būti ne apibendrinti aukšto lygio ar emociškai įkrautų pirkimų. SSR žemėlapis taip pat priklauso nuo kruopščiai parinktų nuorodų teiginių: Maži formuluotės pakeitimai gali iškreipti rezultatus. Be to, tyrimas remiasi žmonių apklausos duomenimis kaip „pagrindine tiesa“, nors tokie duomenys yra garsiai triukšmingi ir kultūriškai šališki.

Kritikai pabrėžia, kad įterpiamasis panašumas daro prielaidą, kad kalbos vektoriai tvarkingai apibūdina žmonių požiūrį-prielaidą, kuri gali žlugti, kai kontekstas ar ironija patenka į mišinį. Straipsnio patikimumo skaičius-90% žmogaus bandomojo pakartotinio konsistencijos-tai yra įspūdingas, tačiau vis tiek palieka vietos reikšmingam dreifui. Trumpai tariant, metodas veikia Vidutiniškaibet dar neaišku, ar tie vidurkiai užfiksuoja tikrą žmonių įvairovę, ar tiesiog atspindi modelio mokymo prižiūrėtojus.

Didesnis vaizdas

Akademinis susidomėjimas „sintetiniu vartotojų modeliavimu“ padidėjo 2025 m., Kai įmonės eksperimentuoja su AI pagrįstomis tikslinėmis grupėmis ir numatomą apklausą. Panašus MIT ir Kembridžo universiteto darbas parodė, kad LLMS gali imituoti demografinius ir psichometrinius segmentus, turinčius vidutinį patikimumą, tačiau nė vienas anksčiau neparodė artimo statistinio atitikties realiems pirkimo intensyviems duomenims.

Šiuo metu SSR metodas išlieka tyrimų prototipu, tačiau jis užsimena apie ateitį, kai LLM gali ne tik atsakyti į klausimus, bet ir atstovauti pačiai visuomenei.

Ar tai yra avansas, ar haliucinacija kuriant, vis dar diskutuoja.

Paprastai protingas Informacinis biuletenis

Savaitės AI kelionė, kurią pasakojo generacinis AI modelis.

Nuoroda į informacijos šaltinį

Trumpai

Kodėl tai svarbu

Skepticizmo pastaba

Didesnis vaizdas

Paprastai protingas Informacinis biuletenis

Susiję įrašai