
Online csillagainkban a hiba: a rating pszichológiája
A számszerű online értékelések (ratingek) a fogyasztói döntéshozatali folyamat szerves részévé váltak, és meghatározó tényezőt jelentenek egy vállalkozás online hírnevének meghatározásában is. A ratingek értelmezése mögött meghúzódó pszichológiai erők az emberi viselkedés lenyűgöző tanulmányaként szolgálnak. Pontosan mit üzennek nekünk az egytől ötig vagy tízig terjedő számok? Mindenkinek ugyanazt jelenti-e ugyanaz a szám? Ugyanaz egy 4-es Japánban, mint Amerikában? Meglepő tanulságok a cikkben.

A Trastevere negyed macskaköveit rójuk a feleségemmel, amikor elhangzik a párkapcsolatok sarokkövét képező kérdés: „Hol eszünk?” Rómáról lévén szó, tájékozatlanok vagyunk a gasztrotérképet illetően, így a Google Mapsre és az egyes helyekhez fűzött pontszámokra vagyunk kénytelenek hagyatkozni. Előkapom a telefonom, és három éttermet látok a közelünkben: az első hely 4.7-es értékelésű 3200 értékeléssel, a második 4.3-as 900 értékeléssel, a harmadik 4.1-es 150 értékeléssel. A második étterem neve ismerősnek tűnik, mintha valahol olvastam volna róla, a harmadik pedig egy kis családi trattoria, amelynek a képén egy idős olasz hölgy gyúrja a tésztát. Hova menjünk?
Észre sem vesszük, de ebben és az ehhez hasonló helyzetekben rengeteg, az agyunkban működő láthatatlan pszichológiai és viselkedéstani mechanizmus fejti ki hatását anélkül, hogy tudatában lennénk. Lehet szó egy szállás kiválasztásáról a nyári kiruccanás tervezésekor, egy filmre való rábólintásról az esti ejtőzéshez, vagy egy étterem megtalálásáról, amikor már hangry az egész család, kognitív torzítások, statisztikai csapdák, algoritmikus manipulációk és nem utolsósorban személyiségünk foglyai vagyunk.
Nézzük meg behatóbban, hogy miért látunk mást én és a feleségem ugyanabban az értékelésben. Miért tűnik biztosabb választásnak a 4.7-es hely? Miért kételkedünk a 4.1-esben? A nagy számok és a minta nagysága mennyire megbízható iránymutató? Miért nem jelent ugyanazt egy 4.7 Rómában, mint Tokióban és New Yorkban? Mi történik a fejünkben a döntésig vezető percekben, és miért lehetséges, hogy mégsem választottuk a legjobb helyet? A cikk végére talán arra a következtetésre jutunk, hogy végső sorban nem is mi hoztuk meg a döntést!
Az online ratingek titkos élete: miért hiszünk nekik?
Annak ellenére, hogy számtalan értékelési rendszer létezik – és függetlenül attól, hogy bizonyítottan sok esetben torzítva tükrözik a valós fogyasztói tapasztalatokat –, a ratingek igen befolyásosak, és igen komolyan vesszük őket. Egyes kutatások szerint az emberek 85%-a ugyanolyan mértékben bízik az online véleményekben, mint egy személyes ajánlásban. A ratingek konkrét bevételnövekedésben vagy -csökkenésben is kézzelfogható következményekkel járnak: minden egyes egycsillagos növekedés akár 5–9%-os bevételnövekedést eredményezhet. Nem véletlen az sem, hogy az online értékelések a Google algoritmusában is fontos rangsorolási tényezőnek számítanak.
Az értékelések pszichológiája a társadalmi bizonyíték (social proof) jelenségén alapul. Ennek lényege, hogy aszerint döntjük el, mit tegyünk vagy ne tegyünk, vagy hogy mi a helyes vagy helytelen, hogy más, hozzánk hasonló emberek milyen viselkedést tanúsítanak hasonló helyzetben, vagy mit tartanak helyesnek hasonló körülmények között. Hajlamosak vagyunk a hozzánk hasonló emberekkel együtt érezni, megbízni az ajánlásaikban és véleményükben, sőt, még a viselkedésüket is utánozzuk. A véleményeket pedig gyakran megbízhatóbbnak tartjuk, mint a reklámokat. Vannak olyan kutatási eredmények, amelyek szerint az emberek 92%-a jobban megbízik a szájról szájra terjedő ajánlásokban, mint a hirdetésekben. Ennek oka kézenfekvő: a véleményeket fogyasztótársaink írják, olyan emberek, mint mi.
A leadott ratingek torzításai
Ez annak ellenére így van, hogy mára már rengeteg bizonyíték van arra, hogy a fogyasztói ajánlások egyébként sok esetben igen torzítottak, és nem a valójában átélt fogyasztói élményt tükrözik. Az egyik legelgondolkodtatóbb jelenség ebben a körben az önészlelés pszichológiai fogalmára épül. Ennek lényege, hogy a saját viselkedésünk megfigyelése alapján vonunk le következtetést arra nézve, hogy mit is gondolunk, érzünk egy helyzetről, egy személyről vagy egy tárgyról. Ezt mutatja egy híres gyakorlat, amit akár mi is kipróbálhatunk az ismerőseinkkel.
A gyakorlat keretében az embereket két csoportra bontjuk. Az egyik csoport feladata az lesz, hogy írjon le három alkalmat, amikor nagylelkű volt életében (segített valakinek, önzetlen volt, stb.). A másik csoportnak ugyanaz lesz a feladata azzal a különbséggel, hogy nekik tíz ilyen alkalmat kell összegyűjteniük. Miután a csoportok elkészülnek a listákkal, arra kérjük őket, hogy egy skálán értékeljék magukat: mennyire tartják magukat nagylelkűnek? Mit gondolunk, hogy az önészlelési elmélet alapján milyen eredmények fognak születni? Érdekes módon a második csoport esetében alacsonyabb pontszámok születnek, amikor az embereknek a saját nagylelkűségüket kell megítélniük. Ez elsőre elég meglepő eredménynek tűnik, hiszen ők több bizonyítékot gyűjtöttek össze a nagylelkűségükkel és önzetlenségükkel kapcsolatban. Ugyanakkor vegyük észre, hogy a feladat számukra nehezebb volt! Magunk is kipróbálhatjuk, és tapasztalni fogjuk, hogy milyen nehéz tíz ilyen alkalmat összegyűjteni, egy ponton túl az embernek már kicsit meg kell erőszakolnia magát, hogy újabb elemeket tudjon adni a listához. A feladat nehézsége miatt pedig a második csoport tagjaiban a következő gondolat fogalmazódik meg: „Olyan nagyon jó ember nem lehetek, ha ilyen nehezen ment a lista összeállítása.” Pedig a következtetés téves, hiszen a bizonyítékok ellene szólnak.
Az önészlelés jelensége hasonló következménnyel jár az online módon leadott ratingekre és véleményekre nézve. Amikor időt szakítunk arra, hogy értékelést adjunk, akkor ez a tény önmagában torzítja, középre húzza az értékelésünket. Sarah Moore kanadai marketingprofesszor nagyon találóan mutat rá, hogy „Ha megmagyarázzuk, hogy miért volt olyan isteni íze egy csokitortának, akkor érdekes módon egy kicsit kevésbé szeretjük a csokitortát, és amikor megmagyarázzuk, hogy miért volt olyan szörnyű egy film, akkor egy kicsit kevésbé kezdjük utálni a filmet.” Vagyis hiába volt valódi fogyasztói élményünk egy csokoládétorta kapcsán 5-ös, az a körülmény önmagában, hogy időt szánunk az értélésre, lejjebb viheti a pontszámot. Ugyanígy, hiába tartottuk pocséknak a filmet, a végső pontszámunkban kegyesebbek leszünk.
A fentebb említett Sarah Moore egy kutatás keretében ezzel teljesen összhangban álló eredményre jutott: a pozitív fogyasztói tapasztalataikat megmagyarázó résztvevők végül alacsonyabb pontszámot adtak a kontrollcsoporthoz és a magyarázatot nem adó csoporthoz képest, a rossz tapasztalataikat megmagyarázó résztvevők pedig magasabb pontszámot adtak, mint azok, akik nem adtak magyarázatot.
Az önészlelés nem az egyetlen, ami befolyásolja a viselkedésünket, amikor ratingelünk. A Kelet-angliai Egyetem (UEA) kutatói megállapították, hogy a termék vagy szolgáltatás fogyasztása és az értékelés közzététele között eltelt idő hossza ugyancsak befolyásolja az adott értékelést. Minél hamarabb írnak véleményt a vásárlók, annál jobban ráközelítenek a tapasztalataikra, a konkrétabb szempontokra, akár apró részletekre is, és annál negatívabbak lesznek az értékeléseik. Az idő telésével együtt az értékelők érzelmileg is távolítják magukat az élménytől, kicsinyítik a hibákat, pozitívabb véleményt alkotnak, és inkább az általános tapasztalatokra és az elvontabb szempontokra összpontosítanak.
Az olyan szolgáltatások esetében, mint a szállások, a szállás és a látogató lakóhelye közötti földrajzi távolság, valamint az országok közötti kulturális távolság is befolyásolja azt, hogy a látogatók hogyan értékelik a tapasztalataikat. A kutatók megállapították, hogy minél nagyobb a távolság az értékelő hazája és a meglátogatott ország között, annál pozitívabb az értékelés. Ez azzal az érzéssel függ össze, hogy minél távolabb van az ember a referenciapontjától, ami a mindennapi életben felmerülő összes apró bosszúsággal kapcsolatos, annál pozitívabb lesz az értékelés. Ezt magam is gyakran tapasztalom külföldi utazások alkalmával: a hangoskodás a budapesti lakásom környékén bosszantó, és zavar a pihenésben, az utcáról felszűrődő zajok a spanyolországi Valenciában viszont a mediterrán hangulat része, és nem befolyásolja az alvásomat. Az útfelbontás a pesti irodám közelében felháborító, New Yorkban sétálgatva az ambient része.
A kulturális távolság esetében azonban az összefüggés már fordított lehet: bár az emberek szeretik a különböző kultúrák meglátogatásának gondolatát, nem mindig tűrik a számukra kellemetlen meglepetéseket. Az országainkat jellemző társadalmi viselkedés és normák szerint nevelkedünk és formálódunk. Amikor viszont valamilyen váratlan, ettől rendkívül elütő dologgal találkozunk egy másik országban, ami a saját kultúránkban nem elfogadható, akkor már jellemzőbb a negatív beállítódás az értékelés megadásakor. Így például hiába szoktak hozzá Thaiföldön az emberek az utcai állatokhoz (macskák, kutyák, patkányok), és kevésbé tekintik őket olyan nagy problémának, mint például Európában, mi kevésbé tudunk megbocsátóak lenni egy a bangkoki szállás környékén rohangáló patkánnyal kapcsolatban.
Láthatjuk tehát, hogy a ratingeket adó fogyasztók eleve torzítottan számolnak be a valódi tapasztalataikról. A kognitív torzítások sorozata azonban itt közel sem ér véget: nemcsak a ratinget adók, hanem az azt később befogadó fogyasztók is rengeteg pszichológiai hatásnak vannak kitéve.
A ratingek befogadói oldala: kognitív torzítások és csapdák
Amikor rápillantunk egy számszerű értékelésre, agyunk azonnal mentális egyszerűsítéseket végez, kognitív kerülőutakat keres. Agyunk nem szereti a folyamatos mérlegelést, különben hamar eljutnánk az analízisparalízis állapotába, így automatikusan kialakítunk bizonyos referenciaértékeket és kategóriákat.
Az alkalmazott kerülőutak egyike az ún. horgonyzási hatás (anchoring bias): ennek lényege, hogy minden olyan esetben, amikor számokkal van dolgunk, akkor az elsőként megismert szám foglyai vagyunk! Az elsőként látott szám erősen befolyásolja, lehorgonyozza az ítéletünket. Ha az első rating, amit meglátunk mondjuk egy szállás kapcsán a Booking.com-on, 9.2, akkor azt azonnal kiváló helyként rögzítjük, és az ehhez képest alacsonyabb pontszámokat (például egy 8.2-t) automatikusan az indokoltnál gyengébbnek érzékeljük, még ha a különbség elhanyagolható is, és objektíven a másodikként látott hely még mindig nagyon jó. De a dolog persze fordítva is működik: ha szállást keresve, a különböző szűrőket alkalmazva az első szám, ami szembejön, egy 7-es értékelés, akkor ahhoz képest egy 7.8-as értékelésű szállást (ami egyébként nem számottevő különbség) sokkal jobbnak, akár kifejezetten jónak fogunk értékelni. A horgonyzás jelensége megmagyarázhatja, miért van, hogy egyes emberek a 7.5-öt már elég jónak tartják, mások pedig 9 fölött keresgélnek attól függően, hogy milyen számok váltak náluk normává az elsőként megismert számnak köszönhetően.
A helyzet a számok tekintetében persze ennél sokszor összetettebb. Az emberek platformonként és szolgáltatástípustól és terméktől függően más-más további egyszerűsítő, kognitív stratégiákat alkalmazhatnak. Ezek egyike a kategorizáció és a sávokban gondolkodás a konkrét számok helyett. Ha az ember elég időt töltött például az IMDb nevű filmes adatbázison, akkor körülbelül tudhatja, hogy egy 7 és 7.5 közötti ratinggel rendelkező film valószínűleg nézhető lesz, azonban 6 környékén garantált a csalódás. Ennek köszönhetően a 6–7 tartományban levő filmeket egyből kiejtjük a választható opciók közül (akár egy 6.9-est is), de sokkal megbocsátóbbak leszünk a 7–10 tartományon belüli filmekkel, és kevésbé leszünk érzékenyek a részletekre (vagyis hogy valami 7.1 vagy 7.2). Ez ugyanígy igaz lehet szállásoknál is: az emberek nagy része egy 8-as pontszám felett már kevésbé lesz érzékeny a részletekre, és nem keresi a lehető legmagasabb pontszámot a 8–10 tartományban. Ez egy teljesen bevett heurisztikus döntéshozatali stratégia, amely segít csökkenteni a kognitív terhelést.
Kézenfekvő módon ezekre a mentális leegyszerűsítésekre már kevésbé fogunk hagyatkozni akkor, amikor az adott szolgáltatás vagy termék, vagy akár az adott értékelési rendszer gyakorlott szakértőivé válunk, és fogékonyabbak leszünk a részletekre. Így például filmkedvelőként rájövünk arra, hogy minden filmet érdemes a saját műfajának sztenderd értékeihez mérni és látni, hogy a közönséget jobban megosztó vígjáték műfajban egy 7 pont feletti értékelés például mennyire ritka, és mennyire nem vethető össze egy másik műfaj (pl. dráma) hasonló pontszámával.
A ratingekre történő hagyatkozásánál nagy szerepe lesz a kerek számok hatalmának is. Az emberek kognitívan preferálják a kerek számokat, mert könnyebben feldolgozhatók, és meggyőzőbbnek tűnnek. Egy 8.0-s értékelés stabilnak és teljesnek hat, míg egy 7.9 befejezetlen érzetet kelt, pedig a különbség láthatóan minimális. Ennek a következménye az is, hogy a 9.0 és 8.9 közötti különbség hatása nagyobb, mint 8.3 és 8.2 között, mert a 9 egy új kategóriát jelöl az agyunk számára. Ha egy hotel értékelése 8.0-ra kerekedik fel egy változás miatt, az emberek hirtelen meggyőzőbbnek érzik, mint amikor még 7.9 volt.
A kerek számok hatása alól létezik egy fontos kivétel: bár az ötcsillagos (vagy tízpontos) értékelés nagyszerű jele a minőségnek, a tökéletes pontszám nem mindig ideális. A kutatások szerint például termékek esetében a 4.2 és 4.5 közöttiek több vásárlást ösztönöznek, mint a tökéletes, ötcsillagos értékeléssel rendelkező termékek. Hogy miért? A fogyasztók bizalmatlanok a hibátlan értékelésekkel szemben, gyakran azt feltételezik, hogy azok hamisak vagy manipuláltak. Az ügyfelek jobban bíznak a pozitív és negatív vélemények keverékével rendelkező vállalkozásokban, mint a csak pozitív visszajelzéssel rendelkező vállalkozásokban. Úgy tűnik, hogy a fogyasztók 68%-a jobban bízik a véleményekben, ha jó és rossz értékeléseket is lát, míg 30% cenzúrára vagy hamisított véleményekre gyanakszik, ha egyáltalán nem lát negatív értékelést.
Nagy hatása van a döntésünkre az értékelések dinamikájának is. A felhasználók hajlamosak a frissebb értékeléseket nagyobb súllyal figyelembe venni, még akkor is, ha az összpontszám hosszú távon nem változott. Egy 8.5-ös értékelésű hotel, amelynek az utóbbi 3 véleménye negatív hangvételű, kevésbé tűnik vonzónak, még ha az átlagos pontszám magas is. Egy régebbi, 9-es értékelésű hotel elveszítheti a vonzerejét, ha az új értékelések csak 7-eseket adnak neki. Miért történik ez? Ennek oka a közelmúlthatás (recency bias) nevű kognitív torzítás: az emberek túlértékelik a friss információkat, és kevésbé veszik figyelembe a korábbi adatokat. Ez egy ún. trendhatással jár, ami miatt azt gondoljuk, hogy a legújabb vélemények pontosabban tükrözik a helyzetet.
És persze nem szabad elfeledkeznünk a veszteségkerülés jelenségéről sem: az emberek jobban félnek egy rossz választás következményeitől, mint amennyire örülnek egy jó választásnak. Ennek az lesz a következménye, hogy például egy filmválasztásnál többen kerülik a 6–7 közötti értékeléseket, még akkor is, ha az adott tartalom (például témájánál fogva) egyébként megfelelhetne nekik. Ugyanígy, egy 8.2-es hotelnél kisebb a félelem a rossz élménytől, mint egy 7.9-esnél, még ha valójában a különbség elhanyagolható is.
A személyiségtípus jelentősége: kinek ilyen, kinek olyan
Csak hogy tovább árnyaljuk a helyzetet, nagyon fontos bedobnunk még egy tényezőt az információtengerbe. Köztem és a feleségem között van egy alapvető különbség: teljesen máshogy hozunk döntéseket. Én inkább vagyok a „jó lesz az úgy” típus: gyors döntéseket hozok, nem keresem a tökéletes opciót; ami kielégíti az igényeimet, azzal már harmóniában tudok lenni. A feleségem ezzel szemben addig keres, amíg meg nem találja az elérhető legjobb opciót.
Ez már a római szállás kiválasztásánál is alapvető gondot okozott: én úgy működöm, hogy ha egy hotelnek 8 felett van az értékelése, akkor az már valószínűleg rendben van. A feleségem viszont azt mondja: „8? Az túl alacsony, legalább 9-esnek kell lennie.” Ugyanez történik az étterem kiválasztásánál is: „Menjünk a 4.3-asba, az biztos jó lesz!” – mondom én. „4.3? Minek mennénk egy 4.3-asba, ha van egy 4.7-es is a közelben?” – kérdezi a feleségem. „Mert 900 értékelése van, ez elég sok ahhoz, hogy tudjuk, hogy jó, és nagyobb az esélye, hogy nem lesz tele turistákkal.” „És mi van, ha a 4.7-es tényleg sokkal jobb?” – kérdezi a feleségem.
Jól látható a különbség kettőnk között: ő a legjobb lehetőséget keresi, én pedig az első jónak tűnő opciót választanám. Különböző emberek különbözőképpen észlelik és élik meg a ratingeket, mert más-más kognitív stratégiákat alkalmaznak a döntéshozatalban. A személyiségtípusok jelentős hatással lehetnek arra, milyen számokat tartunk „elfogadhatónak” vagy „meggyőzőnek”. A személyiségpszichológiában több dimenzió is segíthet megérteni, hogy egy adott ember milyen módon dolgozza fel a ratingeket.
Az egyik a Herbert Simon nevű pszichológus által bevezetett spektrum, amelynek két végpontja a satisficer és a maximizer személyiségtípusok, magyarul az „elég jóra törekvők” és a „perfekcionisták”. Az „elég jóra törekvők” gyorsan hoznak döntést, és olyan megoldást keresnek, ami elér egy számukra elfogadható küszöböt, de nem feltétlenül a legjobbat. Ezzel összhangban például könnyen elfogadják a 7-8 körüli ratingeket (pl. „Egy 8.0-s hotel elég jó, nem keresek tovább”), és kevésbé stresszelnek az alternatívákon. Ezzel szemben a „perfekcionisták” erősen optimalizáló személyiségek: mindig a legjobb lehetőséget akarják kiválasztani, hajlamosabbak sokat keresgélni és nehézkesen dönteni. Ennek következtében valószínűbb, hogy 9 feletti értékelést keresnek (pl. a Booking.com-on 9.0 alatt nem is foglalnak szállást). Ez egyébként azzal is jár, hogy ők gyakrabban tapasztalnak döntési fáradtságot, mert minden opciót alaposan ki akarnak értékelni.
Herbert Simon elmélete az 1950-es évekből származik, és azóta azért kiderült, hogy spektrum helyett érdemes az emberek döntéseiről multidimenzionális rendszerben gondolkozni. Ennek a következménye az is, hogy akár termékenként/szolgáltatásonként változhat, mennyire vagyunk „elég jóra törekvők” vagy „perfekcionisták”. Magunk és ismerőseink kapcsán is tapasztalhatjuk, hogy míg valaki képes hetekig tartó böngészésre és kutatásra, hogy megtalálja a számára legtökéletesebb fejhallgatót, ugyanez az ember meglepő igénytelenséggel áll mondjuk ahhoz, hogy hol fog megszállni vagy hol fog étkezni.
Egy másik faktor, ami befolyásolhatja, miként észleljük a ratingeket, a kockázatkerülés és kockázatkeresés személyiségdimenziójával függ össze. Az emberek eltérő módon kezelik a bizonytalanságot a döntéshozatal során. A spektrum egyik végén a kockázatkerülők helyezkednek el: ők biztonsági játékosok, kerülik az alacsony értékelésű opciókat. Így például 8.0 alatti IMDb-értékelés alatt nem fognak megnézni egy filmet, mert félnek, hogy csalódás lesz. Az erős számfüggőség miatt gyakran figyelmen kívül hagyják a lehetséges szubjektív tényezőket (pl. egy film lehetne jó nekik, de ha a rating 6.9, akkor automatikusan elutasítják). A spektrum másik végén pedig a kockázatkeresők vagy kísérletezők helyezkednek el. Ők inkább hajlamosak kontextus alapján dönteni, és nem a számok alapján. Gyakran más forrásokat is figyelembe vesznek (pl. kritikák, baráti ajánlások). Így ők akár egy 6.8-as értékelésű filmet is megnéznek, ha az egyébként valamilyen okból kifolyólag (pl. témája miatt) érdekesnek tűnik.
A statisztikai csapdák
A ratingek átlátását és helyes megítélését persze az sem segíti, hogy az emberekben van egy zsigeri vakság a komplexebb számtani érvekre és összefüggésekre. Úgy is mondhatnánk: senki sem szereti a matekot! A ratingek pedig sok matematikai statisztikai torzítást és buktatót rejtegetnek, amelyek ugyancsak félrevihetik a döntéseket. Az értékelési rendszerek többsége egyszerű átlagokat használ, pedig a medián (helyzeti középérték) vagy az eloszlás jobban leírná a valóságot. Például ha egy szállásnak van egy 10-es, egy 5-ös és egy 1-es értékelése, annak átlaga 5,3 lesz. Egy másik szállás pedig kap három darab 5-öst, aminek átlaga 5 lesz. A két hely a majdnem azonos átlag ellenére teljesen más élményt nyújthat.
Valószínűleg mi magunk is sokszor alkalmazzuk a statisztikai buktatók kikerülésére a „nagy mintaszám, magas rating kombináció” alapelvet, vagyis nemcsak az átlagra figyelünk, hanem arra is, hogy szám szerint hány értékelőtől jött össze ez az átlag. A kognitív hatékonyság szempontjából ez egy heurisztikus döntéshozatal, vagyis egyszerűsített stratégia, amely időt spórol (nem kell végigolvasni az értékeléseket), csökkenti a döntési fáradtságot, és kihasználja a statisztikai stabilitást (minél több értékelő van, annál kisebb az esélye, hogy néhány szélsőséges vélemény torzítja az átlagot). Ezért sokan ezt a megközelítést használják például Google Reviews-, TripAdvisor-, Yelp- és Amazon-értékelések esetében.
A statisztikai logika szerint persze tény és való, hogy minél több adat áll rendelkezésre, annál kisebb az esélye, hogy néhány szélsőséges vélemény torzítja az átlagot. De van néhány buktatója és korlátja ennek a módszernek is. A feleségem által kinézett hely 4.7-es átlaga 3200 értékelésből, míg a harmadik helyen álló családi trattoria 4.1-es átlaga 150 értékelésből állt össze. Egyértelmű, hogy a nagyobb minta megbízhatóbb, igaz? Nem feltétlenül. A nagyobb minta gyakran nem a minőséget, hanem a népszerűséget méri. Egy hely nem feltétlenül azért kap több értékelést, mert jobb, hanem mert több ember látogatja (pl. mert előkelő helyen szerepel a keresési találatok között). A szélsőséges vélemények erősebben torzítanak egy kisebb mintánál. A kis családi trattoria esetében ha 10 ember nagyon elégedett, és 2 nagyon elégedetlen, az az értékelésen is erősen látszódni fog. Egy nagy étteremnél ezek az ellentétes vélemények felhígulnak. Azt is érdemes fejben tartani a fake review farmok és a vásárolt pozitív értékelések korában, hogy a nagyszámú értékelés könnyebben manipulálható, illetve nehezebb tetten érni a kozmetikázást.
A fentiek alapján bár a nagy minta és a magas rating kombinációja gyors és általában jó döntési stratégia, önmagában nem mindig a legjobb megoldás. Nem veszi figyelembe a személyes preferenciákat, jobban ki van téve a torzított ratingek veszélyének, kevésbé veszi figyelembe az aktuális trendeket, és figyelmen kívül hagyja a ratingek dinamikáját. Egy kombinált megközelítés jobban szolgálhatja a céljainkat. Persze bázisként érdemes ellenőrizni az értékelések számát és átlagát, és jó jel, ha nagy a minta, de ne hagyatkozzunk csak erre. Ezt azonban érdemes vegyítenünk az értékek eloszlásának vizsgálatával. Ha egy hely túl sok 5 csillagos és 1 csillagos értékelést kapott, az gyanús lehet. Egy stabil 4.5-ös átlag egyenletes eloszlással valószínűleg jobb, mint egy 4.8-as, ahol sok a szélsőséges vélemény.
Sokszor persze az eloszlások is lehetnek torzítottak. Ha például megnézünk egy Airbnb-listázást, azt fogjuk tapasztalni, hogy a legtöbb hely 4.5 és 4.9 között mozog. De vajon tényleg minden szállás ilyen jó? A válasz az, hogy nem feltétlenül. Az értékelések bimodális eloszlást mutatnak: az emberek vagy nagyon elégedettek, vagy nagyon elégedetlenek, és a közepes vélemények gyakran eltűnnek. Ráadásul a pozitivitási torzítás miatt sokan csak akkor írnak véleményt, ha nagyon jó tapasztalatuk volt, vagy ha extrém rossz. Az Airbnb esetében ráadásul tovább torzítja a helyzetet, hogy mivel a vendégek tudják, hogy a házigazdák is értékelik őket, sokan nem akarnak túl kritikusak lenni, hogy elkerüljék a rossz vendégértékelést.
Érdekes lehet az értékelések dinamikáját is figyelni: ha egy étterem tavaly még 4.8 volt, de az utóbbi hónapokban sok 3-ast kapott, lehet, hogy a minőség romlott. Végül, de nem utolsósorban a kontextusfüggő döntéshozatalnak is szerepe van: ha fine dining éttermet keresünk, lehet, hogy egy 4.3-as is kiváló. Szemben egy gyorsétterem 4.8 pontjával, ahol a magas pontszám konzisztenciát és gyors kiszolgálást jelez.
A kultúra fogságában
Amikor a feleségemmel rápillantunk a 4.7-es ratinggel rendelkező étterem szöveges véleményeire, az első, amit észreveszünk: szinte az összes pozitív vélemény angolul van. A 4.1-es családi trattoria esetében pedig szinte minden értékelés szövege olasz. Ez egy újabb tényezőre hívja fel a figyelmet: kik értékelték az éttermet? Helyiek vagy turisták? És kulturálisan más előzetes beállítódással rendelkeznek-e a helyiek, mint mi?
Az értékelések országonként nagyon eltérő normák szerint működnek, amit több tudományos kutatás is alátámaszt. Az emberek különböző kultúrákban eltérően értékelnek, mert más elvárásaik és társadalmi normáik vannak. Ha Japánban vagy, akkor a 4.3 kiemelkedően jónak számít, mert az emberek ott szigorúbban pontoznak. Ha Franciaországban vagy, a 4 feletti éttermek már a legjobbak közé tartozhatnak, mert a gasztronómiai elvárások magasabbak. Általános ökölszabály, hogy individualista kultúrákban (Nyugat-Európa, Egyesült Államok) az emberek szabadabban osztályoznak, és könnyebben adnak szélsőséges értékeléseket (pl. 5 vagy 1 csillag). Kollektivista kultúrákban (pl. Japán, Dél-Korea) az emberek óvatosabbak az értékeléseikkel, és kevésbé adnak szélsőséges pontszámokat. Ez azt mutatja, hogy az értékelési rendszerek nem univerzálisak – kulturális normák, iparági sajátosságok és pszichológiai torzítások alakítják őket. Vagyis érdemes lehet nemcsak az adott számra koncentrálni, hanem az országos átlagszintre. Ha egy japán hotel 3.9-es, az lehet, hogy jobb, mint egy amerikai 4.4-es. Vagyis a ratingek ebben az értelemben is relatívak, és nem abszolútak.
Visszatérve a példánkra, a 4.7-es étterem pontszáma valószínűleg a turisták értékeléseiből állt össze. A turisták pedig gyakran inkább az élményt pontozzák („Nagyszerű hangulat!”, „Csodás kiszolgálás!”). Ezzel szemben a családi trattoria alacsonyabb 4.1-es értékelése mögött a helyiek állnak, akik az étel minőségére és az ár-érték arányra fókuszálnak. Egy helyi így nem fog egy átlagos pizzériára 5 csillagot adni, míg egy turista igen, ha az „élete legjobb pizzája” volt – még ha valójában egy hétköznapi helyről van is szó. A végeredmény: a családi trattoria lehet, hogy minőségibb hely, de mivel kevésbé turistás, alacsonyabb pontszámot kapott.
A jövő: milyen fejlesztések várhatóak a ratingrendszerekben?
Nyilvánvalóan a platformok is tudatában vannak, hogy a ratingek nem mindig megbízhatók önmagukban, ezért folyamatosan fejlesztik az értékelési rendszereiket. Ebben nem meglepő módon hangsúlyos szerepe lesz a mesterséges intelligenciának mint nagy nyelvi elemző rendszernek. A Google például törekszik arra, hogy kiemelje a szöveges értékelések fő témáit, pl. „helyiek által kedvelt” vagy „turisták által dicsért”. Ez segíthet abban, hogy gyorsan megértsük az értékelések kontextusát, anélkül hogy végigolvasnánk őket.
Nagy jövő előtt állnak az ugyancsak mesterséges intelligencia alapú, személyre szabott ratingek is. A jövőben az AI nemcsak egy általános értékelést fog mutatni, hanem személyre szabott ratinget adhat: ha inkább fine dining éttermeket kedvelsz, akkor a Google hozzád igazított pontszámot mutathat az értékelések alapján. Ha sok vegán helyet látogattál, akkor az AI a vega opciók minőségét is figyelembe veheti az értékelésnél. Ezek a megoldások mind-mind sokkal személyre szabottabb döntéshozatalt eredményezhetnek. De mindaddig, amíg ezek a fejlesztések megtörténnek, már most is rendelkezésre állnak eszközök, amelyek segítenek jobban értelmezni az értékeléseket. A platformok által beillesztett szűrők és manuális alapú módszerek képesek némiképp megugrani a cikkben elemzett kognitív buktatókat.
Gondolom, mindenki lerágta már a körmét, hogy a cikk végére kiderüljön, végül melyik római éttermet választottuk a feleségemmel. Nagy csalódást fogok okozni: végül a 4.7-es értékelésű, 3200 mintaszámú hely mellett döntöttünk. Hogy miért? A feleségem perfekcionista szemlélete miatt („ha van jobb opció, azt kell választani”). A horgonyzási hatás miatt (a 4.7-es pontszámot láttuk meg először). A társadalmi bizonyíték hatása miatt (ha sokan jónak tartják, biztos jó). A veszteségkerülés miatt (nem akartunk kockáztatni egy „rossz” ebédet). És nem utolsósorban rosszak vagyunk matekból.
Soha nem tudjuk meg, mit hagytunk ki a családi trattoriával. Talán jobb lett volna. De úgy tűnik, más volt megírva az online csillagjainkban.
2025-02

