Tiedonhaku ChatGPT-tekoälyllä

ChatGPT syrjäyttää Googlen tiedonhaussa! Tekoäly läpäisi Bar Exam -lakimiestentin! ChatGPT:n uusi 4-versio tuottaa tuoreempaa ja luotettavampaa tietoa kuin tekoälybotin aikaisempi versio! Kuulostaako tutulta?

Ennen kuin siirryt käyttämään pelkkää ChatGPT:ta omissa tiedonhauissasi tai tekstien tuottamisessa, on hyvä ymmärtää työkaluun liittyvät rajoitteet.

Alla oleva kuva kirjastonhoitajasta on tuotettu DALL-E 2 -tekoälytyökalun avulla. Siltä pyydettiin erityisesti kuvaa kirjastonhoitajasta ilman silmälaseja, mutta tekoälyn mielikuvitus ei riitä siihen, että silmälasittomia kirjastonhoitajia voisi olla olemassa. Tässä on yksi esimerkki tekoälytyökalujen ongelmista: niiden tuottamien tulosten laatuun vaikuttaa niiden kouluttamiseen käytetyn datan laatu. Lue ChatGPT:n käytöstä tiedonhaussa lisää muistilistasta kuvan alta.

Tekoälyn tuottamassa kuvassa henkilö lukee kirjaa suuret silmälasit otsalla.
Uutinen

Body

Tiedonhakijan ChatGPT-muistilista

  • ChatGPT ei ole Googlen kaltainen hakukone, joka etsisi vastauksia kysymyksiin netistä. Se ei edes pysty tekemään hakuja netistä.
  • Sekä ilmaisversiota että uutta maksullista GPT-4 -kielimallia hyödyntävää versiota on koulutettu valtavalla määrällä internetin tekstisisältöä, joka on kerätty ennen syksyä 2021. Tuoreempaa dataa ei kummallakaan versiolla ole käytössään. 
  • Ei voi luottaa, että tekoälybotin vastaukset perustuvat faktoihin. ChatGPT:n käyttämän kielimallin algoritmi pyrkii ennustamaan, mikä sana tilastolliseen todennököisyyteen perustuen seuraa edellistä. Se ei ”ymmärrä” sanojen merkitystä, tuottamansa tekstin sisältöä tai sen paikkansapitävyyttä.  
  • Tekoälyn opettamiseen käytetyn, netistä kerätyn datan laatu heijastuu botin antamissa vastauksissa. Netissä julkaistun tiedon tavoin koulutusdata sisältänee vinoutunutta, vajavaista tietoa ja suoranaisia valheita. Tarkempaa tietoa datasta ei ole saatavilla. 
  • ChatGPT myös ”hallusinoi” (artificial hallucination). Kun siltä kysyy kysymyksen, johon ei löydy vastausta sen koulutusdatasta, botti saattaa keksiä sellaisen. Esimerkiksi kirjaston tekemissä testeissä ChatGPT keksi artikkeleita ja kirjoittajia, joita ei ole olemassakaan.
  • Botin kouluttamiseen on käytetty lukuisia eri kieliä ja sen kanssa voi jutella muun muassa suomeksi. Se on kuitenkin pääasiassa suunniteltu ymmärtämään ja tuottamaan tekstiä englanniksi. Koulutusdatan määrän vaihtelu eri kielien kohdalla saattaa vaikuttaa lopputuloksiin. Englannin kielen hallitsevuus on syytä pitää mielessä tässäkin yhteydessä.
  • Kirjoittajalle työkalu voi olla apuna esimerkiksi näkökulmien etsimisessä, tekstin rakenteen hahmottelussa tai valkoisen paperin kammon voittamisessa. Tietojen tarkistaminen, lähdemateriaaleihin tutustuminen, tekstin muokkaaminen ja varsinainen ajattelutyö jää ihmiskäyttäjälle. 
  • Tekoälybotin tuottaman tekstin tarkistaminen voi tosin olla työlästä. Helpotusta tähän saattaa olla tuomassa ChatGPT:n kilpailija. Ennakkotietojen mukaan Googlen Bard-chattibottiin olisi tulossa hakunappi, jolla voi näppärästi tehdä Google-haun samasta aiheesta. Toki tällöinkin on otettu vasta tiedon arviointimatkan ensimmäinen askel: haulla löytyvät nettilähteet on joka tapauksessa luettava itse ja arvioitava kriittisesti.

Muistilistaa on muokattu eSignals-artikkelin Lähdekritiikin merkitys korostuu tekoälybottien aikakaudella pohjalta. Lisätietoa kirjaston tekemistä ChatGPT-testeistä saat myös artikkelista ChatGPT testissä: onko hypelle katetta?.