Ny chatbot tager verden med storm - kan blive revolutionerende for blinde

Den banebrydende chatbot ChatGPT har fået en ny og bedre version, der nu kan svare på visuelle elementer. Det åbner for en helt ny verden for mange.

Bemærk: Artiklen er mere end 30 dage gammel
Dit cookie-tilsagn gør, at indholdet her ikke kan vises. Du kan ændre dit tilsagn ved at klikke på boksen her.

Mens denne historie handler om kunstig intelligens, så begynder vi et helt andet sted. Med pasta.

Det kommer til at give mening, bare rolig.

På bordet foran Jesper Hvirring Henriksen ligger en blågul pose med 500 gram pasta fra producenten De Cecco.

Det er simpelt for ham at afkode. Men for Hans Jørgen Wiberg fra Falster er det væsentligt mere kompliceret.

For ham og mange andre, der er blinde eller svagsynede, er der ofte brug for en hjælpende hånd til eksempelvis at finde ud af, hvad kogetiden på De Cecco-pastaen er.

Men den udfordring kommer den danske app Be My Eyes til livs.

Her kan blinde via appen komme i kontakt med en frivillig, der gennem en videosamtale kan give alle detaljerne om pastaen – og alt andet, som blinde og svagsynede skal have hjælp til.

Med Be My Eyes kan den blinde sende en anmodning ud til frivillige, og de kan over en videosamtale så vejlede i eksempelvis, hvornår det næste tog afgår.
Med Be My Eyes kan den blinde sende en anmodning ud til frivillige, og de kan over en videosamtale så vejlede i eksempelvis, hvornår det næste tog afgår. Foto: Be My Eyes

Appen, som Hans Jørgen Wiberg lancerede for otte år siden, og hvor Jesper Hvirring Henriksen er teknologichef, er en bragende succes med over 6,3 millioner frivillige og 450.000 synshandicappede på verdensplan.

Men trods succesen stødte de på en udfordring for visse brugere. Det var ikke alle, der brød sig om at forstyrre andre i forbindelse med dagens små gøremål og spørgsmål. Så ventede de hellere, til de kunne få hjælp af en bekendt.

Men tirsdag skete der noget, så de synshandicappede ikke længere skal bekymre sig om at forstyrre de frivillige fra morgen til aften.

Og nu går vi for et øjeblik væk fra pastaen, men frygt ej. Vi skal nok komme tilbage til den.

Hvis man som frivillig er travl, kan man godt se bort fra en anmodning, for med 24.000 frivillige i Danmark er der altid en til at hjælpe.
Hvis man som frivillig er travl, kan man godt se bort fra en anmodning, for med 24.000 frivillige i Danmark er der altid en til at hjælpe. Foto: Be My Eyes

Den forbedrede ChatGPT

Over de sidste godt fire måneder har én teknologisk landvinding været på de flestes læber.

ChatGPT.

Chatbotten, som blæste verden bagover med sin avancerede sprogforståelse og formuleringsevne, der i mange tilfælde ikke kunne skelnes mellem menneskelig og kunstig intelligens.

Læs også
App for blinde vinder priser
Læs også
App for blinde vinder priser

Men allerede få måneder inde i ChatGPTs levetid sparker virksomheden bag, OpenAi, døren ind til endnu et banebrydende område inden for kunstig intelligens.

Og tirsdag blev den forbedrede version af systemet bag ChatGPT lanceret med navnet GPT-4.

Den nye model kan nu også svare på billeder og visuelle inputs og eksempelvis foreslå opskrifter ud fra et billede af ingredienser. Den kan programmere spil og hjemmesider i en lynende fart.

Og så kan den altså være de hjælpende øjne for de 1400 blinde og svagsynede i Danmark, der bruger Be My Eyes. Appen er den første i verden, der bruger GPT-4s billede-til-tekst-funktion – selvom den lige nu er i en lukket betatest, inden den efter planen rulles ud i årets anden halvdel.

Dit cookie-tilsagn gør, at indholdet her ikke kan vises. Du kan ændre dit tilsagn ved at klikke på boksen her.

Chatbot svarer i hidtil usete detaljer

Teknologichef Jesper Hvirring Henriksen peger telefonen mod posen med pasta, og den svarer hurtigt, hvilken pasta han sidder med. I det opfølgende spørgsmål om kogetiden svarer den, at den skal have 9 minutter for al dente og 11 minutter for gennemkogt. Og da han beder om en opskrift, dukker der kort efter en liste ingredienser op.

- Hvis man så ikke får et fornuftigt svar, kan man bede om at blive sat i forbindelse med et menneske, forklarer han.

I den mere komplicerede ende evner den kunstige intelligens også at fortælle, hvor der er et ledigt løbebånd i fitnesscenteret. Og så kan den i hidtil uset detalje beskrive billederne for grundlægger Hans Jørgen Wiberg, når der lander et billede i en fælleschat.

- Før kunne den sige, at det er en hund på billedet. Simple ting. Men i stedet for bare at sige "hund" kan den sige, hvilken type hund det er, hvad den laver, og hvilket udtryk den har, forklarer Jesper Hvirring Henriksen, og Hans Jørgen Wiberg tilføjer:

- Hvis man bor alene og er usikker på, om der er rent, så har man måske ikke lyst til at blive konfronteret med det af en fremmed. Den er meget mindre fordomsfuld, end de fleste af os kan præstere.

Se et eksempel på, hvordan GPT-4 kan assistere i hverdagen. Artiklen fortsætter under billederne.

Den kunstige intelligens kan hjælpe blinde med at vælge dagens outfit.
Den kunstige intelligens kan hjælpe blinde med at vælge dagens outfit. Foto: Be My Eyes
Be My Eyes bruger også stemmesvar til blinde, der ikke kan skrive på tastaturet.
Be My Eyes bruger også stemmesvar til blinde, der ikke kan skrive på tastaturet. Foto: Be My Eyes
Er svaret ikke tilfredsstillende, kan man stadig blive stillet igennem til en frivillig.
Er svaret ikke tilfredsstillende, kan man stadig blive stillet igennem til en frivillig. Foto: Be My Eyes

Grundlægger: GPT-4 er på et helt andet niveau

Det er den slags små hverdagsting, som blinde med GPT-4 kan få hjælp til uden en følelse af at trænge sig på.

- Det er helt vildt, at vi kan servicere nogle brugere, uden at vi skal involvere andre mennesker. Der har før været billedgenkendelsesapps, men de har ikke været på et niveau, som GPT-4 er. Det er en helt anden verden, siger Hans Jørgen Wiberg.

Mens teknologiske gennembrud som dette skaber begejstring og fascination, så har flere uheldige sager over de seneste måneder indledt en debat om, hvorvidt teknologien nu virkelig er klar til at blive brugt.

quote Den er så absurd god til at genkende ting, og det eliminerer mange fejltagelser

Hans Jørgen Wiberg, grundlægger af Be My Eyes

Fejl og mangler udfordrer

Både Microsofts og Alphabets chatbots har dummet sig med åbenlyse faktuelle fejl og et tvivlsomt moralsk kompas i deres svar.

Men de problemer står GPT-4 stærkere over for, hvis man skal tro skaberne fra OpenAi. Her lyder det, at det er 82 procent mindre sandsynligt, at GPT-4 svarer på henvendelser om ulovligt indhold, og det er 40 procent mere sandsynligt, at den kommer med svar, der er faktuelle.

Hos Be My Eyes er teknologiens mangler noget af det, de har fokuseret mest på, forklarer Jesper Hvirring Henriksen.

- Når man får betaen, skal man acceptere alle de ting, man ikke vil bruge appen til. Man skal ikke bruge den til at finde ud af, hvilken medicin man står med. Det har vi gjort meget tydeligt.

Læs også
App'en "Be My Eyes" med i finalefelt
Læs også
App'en "Be My Eyes" med i finalefelt


Indtil der findes en fejlfri kunstig intelligens, er der bare en risiko, man er nødt til at leve med, forklarer han. Men Hans Jørgen Wiberg er nu ganske rolig.

- Den er så absurd god til at genkende ting, og det eliminerer mange fejltagelser. Vi er på dag tre af det her, og jeg er blæst bagover. Og de blinde ved jo godt, hvad de har gang i.

Teknologien bliver kun bedre dag for dag, og mens det sker, kan blinde og svagsynede smække en god bolognese sammen med De Cecco-pasta kogt perfekt al dente med hjælp fra Be My Eyes og GPT-4.


Nyhedsoverblik