GPT-4o, den seneste flagskibsmodel fra OpenAI, har modtaget blandede følelser fra brugerne. Mens nogle er imponerede over dens hastighed og multimodale muligheder, er andre skuffede over, at den ikke viser nogen forbedringer i intelligens og ræsonnement i forhold til GPT-4. Men uanset om du er team “blown away” eller team “meh”, er det stadig svært at ignorere det faktum, at GPT-4o’s multimodale muligheder er en game changer.
Her er visse måder, hvorpå GPT-4o vil være i stand til at hjælpe dig, efter OpenAI har frigivet de nye stemme- og synsfunktioner.
Læringspartner/ underviser
Med GPT-40’s evner kan det være den perfekte læringspartner eller en vejleder. Du kan bruge det til at lære sprog eller få hjælp til at løse matematikopgaver. Du kan pege på objekter for at få hjælp til sprogindlæring eller dele dine matematikspørgsmål med dem. Det vil ikke bare dele svarene ud til dig eller gøre dit hjemmearbejde for dig.
https://www.youtube.com/watch?v=_nSmkyDNulk
Det kan skabe en række spørgsmål for at hjælpe dig med at forstå konceptet og selv komme til problemløsningsdelen, som en rigtig underviser. Desuden er den med sine avancerede egenskaber i stand til at håndtere en situation “empatisk”. Så mens den vejleder dig, kan den udvise utrolig tålmodighed og empati og skubbe dig i den rigtige retning uden at blive frustreret. For mange mennesker kan det nogle gange være ret svært at få i det virkelige liv.
De yderligere applikationer ned ad linjen er endnu mere spændende, hvis du kunne bruge GPT-4o på smarte briller (som tager ideen fra Googles Project Astra) for altid at have din læringspartner ved din side.
Få hjælp til interviewforberedelse
ChatGPT kan, når det drives af GPT-4o, være den ultimative partner til at forberede sig til interviews. Selvom du allerede kunne simulere en frem og tilbage samtale med ChatGPT for at forberede dig til et interview, og det kunne hjælpe med at finde de tekniske aspekter af det helt fantastisk, var processen ikke så naturlig på grund af faktorer som latens og fravær af multimodalitet i ChatGPTs kerne.
Men med sine forbedrede ræsonnementer på tværs af stemme og vision, kan den gå et skridt videre i at hjælpe dig. For det første, med sin nye evne til at “se” dig, kan den endda guide dig med den æstetiske del af at blive klar til interviewet, ligesom din påklædning.
https://www.youtube.com/watch?v=wfAYBdaGVxs
Implikationerne er dog meget mere virkningsfulde. Med dens visuelle evner og dens evne til at fortolke menneskelige følelser, kan den endda give dig feedback på dit kropssprog, ligesom en rigtig coach.
Mødeassistent
ChatGPT kan deltage i dine møder, lytte til dine opkald og transskribere, opsummere og endda præsentere sine meninger, alt sammen i realtid, som en ægte assistent.
Du kan spørge den, hvad der blev diskuteret i opkaldet, hvad hver persons holdning var til et bestemt synspunkt, identificere modstridende synspunkter, arbejde med dataanalyseproblemer, slå bestemt information op og meget mere.
Personlig sprogoversætter
GPT-4o kan være en fremragende sprogoversættelsesassistent. Det kan oversætte en samtale i realtid, uden at det er nødvendigt at genberette den flere gange. Så du kan have en normal samtale på forskellige sprog, og hver gang en højttaler er færdig med at tale, vil ChatGPT oversætte det til det andet sprog.
Hvordan adskiller det sig fra at bruge Google Oversæt eller ethvert andet oversættelsesværktøj? Udover det faktum, at du ikke behøver at slå oversættelse til hver gang, og det holder samtalen naturlig, betyder GPT-4os evne til at forstå intonationen bag ordene, at mindre går tabt i oversættelsen.
Tilgængelighedsassistent for blinde
ChatGPT-4o kan med sine synsevner hjælpe synshandicappede ved at se på dine omgivelser for dig og beskrive det hele for dig.
https://www.youtube.com/watch?v=KwNUJ69RbwY
Selvom det virker ret håbefuldt i sin nuværende tilstand, så forestil dig implikationerne, hvis du kunne have GPT-4o i smarte briller, som Meta Rayban-briller, hvor GPT-4o bogstaveligt talt kunne være øjnene for en synshandicappet person. Selv i den nuværende form er det ret fantastisk, at folk kan pege deres telefons kamera mod noget, og det kan give alle detaljerne.
Hvis ChatGPT kunne blive i stand til at tolke tegnsprog, kunne det endda hjælpe døve i fremtiden.
Overvågningsmuligheder
ChatGPT-4o kan “potentielt” bruges til at overvåge børn, kæledyr, syge og ældre, eller endda bare ting som hoveddøre osv. Forestil dig, at du skal gå væk et øjeblik, og du vil have nogen til at overvåge dit barn eller kæledyr og giver dig besked med det samme, hvis de deltager i farlige aktiviteter (som du kan definere).
Selvom det vil tage noget tid, før du kan stole på, at AI ikke laver fejl og leverer pålidelige resultater hver gang, er det bestemt en spændende mulig use case for fremtiden.
Kodningsassistent
Når ChatGPT kan få adgang til din skærm med skærmdeling, kan du have en kodningsassistent ved din side og guide dig igennem. Selvom det også vil være nyttigt med andre apps, vil det med GPT-4o’s forbedrede kodningsfunktioner være det bedste program at få hjælp til kodning.
Dataanalyse
GPT-4o har fantastiske forbedringer i hastighed i forhold til GPT-4 Turbo, og det bringer denne hastighed til dataanalyse også. Det kan behandle regneark, analysere data og endda skabe statistiske diagrammer, grafer og diagrammer på mindre end 3o sekunder.
Oprettelse af 3D-modeller
GPT-4o kan endda oprette STL-filer til 3D-modeller fra enkelte tekstprompter, hvilket fremskynder visualiseringen og prototypingsprocessen. Så uanset om du vil fremskynde din arbejdsgang, eller du er en person, der ikke har den tekniske viden, der ellers kræves til denne opgave, kan ChatGPT hjælpe dig!
Jeg brugte GPT-4o til at oprette STL-fil til 3D-model på ~ 20 sekunder på min telefon. Temmelig bemærkelsesværdigt, hvad du kan generere med AI og simpel prompt nu. pic.twitter.com/2fbObrpPol
— Min Choi (@minchoi) 14. maj 2024
Oprettelse af konsistente karakterer
OpenAI introducerede DALL-E’s billedgenereringsmuligheder til ChatGPT for et stykke tid tilbage. Men med GPT-4o kan du oprette flere billeder af samme karakter og samtidig bevare karakterens konsistens. Så du kan nu bruge ChatGPT til at skabe konsistente karakterer til dine historier, og det kan skabe billeder af det i forskellige handlinger.
Transskribering af håndskrevne noter
Med GPT-4o’s øgede muligheder inden for billedgenkendelse kan den nu transskribere håndskrevne noter bedre. Du kan bruge det til at digitalisere dine skole- eller collegenotater. Den demonstrerer endda fantastiske transskriptionsevner, mens den håndterer håndskrevne breve fra det attende århundrede. Så selvom der vil være fejl, vil det også fastgøre hele processen eksponentielt!
GPT-4o er virkelig bemærkelsesværdig på 18. håndskrift. Jeg gav det følgende brev og bad det om en transskription. Et par meget små fejl … fantastisk! pic.twitter.com/3JevZvd5p5
— Generativ historie (@HistoryGPT) 14. maj 2024
Selvom GPT-4o ikke er en kæmpe opgradering i forhold til GPT-4 med hensyn til intelligens og ræsonnement, er det heller ikke en lille opgradering på nogen måde. Selv hvis du er en person, der er mere skræmt over dens antropomorfi eller dens ligheder med Scarlett Johannsens AI i Her, kan du ikke afvise, at det faktum, at det er blevet mere smart, vil være nyttigt på praktiske måder.
Der er dog også et andet faktum, som ikke kan overses, når man overvejer praktiske applikationer til GPT-4o – ChatGPTs 128K kontekstvindue. Med et begrænset kontekstvindue kan ChatGPT kun være så nyttigt i scenarier som at være mødeassistent, sprogoversætter. Spørgsmålet om, hvor lang tid inde i mødet/samtalen, ChatGPTs kontekstvindue ville løbe ud, er yderst gyldigt. Der er også spørgsmålet om begrænset brugshætter til GPT-4o.
Skriv et svar