Huomenta! ☕
Ja juuri kun ehdin maanantain Transistorissa jakamaan jutun siitä miten yhtiö aikoo esitellä kielimallia vasta ensi vuoden puolella… 😅
Transistori on arkiaamuisin ilmestyvä teknologiauutisiin ja internet-kulttuuriin keskittyvä uutiskirje, jota sponsoroi ohjelmisto- ja datakonsultointipalveluja tarjoava Three Point Consulting. Klikkaa Transistori tilaukseen ja pysy kartalla teknologiamaailman tuoreimmista käänteistä!
Uutiset 🗞️
Google julkisti Geminin
Google julkisti pitkään odotetut Gemini -kielimallit eilen, jotka omaavat multimodaalisia kyvykkyyksiä. Malleille voi antaa syötteenä niin tekstiä, kuvia, videoita kuin ääntäkin.
Gemini Ultra, joka on malleista kyvykkäin voittaa GPT-4:n kaikenkaikkiaan 30:ssä eri vertailuarviossa. Tärkeimpänä näistä on ns. MMLU -testi, jossa on laajalti kysymyksiä 57 eri aihealueesta, mm. eri tieteenaloista. Siinä Gemini on ensimmäinen kielimalli joka yltää parempiin tuloksiin kuin ihmisasiantuntijat:
With a score of 90.0%, Gemini Ultra is the first model to outperform human experts on MMLU (massive multitask language understanding), which uses a combination of 57 subjects such as math, physics, history, law, medicine and ethics for testing both world knowledge and problem-solving abilities.
Alla vielä Googlen vertailu Gemini Ultran ja GPT-4:n välillä:
Yhtiö ei kuitenkaan vielä julkaise Gemini Ultraa, vaan lupailee sen saapuvan Google Cloudiin yritysasiakkaiden käyttöön ensi vuoden alkupuolella. Sen sijaan yhtiö päivitti Bard -tekoälyavustajan toimimaan Gemini Pro -mallilla, joka on eri vertailuarvojen mukaan hieman GPT-3.5:ttä parempi.
Pro -malli on Google Cloudissa saatavilla 13. Joulukuuta alkaen. Pienin malleista, Gemini Nano tullaan asentamaan mm. Googlen Pixel -puhelimiin.
MetaAI sai uusia kyvykkyyksiä
Myös Meta julkisti eilen liudan tekoälypäivityksiä sen tuotteisiin. Yhtiö tarjoaa nyt mm. tekstistä-kuvaksi -mallia imagine.meta.com -sivustolla (tosin se ei ole toistaiseksi Suomessa saatavilla), minkä lisäksi sen eri palveluissa toimiva MetaAI -avustaja sai uusia toiminnallisuusparannuksia.
Meta AI is our virtual assistant you can access to answer questions, generate photorealistic images and more. We’re making it more helpful, with more detailed responses on mobile and more accurate summaries of search results. We’ve even made it so you’re more likely to get a helpful response to a wider range of requests. To interact with Meta AI, start a new message and select “Create an AI chat” on our messaging platforms, or type “@MetaAI” in a group chat followed by what you’d like the assistant to help with. You can also say “Hey Meta” while wearing your Ray-Ban Meta smart glasses.
…
One of Meta AI’s most commonly used features across our messaging apps is imagine, our text-to-image generation capability that lets you create and share images on the fly. We’re always looking for ways to make our AIs even more fun and social, so today we’re excited to add a new feature to Meta AI on Messenger and Instagram called reimagine. Here’s how it works in group chat: Meta AI generates and shares the initial image you requested, then your friend can press and hold on the picture to riff on it with a simple text prompt and Meta AI will generate an entirely new image. Now you can kick images back and forth, having a laugh as you try to one-up each other with increasingly wild ideas.
Apple suunnittelee alkuvuodelle laitepäivityksiä
Ja lopuksi vielä pari Apple -uutista. Bloombergin Mark Gurmanin mukaan Apple suunnittelee ensi vuoden alkuun uusia iPad Pro ja Air -malleja, sekä Mackbook Airia joissa olisi yhtiön uusi M3 -sarjan prosessori:
Apple Inc., seeking to reverse a decline in Mac and iPad sales, is preparing several new models and upgrades for early next year, according to people familiar with the situation.
The effort includes updating the iPad Air, iPad Pro and MacBook Air, according to the people, who asked not to be identified because the products haven’t been announced. The new iPad Air will come in two sizes for the first time, and the Pro model will get OLED screens — short for organic light-emitting diode. The MacBook Air, meanwhile, will feature the speedier M3 processor.
Lisäksi Applen tekoälytiimi julkaisi kaikessa hiljaisuudessa uuden Python -kirjaston, jota voi käyttää ns. natiivisti neuroverkkojen rakentamiseen M-sarjan prosessoreiden päälle. Uuden kirjaston nimi on MLX ja sen lähdekoodin löytää Githubista.
Suosittelut 🕵️
Googlen Gemini -demoja
Geminin julkistuksen yhteydessä Google julkisti myös liudan videodemoja jossa yhtiö esittelee uuden mallinsa kyvykkyyksiä. Mielestäni vaikuttavin niistä on alla oleva demo, jossa Geminin videonymmärrys tulee vaikuttavasti esille.
Demo tuntuu olevan pieni pilkahdus tulevaisuuteen, jossa vuorovaikutamme tietokoneiden kanssa kuvilla ja puheella. Tosin suhtaudun hieman varauksella siihen, että mallin kanssa vuorovaikuttaminen olisi ihan yhtä sujuvaa kuin videolla, mutta en usko tuon tulevaisuuden olevan enää hirveän kaukana.
Google julkaisi seitsämän videon listan Geminin multimodaalisista ominaisuuksista.
Toisella, Potential of Gemini -soittolistalla esitellään mm. Geminin kyvykkyyksiä ohjelmointikilpailuissa ja yläasteen/lukion fysiikan ja matematikkan tehtävien ratkaisemisessa:
Nopeet 🚀
lol.
Myös lol. Timesin oikea vuoden henkilö oli Taylor Swift. Sam Altman taas oli Timesin vuoden toimitusjohtaja.
GTA VI:n traileri sai paljon inspiraatiota todellisuudesta.
Jenkkien talouden tuottavuus kasvoi kolmannella neljänneksellä peräti 5,1 %.
Ranskalainen Mistral neuvottelee rahoituskierroksesta, jonka pohjalta yhtiö olisi n. 2 miljardin dollarin arvoinen.
(€) Euroopan inflaatio vaikutti eniten vanhuksiin.
AWS konsultti Corey Quinnin mielipidekirjoitus siitä miten Amazonin pilvipalvelun viime viikkoinen Re:Invent -tapahtuma oli osoitus siitä, että Amazon on jäljessä kilpailijoitaan tekoälyn saralla.
Googlen toinen perustaja Sergey Brin oli mukana Gemini -tiimissä ja kuulemma koodasi projektin parissa päivittäin.