Google esitteli uudet Pixel -puhelimet syksyn laitetapahtumassaan
Lisäksi: Viitteitä kielimallien kyvystä rakentaa malleja maailmasta
Huomenta! ☕
Transistori on arkiaamuisin ilmestyvä teknologiauutisiin ja internet-kulttuuriin keskittyvä uutiskirje, jota sponsoroi ohjelmisto- ja datakonsultointipalveluja tarjoava Three Point Consulting. Klikkaa Transistori tilaukseen ja pysy kartalla teknologiamaailman tuoreimmista käänteistä!
Uutiset 🗞️
Google esitteli uudet Pixel -puhelimet syksyn laitetapahtumassaan
Googlen syksyn laitetapahtuma Made By Google järjestettiin eilen, missä yhtiö esitteli uusimmat Pixel -puhelimet, uuden Pixel Watch -älykellon, Pixel Buds -kuulokkeet ja liudan laitteita tukevia tekoälypäivityksiä:
Pixel 8 ja Pixel 8 Pro: Uudet Pixelit julkaistaan Yhdysvalloissa lokakuun 10. Lähtöhinta Pixel 8:ssa on 699 dollaria kun taas Pixel 8 Prossa se on 999 dollaria. Puhelimissa on Googlen oma G3 -prosessori, joka mahdollistaa mm. generatiivisen tekoälyn hyödyntämisen paikallisesti. Yksi esimerkki tästä on Google Photosin uusi ominaisuus, jolla omia kuvia voi muokata (ilmeisesti) diffuusiomallia käyttäen. Mielenkiintoinen käytännön lisä puhelimiin on se, että Google lupaa nyt 7 vuoden ajan turvallisuus päivityksiä niihin. Valitettavasti vaikuttaa taas siltä, että näitäkään Pixel puhelimia ei virallisesti Suomessa tulla näkemään.
Pixel Watch 2: Pixel Watch 2 julkaistaan myös 10. lokakuuta, mutta se tulee saataville 30:een maahan. Laitteen lähtöhinta on 349 dollaria. Uudessa älykellossa on uusittu prosessorit ja laite kykenee entistä tarkempiin kehonmittauksiin, mutta Google korosti eritoten Pixeli Watchin nopeaa latautumista ja tehokasta akkua.
Pixel Buds Pro: Googlen Pixel -kuulokkeet, Pixel Buds Prot saivat myös päivityksen. Niiden tarkkaa ilmestymisajankohtaa en löytänyt, mutta hintaa niillä on 199 dollaria. Kuulokkeissa tekoäly osaa arvioida koska niiden käyttäjä puhuu, ja pystyy sen perusteella mm. hiljentamaan kuulokkeet.
Meta tuo generatiivista tekoälyä mainostajiensa tueksi
Meta ilmoitti eilen tuovansa generatiivista tekoälyä hyödyntäviä työkaluja alustojensa mainostajien tueksi. Metan Ads Manager -palvelussa voi luoda mainostajan tuotteille nyt tekoälyllä taustakuvia, mainoskuvia voi muokata ja laajentaa tekoälyä hyödyntämällä ja lisäksi mainosten leipätekstejä voi generoida ja muokata tekoälyn avulla. Metalta:
Today, we’re announcing that we’ve begun rolling out our first generative AI-powered features for ad creatives in Meta’s Ads Manager, with global rollout complete by next year. These unlock a new era of creativity that maximizes the productivity, personalization and performance for all advertisers. The new features – Background Generation, Image Expansion, and Text Variations – will add to the AI-powered experiences and tools we continue to build for businesses.
Background Generation: Creates multiple backgrounds to complement the advertiser’s product images, allowing advertisers to tailor their creative assets for different audiences.
Image Expansion: Seamlessly adjusts creative assets to fit different aspect ratios across multiple surfaces, like Feed or Reels, allowing advertisers to spend less time and resources on repurposing creative assets.
Text Variations: Generates multiple versions of ad texts based on advertiser’s original copy, highlighting the selling points of their products/services and giving
Metan generatiivista tekoälyä hyödyntävistä tarroista saa ongelmallisia
Jatketaan vielä Metan ja generatiivisen tekoälyn kanssa. Yhtiö lanseerasi (rajoitetusti) viime viikolla Instagramissa ja Messengerissä uuden tarrapalvelun missä erilaisia digitaalisia tarroja on mahdollista luoda tekstisyötteillä. Twitter-käyttäjä @Pioldes julkaisi esimerkkejä siitä, miten syötteiden filtteröinti vaikuttaa toistaiseksi olevan yllättävän löyhää ja palvelussa on mahdollista tehdä mm. tekijänoikeuksia rikkovia tai irstaita tarroja:
Oletan syötteiden sensuroinnin muuttuvan merkittävästi aggressiivisemmaksi tämän jälkeen.
Suosittelut 🕵️
Viitteitä kielimallien kyvystä rakentaa malleja maailmasta
Ruotsalais-Amerikkalainen MIT:een fysiikan professori Max Tegermark1 ja tämän yhteistyökumppani Wes Gurnee julkaisivat eilen Arxiviin mielenkiintoisen paperin, jossa kaksikko tutki onko isoilla kielimalleilla kyky ymmärtää maantieteellisia sijainteja tai aikaan liittyviä tapahtumia.
Kaksikko tutki Llama-2 -mallia, ja huomasivat mallin rakentavan paikkoihin liittyen lineaarisen esityksen maailman kartasta:
The capabilities of large language models (LLMs) have sparked debate over whether such systems just learn an enormous collection of superficial statistics or a coherent model of the data generating process—a world model. We find evidence for the latter by analyzing the learned representations of three spatial datasets (world, US, NYC places) and three temporal datasets (historical figures, artworks, news headlines) in the Llama-2 family of models. We discover that LLMs learn linear representations of space and time across multiple scales. These representations are robust to prompting variations and unified across different entity types (e.g. cities and landmarks). In addition, we identify individual “space neurons” and “time neurons” that reliably encode spatial and temporal coordinates. Our analysis demonstrates that modern LLMs acquire structured knowledge about fundamental dimensions such as space and time, supporting the view that they learn not merely superficial statistics, but literal world models.
Gurnee avasi tuloksia myös Twitterissä. Jos nyt oikein ymmärsin Tegermark ja Gurnee antoivat kielimallille joukon paikannimiä ja tutkivat miten mallin eri kerrokset aktivoituivat nimien perusteella ja kouluttivat “lineaarisia koettimia”2 jotka onnistuivat antamaan paikkaa vastaavat pituus- ja leveyskoordinaatit suhteellisen tarkasti esimerkiksi Yhdysvaltojen kartalla.
Sama toistettiin mm. kuuluisuuksien nimillä, joiden pohjalta koettimet ennustivat henkilön kuolin vuoden:
Kerrassaan siistiä! Vaikkakin tutkimusta ei ole vielä vertaisarvioitu. Tällaista tutkimusta olisi kuitenkin huomattavasti vaikeampi tehdä ellei Metan kaltaiset toimijat julkaisisi tehokkaita isoja kielimalleja avoimesti. Tutkimukseen liittyvän koodin löytää myös Githubista ja aiheesta keskusteltiin myös Hacker Newsissä.
Nopeet 🚀
The Spheren Halloween -ilme on aika vaikuttava.
Godotilla tehty klassinen videopokeri.
Patreonilla on uusi ilme.
Yahoo spin-offaa OSS-tietokantaprojekti Vespan omaksi yrityksekseen.
Miten balttian maista tuli suojapaikka kryptotaloudelle.
lol.
(€) Uber palauttaa verkkokauppaostoksia ja muita paketteja pian puolestasi.
(€) WSJ:n analyysiä siitä miten Ozempic vaikuttaa ruokajättien kuten Pepsi Corpin liiketoimintaan.
Tegermark on tosin tutkinut paljon myös tekoälyä