Huomenta! ☕
Transistori on (keskimäärin) neljänä arkiaamuna viikossa ilmestyvä teknologiauutisiin ja internet-kulttuuriin keskittyvä uutiskirje, jota kirjoittaa data-ammattilaisena toimiva Robert Siipola harrastuksenaan. Klikkaa Transistori tilaukseen ja pysy kartalla teknologiamaailman tuoreimmista käänteistä!
Uutiset 🗞️
Anthropicin Claude sai joukon päivityksiä
Anthropic esitteli eilen uuden pienen mallin nimeltä Claude 3.5 Haiku, päivitetyn version Claude 3.5 Sonnetista ja uuden Computer Use -ominaisuuden, jonka myötä Claude mallit kykenevät käyttämään tietokoneita. Anthropicin mukaan uusi versio Sonnetista pärjää ohjelmointikykyä mittaavissa vertailuarvioissa paremmin kuin OpenAI:n o1 -malli.
Today, we’re announcing an upgraded Claude 3.5 Sonnet, and a new model, Claude 3.5 Haiku. The upgraded Claude 3.5 Sonnet delivers across-the-board improvements over its predecessor, with particularly significant gains in coding—an area where it already led the field. Claude 3.5 Haiku matches the performance of Claude 3 Opus, our prior largest model, on many evaluations for the same cost and similar speed to the previous generation of Haiku.
We’re also introducing a groundbreaking new capability in public beta: computer use. Available today on the API, developers can direct Claude to use computers the way people do—by looking at a screen, moving a cursor, clicking buttons, and typing text. Claude 3.5 Sonnet is the first frontier AI model to offer computer use in public beta. At this stage, it is still experimental—at times cumbersome and error-prone. We're releasing computer use early for feedback from developers, and expect the capability to improve rapidly over time.
The updated Claude 3.5 Sonnet shows wide-ranging improvements on industry benchmarks, with particularly strong gains in agentic coding and tool use tasks. On coding, it improves performance on SWE-bench Verified from 33.4% to 49.0%, scoring higher than all publicly available models—including reasoning models like OpenAI o1-preview and specialized systems designed for agentic coding. It also improves performance on TAU-bench, an agentic tool use task, from 62.6% to 69.2% in the retail domain, and from 36.0% to 46.0% in the more challenging airline domain. The new Claude 3.5 Sonnet offers these advancements at the same price and speed as its predecessor.
Testailin mallia eilen illalla ja siitä jäänyt mututuntuma oli hyvä. Mallin vastaukset olivat o1:n tasoa, mutta se oli huomattavasti nopeampi.
Runway julkaisi liikkeenkaappaustyökalu Act-Onen
Videomalleja rakentava RunwayML taas julkaisi eilen Act-One -nimisen työkalun, jonka avulla on mahdollista luoda kasvojenliikkeenkaappauksella ilmeikkäitä animaatioita erilaisista hahmoista.
At Runway, our mission is to build expressive and controllable tools for artists that can open new avenues for creative expression. Today, we're excited to release Act-One, a new state-of-the-art tool for generating expressive character performances inside Gen-3 Alpha.
Act-One can create compelling animations using video and voice performances as inputs. It represents a significant step forward in using generative models for expressive live action and animated content.
Act-One can be applied to a wide variety of reference images. The model preserves realistic facial expressions and accurately translates performances into characters with proportions different from the original source video. This versatility opens up new possibilities for inventive character design and animation.
Arm ja Qualcomm tukkanuottasilla
Käskykantakehittäjä Arm on peruuttanut prosessorivalmistaja Qualcommin arkkitehtuurilisenssisopimuksen, mikä kärjistää yhtiöiden välistä oikeuskiistaa. Tämä lisenssi salli Qualcommin suunnitella omia siruja Armin käskykantaa hyödyntäen.
Kiista alkoi vuonna 2022, kun Arm haastoi Qualcommin oikeuteen sopimusrikkomuksesta ja tavaramerkkiloukkauksesta Qualcommin ostettua entisten prosessoreita suunnittelevan Nuvian. Arm vaatii, että Qualcomm tuhoaa Nuvian ennen yrityskauppaa kehittämät suunnitelmat. Konflikti uhkaa häiritä älypuhelin- ja PC-markkinoita, sillä Qualcommin prosessoreita käytetään alalla laajasti. Bloombergilta:
Arm Holdings Plc is canceling a license that allowed longtime partner Qualcomm Inc. to use Arm intellectual property to design chips, escalating a legal dispute over vital smartphone technology.
Arm, based in the UK, has given Qualcomm a mandated 60-day notice of the cancellation of their so-called architectural license agreement, according to a document seen by Bloomberg. The contract allows Qualcomm to create its own chips based on standards owned by Arm.
The showdown threatens to roil the smartphone and personal computer markets, as well as disrupting the finances and operations of two of the most influential companies in the semiconductor industry.
The two are headed to a trial to resolve the breach-of-contract claim by Arm and a countersuit by Qualcomm. The disagreement centers on Qualcomm’s 2021 acquisition of another Arm licensee and a failure — according to Arm — to renegotiate contract terms. Qualcomm argues that its existing agreement covers the activities of the company that it purchased, the chip-design startup Nuvia.
Suosittelut 🕵️
Videoita Clauden tietokoneenkäytöstä
Ohessa videoita Anthropicin Claude uudesta Computer Use -ominaisuudesta, joissa näkee miten Claude kykenee ohjaamaan tietokonetta ja käyttämään mm. verkkoselainta ja koodieditoria. Anthropic huomauttaa, että työkalu ei missään nimessä ole täydellinen ja että eräässä tapauksessa Claude unohti sille annetun tehtävän ja meni sen sijaan katselemaan googlesta kuvia Yellowstonen kansanpuistosta:
Even while we were recording demonstrations of computer use for today’s launch, we encountered some amusing errors. In one, Claude accidentally clicked to stop a long-running screen recording, causing all footage to be lost. In another, Claude suddenly took a break from our coding demo and began to peruse photos of Yellowstone National Park.
Yleisemmän esittelyvideon työkalusta voi katsoa täältä ja esimerkin työkalun suunnittelukyvykkyydestä voi nähdä täällä. Anthropic julkaisi myös työkalun käytölle oman esimerkkirepon Githubiin.
Nopeet 🚀
Klarnan entiset työntekijät perustavat ahkerasti omia firmojaan.
OpenAI ja Microsoft tukevat paikallisuutisia Yhdysvalloissa.
(€) Wall Streetillä valmistaudutaan Trumpin voittoon.
Kattava blogikirjoitus normaalijakaumasta.
Clickhouse tukee JSON:ia.
Larry Summers haastattelu, jossa tämä keskustelee mm. tekoälyn vaikutuksista tuottavuuskasvuun.