Bluesky on nyt kaikkien käytössä
Lisäksi: Isot kielimallit ovat kustannustehokkaita ostosopimusten tarkastajia
Huomenta! ☕
Eilinen Transistori jäi julkaisematta, sillä meillä on koko perhe kipeänä. Itse olen yskinyt niin paljon, että koko selkää sattuu.
Transistori on arkiaamuisin ilmestyvä teknologiauutisiin ja internet-kulttuuriin keskittyvä uutiskirje, jota sponsoroi ohjelmisto- ja datakonsultointipalveluja tarjoava Three Point Consulting. Klikkaa Transistori tilaukseen ja pysy kartalla teknologiamaailman tuoreimmista käänteistä!
Uutiset 🗞️
Bluesky on nyt kaikkien käytössä
Twitterille alunperin vaihtoehtona julkaistu sosiaalinen media Bluesky on nyt kaikille avoin, sillä palvelu ei vaadi enää kutsua. Samalla yhtiö kertoi, että somella on nyt kolme miljoonaa käyttäjää:
Bluesky is building an open social network where anyone can contribute, while still providing an easy-to-use experience for users. For the past year, we used invite codes to help us manage growth while we built features like moderation tooling, custom feeds, and more. Now, we’re ready for anyone to join.
…
Join more than three million people discussing news, sharing art, and just posting.
Yhtiön toimitusjohtaja Jay Graber antoi myös eilen haastattelun Washington Postille, yhtiön kasvusta ja strategiasta. Yksi Blueskyn muista sosiaalisista medioista erottava toiminnallisuus on käyttäjien mahdollisuus tilata eri algoritmisia syötteitä. Tämän lisäksi yhtiö kertoi mahdollistavan käyttäjien ja organisaatioden rakentavan omia moderointikäytäntöjä:
For instance, users can subscribe to feeds where algorithms prioritize the most popular posts overall or the posts most popular among the people they follow. There are also options for feeds geared to their specific areas of interest, such as science or art. And users can toggle personal moderation settings that either “hide,” “warn” or “show” categories of content such as nudity, violence, spam and hate-group iconography.
Along with today’s public launch of Bluesky, the company said it will roll out in the coming weeks a step toward its broader vision, inviting some outside developers to host servers that plug in to the main Bluesky network. It also announced a new feature that will let users and organizations begin to develop their own content moderation services, which other users can then subscribe to. For instance, a fact-checking organization could apply “false” or “misleading” labels to certain posts, which would then be seen by users who opt in to seeing them.
Yhtiö julkaisi eilen myös teknisen raportin omasta hajautetusta AT -protokollasta.
Oslon kaupunki osti opiskelijoilleen pääsyn ChatGPT:hen
Oslon kaupungin opetustoimi on ostanut pääsyn kaikille sen 110 000 opiskelijalle OpenAI:n ChatGPT -palveluun. Oslon kaupungin ostama lisenssi mahdollista GPT-3.5 -pohjaisen ChatGPT:een käytön, eikä oppilaiden keskusteluja käytetä tulevien tekoälymallien kouluttamiseen.
Opetustoimessa ollaan myös huolissaan siitä, että jotki oppilaat voivat ostaa käyttöönsä GPT-4:n, mikä on kyvykkyyksiltään selkeästi 3.5:ttä parempi. Digi.no:n artikkelista, minkä vedin Google Translaten läpi:
Oslo School uses GPT 3.5-Turbo in the capital and pays a license for 110,000 pupils and staff.
The solution delivered is secured in terms of privacy and should not be used for training new AI models, writes Aftenposten.
…
The fact that students only have access to GPT 3.5-Turbo can create a class divide, believes Anne Kristin Furuset in the Education Association.
She thinks it is problematic that some students have paid for access to GPT-4 because it is a much better version than the one offered by the municipality.
Asiasta keskusteltiin myös Hacker Newsissä.
Amerikkalaiset mediajätit julkaisevat uuden urheilusovelluksen
Mainitaan vielä, että isot amerikkalaiset mediayhtiöt ESPN (Disney), Fox ja Warner Bros. Discovery ovat lanseeraamassa syksyllä uuden urheilun suoratoistoon keskittyvän sovelluksen. Sovelluksessa tullaan näyttämään sisältöä kaikista suurista urheiluliigoista, eikä sen nimi ole vielä tiedossa. Wall Street Journalilta (WSJ):
ESPN, Fox Corp. and Warner Bros. Discovery are teaming up to create a supersize sports-streaming service that will offer content from all major leagues, a deal that will reshape the sports and media landscape.
The as-yet-unnamed service will be offered directly to consumers, who would be able to stream all of these companies’ sports content, the companies said in a statement, following a report in The Wall Street Journal about the new venture.
Each of the companies will have one-third ownership of the new service, which is expected to launch in the fall. The companies didn’t announce pricing.
Suosittelut 🕵️
Isot kielimallit ovat kustannustehokkaita ostosopimusten tarkastajia
Lakidokumenttien analyysiä tekevä Onit Inc. julkaisi hiljattain Arxivissa tutkimuksen, jossa verrattiin isojen kielimallien kustannustehokkuutta yritysten ostosopimusten tarkastamisessa uransa alkuvaiheessa oleviin asianajajiin ja niin sanottuihin ulkoistettuihin lakipalveluihin (Legal Process Outsourcing eli LPO).
Tutkimuksessa pyydettiin kokeneita juristeja arvioimaan jokaisen kohortin tarkastuksia kymmeneen eri ostosopimukseen. Laadullisesti tarkimpia (korkein F-Score -arvo) tarkastuksia tekivät LPO:t, mutta vain hieman parempia kuin isot kielimallit. Molemmat myös peittosivat juniori asianajat:
Mielenkiintoisesti GPT-4:n uusin version (GPT4-1106) pärjäsi paremmin kun tehtävänä oli määrittää sopimuksista löytyviä oikeudellisia ongelmia, mutta alkuperäinen GPT-4 (jonka kontekstiraja oli 32 000 tokenia) oli parempi kun itse sopimuksesta piti paikantaa oikeudelliset ongelmat:
The proficiency in pinpointing legal issues within contracts presented a different competitive scenario. Here, LPOs took the lead with an F-score of 0.77, edging out the top-performing LLM in this metric, GPT4-32k, which achieved a F-score of 0.74. Notably, GPT4-1106, while excelling in issue determination, fell short in localization accuracy, achieving an F-score of 0.69. This divergence underscores the distinct competencies and limitations that are specific to each LLM
Kustannustehokkuus oli kuitenkin selvästi kielimallien puolella, sillä LPO:illa meni yhden dokumentin tarkastamiseen peräti 201 minuuttia ja junioriasianjajillakin 45 minuuttia, kun GPT-4 suoriutui tehtävästä enintään 4,7 minuutissa:
Tämä yhdistettynä LPO:iden ja asianajajien tuntihintoihin, maksoi yhden dokumentin tarkastaminen ihmiseltä 36,85 dollarin ja 75,92 dollarin välillä. GPT-4:llä dokumentin tarkastaminen maksoi korkeimmillaan 1,24 dollaria, joten ihmiset ovat näissä tehtävissä ainakin 30 kertaa kalliimpia kuin kielimallit, laatuerojen ollessa hyvin pieniä:
Implikaatioissa tutkijat nostavat esille mm. sen miten juniori asianajajien työnkuvat tulevat todennäköisesti muuttumaan niin, että kysyntä nykyisen kaltaisia rooleja kohtaan tulee laskemaan, ja että tulevaisuudessa uransa alkuvaiheessa olevat asianajajat tulevat tekemään entistä monimutkaisempia ja enemmän arvoa tuottavia työtehtäviä:
We anticipate that Junior Lawyers will also encounter disruption, though the nature of these disruptions will differ. While our research does not explore a broad enough spectrum of the capabilities performed by Junior Lawyers to establish a one to one comparison, it does indicate that LLMs are already outperforming Junior Lawyers in specific areas. We believe the partial adoption of LLMs will begin to reduce the demand for entry-level legal positions, as they are currently defined, over time. In contrast, established Junior Lawyers will engage in more complex, high-value work earlier in their careers, as routine tasks are gradually transitioned to LLMs
Nopeet 🚀
Tencent tekee Elden Ringistä mobiilipeliä Reutersin mukaan.
Substack testailee mainoskyvykkyyttä.
SQL -tutoriaali data scientisteille.
Teräksen valmistamisesta hiilineutraalisti.
OpenAI lisää “vesimerkkejä” DALL-E:lla luotuihin kuviin.
Ben Thompson pettyi Apple Vision Pron käyttöön työn teossa.
(€) Spotifyn osavuosikatsaus ylitti odotukset ja osake nousi melkein 4 % eilen pörssissä.