Meta suunnittelee luovan tekoälyn kaupallistamista loppuvuodesta
Lisäksi: SegmentAnything mahdollistaa kaiken segmentoinnin

Uutiset 🗞️
Meta suunnittelee luovan tekoälyn kaupallistamista loppu vuonna
Metan CTO Andrew Bosworth kertoi Nikkei Asialle yhtiön suunnitelmista kaupallistaa Metan kehittämiä luovan tekoälyn tuotteita vuoden loppuun mennessä. Bosworth kertoi mm. mahdollisuudesta luoda automaattisesti kuvia asiakkaiden mainoskampanjoihin ja näin parantaa kampanjoiden osuvuutta. Hän myös kertoi koko Metan ylimmän johdon käyttävän tällä hetkellä eniten aikaa luovan tekoälyn parissa.
Facebook owner Meta intends to commercialize its proprietary generative artificial intelligence by December, joining Google in finding practical applications for the tech.
"[I] expect we'll start seeing some of them [commercialization of the tech] this year. We just created a new team, the generative AI team, a couple of months ago; they are very busy. It's probably the area that I'm spending the most time [in], as well as Mark Zuckerberg and [Chief Product Officer] Chris Cox."
Bosworth believes Meta's artificial intelligence can improve an ad's effectiveness partly by telling the advertiser what tools to use in making it.
He said that instead of a company using a single image in an advertising campaign, it can "ask the AI, 'Make images for my company that work for different audiences.' And it can save a lot of time and money."
Sony suunnittelee uutta käsikonsolia
Insider Gaming raportoi kuluttajaelektroniikkajätti Sonyn suunnittelevan uutta käsikonsolia PlayStation (PS) -tuoteperheeseen. Laitteen koodinimi on Q Lite ja se tulee olemaan enemmänkin kumppani PS5:lle, kuin itsenäinen pelikonsoli, sillä Q Lite vaatii jatkuvan yhteyden PS5:een ja sillä pelataan PS5:en pelejä Remote Play -toiminnallisuuden avulla.
Laite muistuttaa PS5 ohjainta jossa on kahdeksan tuuman näyttö keskellä kiinni. Tarkkaa julkaisuajankohtaa laitteelle ei ole tiedossa, mutta Insider Gamingin mukaan Sony suunnittelee tehokkaamman PS5 Pron julkaisua vuoden 2024 loppussa ja yhtiö haluaa julkaista käsikonsolin ennen sitä.
Codenamed the Q Lite, the next PlayStation handheld is the next piece of Sony hardware that aims to be yet another piece of hardware that requires the PlayStation 5. Insider Gaming understands that the Q Lite is not a cloud-streaming device, but instead uses Remote Play with the PlayStation 5 – A feature the console giant has been pushing these past couple of weeks.
Sporting adaptive streaming up to 1080p and 60FPS, the new device will require constant connectivity to the internet.
As for the console’s physical features, early prototypes show the console will look a lot like a PlayStation 5 controller, but with a massive 8-inch LCD touchscreen in the center. The device sports adaptive triggers for haptic feedback and will include what you would come to expect from a handheld – Volume buttons, speakers, an audio input jack, etc.
Substack julkisti Twitter-kilpailijan
Mainitaan vielä, että uutiskirjepalvelu Substack1 on julkaisemassa uuden Notes -tuotteen, joka mahdollistaa alustalla Twitter-tyylisen microblogaamisen:
In the coming days, we will start rolling out a way for writing, ideas, and discussion to travel through the Substack network. We’re calling this new product Notes.
In Notes, writers will be able to post short-form content and share ideas with each other and their readers. Like our Recommendations feature, Notes is designed to drive discovery across Substack. But while Recommendations lets writers promote publications, Notes will give them the ability to recommend almost anything—including posts, quotes, comments, images, and links. Our goal is to foster conversations that inspire, enlighten, and entertain, while giving writers a powerful growth channel as these interactions find new audiences.
Suosittelut 🕵️
SegmentAnything mahdollistaa kaiken segmentoinnin
Lupailin eilen että kirjoittaisin tänään esimerkeistä kielimallien integroinnista muihin järjestelmiin ja eritoten LangChain -demoista, mutta Meta julkaisi eilen SegmentAnything -nimisen konenäkemismallin joka on niin hieno läpimurto, että palataan LangChainiin ensi viikolla.
SegmentAnything mahdollistaa valokuvien segmentoinnin ja tarkkojen, automaattisten rajausten tekemisen. Yksi mallin hämmentävimmistä ominaisuuksista on, että sille voi antaa kuvan lisäksi syötteenä sanan ja se yrittää tunnistaa sanat vastaavat asiat kuvasta.
Lisäksi malli sekä sen rakentamiseen käytetty data julkaistiin avoimen lähdekoodin Apache 2.0 lisenssin alla. Metan julkaisemalla demosivustolla voi testailla mallia omilla kuvilla. Syötin itse tämän kuvan Midjourney-kokeiluilla, kun yritin luoda uutiskirjeeseen Applen älylaseista kansikuvaa:
Kun syötän kuvan Segment Anythingille, voin pyytää sitä segmentoimaan (eli tunnistamaan yksittäisiä asioita esineitä) kuvasta. Alla olevassa kuvassa on segmetoitu kaikki mallin tunnistamat esineet alkuperäisestä kuvasta:
Lisäksi voin leikata segmentit erillisiksi kuviksi, ilman että teen manuaalisesti mitään. Kuten vaikka kuvan omenat:
Sovelluskohteita tällä on varmasti useita, mutta Meta lienee kehittänyt tätä omiin AR-projekteihinsa. Metalta:
Segmentation — identifying which image pixels belong to an object — is a core task in computer vision and is used in a broad array of applications, from analyzing scientific imagery to editing photos. But creating an accurate segmentation model for specific tasks typically requires highly specialized work by technical experts with access to AI training infrastructure and large volumes of carefully annotated in-domain data.
Today, we aim to democratize segmentation by introducing the Segment Anything project: a new task, dataset, and model for image segmentation, as we explain in our research paper. We are releasing both our general Segment Anything Model (SAM) and our Segment Anything 1-Billion mask dataset (SA-1B), the largest ever segmentation dataset, to enable a broad set of applications and foster further research into foundation models for computer vision. We are making the SA-1B dataset available for research purposes and the Segment Anything Model is available under a permissive open license (Apache 2.0). Check out the demo to try SAM with your own images.
Reducing the need for task-specific modeling expertise, training compute, and custom data annotation for image segmentation is at the core of the Segment Anything project. To realize this vision, our goal was to build a foundation model for image segmentation: a promptable model that is trained on diverse data and that can adapt to specific tasks, analogous to how prompting is used in natural language processing models. However, the segmentation data needed to train such a model is not readily available online or elsewhere, unlike images, videos, and text, which are abundant on the internet. Thus, with Segment Anything, we set out to simultaneously develop a general, promptable segmentation model and use it to create a segmentation dataset of unprecedented scale.
