ByteDance käytti OpenAI:n rajapintoja oman kielimallin kouluttamiseen
The Vergen Alex Heath raportoi viikonloppuna, että TikTokin emoyhtiö ByteDance olisi käyttänyt OpenAI:n rajapintoja oman kielimallin koulutusdatan generoimiseen. Käytäntö on OpenAI:n käyttöehtoja vastaan ja yleisesti alalla paheksuttua. Uutisen seurauksena OpenAI on tiettävästi väliaikaisesti hyllyttänyt ByteDancen pääsyn yhtiön rajapintoihin.
TikTok’s entrancing “For You” feed made its parent company, ByteDance, an AI leader on the world stage. But that same company is now so behind in the generative AI race that it has been secretly using OpenAI’s technology to develop its own competing large language model, or LLM.
This practice is generally considered a faux pas in the AI world. It’s also in direct violation of OpenAI’s terms of service, which state that its model output can’t be used “to develop any artificial intelligence models that compete with our products and services.” Microsoft, which ByteDance is buying its OpenAI access through, has the same policy. Nevertheless, internal ByteDance documents shared with me confirm that the OpenAI API has been relied on to develop its foundational LLM, codenamed Project Seed, during nearly every phase of development, including for training and evaluating the model.
Teknologiayhtiöt tuovat ensi vuonna kielimalleja älylaseihin
The Information julkaisi viikonloppuna yhteenvedon siitä miten eri teknologiayhtiöt valmistautuvat tuomaan konenäkemistä hyödyntäviä kielimalleja ensi vuonna kuluttajien käyttöön. OpenAI on keskustellut mm. Snapchatin emoyhtiön Snapin kanssa mahdollisuudesta ingtegroida GPT-4:n multimodaalinen versio Snapin Spectacles -älylaseihin:
Next year’s artificial intelligence battle is coming into focus—and it’s all about glasses.
As they release more powerful AI that can understand images and language, Meta Platforms, Google, Microsoft, OpenAI and others are racing to apply the technology to smart glasses and other wearable devices with forward-facing cameras. It’s a vision many of the companies have discussed or worked on for years, but they have a new reason to think they can pull it off: the sudden rise of multimodal AI that understands drawings, charts, objects and hand gestures in addition to text and audio.
For instance, OpenAI recently discussed embedding its object recognition software, known as GPT-4 with Vision, into products from Snapchat’s parent company, according to a person familiar with the situation. That could result in new features for Snap’s Spectacles smart glasses.
Meta on ensi vuoden alussa julkaisemassa Ray-Banin kanssa tekemiin älylaseihin tuen yhtiön rakentamalle multimodaaliselle kielimallille, joka ymmärtää kuvia ja ääntä. Lisäksi Amazonin Alexa -tiimi on keskustellut uuden, multimodaalisia kielimalleja hyödyntävän laitteen julkaisemisesta:
For now, companies such as Google are trying to put these types of features into the most powerful and ubiquitous mobile devices—smartphones. But technologists at that company and many others are already thinking of how to put the tech into new types of devices. On Tuesday, Meta, which has been developing Ray-Ban smart glasses with attached cameras, showed a preview of its own multimodal AI voice assistant. It described what the wearer is looking at, suggested which pair of pants goes well with a particular shirt and translated Spanish text on a piece of paper to English. And in recent months, a team at Amazon’s Alexa AI assistant group was discussing a new AI device that also took advantage of such visual capabilities, said a person with direct knowledge.
Deloitte uudistaa työvoimaansa tekoälyn avulla
Mainitaan vielä Bloombergin uutisesta, jonka mukaan konsulttijätti Deloitte suunnittelee työntekijöidensä siirtämistä ja jatkokouluttamista generatiivisen tekoälyn avulla korkean kysynnän työtehtäviin, irtisanomisten sijaan.
Deloitte on kuluneen vuoden aikana palkannut 130 000 uutta työntekijää, mutta osaa sen työntekijöistä uhkaa irtisanomiset sen jälkeen kun konsulttijätti joutui uudelleenorganisoimaan liikeyksiköitään hidastuneen talouden seurauksena:
The giants of the consulting world face an unusual quandary this year: many of them are in the process of dismissing hundreds of staffers even after they hired thousands of college graduates to deal with new demand. Now, one of the biggest of them all is looking to artificial intelligence to change that.
Deloitte LLP is using AI to evaluate existing staffers’ skills and map out plans that would shift employees away from quieter parts of the business and into roles that are more in demand. It’s part of a broader bet by the professional services firm that the technology will allow it to moderate hiring growth over time.
The moves come after Deloitte added 130,000 staffers this year. But in the midst of those hirings, though, the firm warned thousands of staffers in the US and UK that their jobs were at risk of becoming redundant after the company was forced to restructure certain areas of the business in response to a slowdown in demand.
Ensimmäisiä kokeiluja Pikalla
Sain viikonloppuna pääsyn pari viikkoa sitten virallisesti lanseerattuun Pika -palveluun, jossa tekstisyötteistä voi tehdä videoita. Yhdestä syötteestä voi aluksi luoda kolmen sekunnin pituisen pätkän ja tätä voi sitten pidentää kolme kertaa neljän sekunnin pätkillä, joten pisimmillään palvelussa voi nyt luoda 15 sekunnin videoita.
Pyysin ChatGPT:ltä neuvoa käsikirjoituksen kanssa ja koitin luoda alla olevilla syötteillä tarinan ketusta joka huomaa perhosen ja alkaa tanssia sen kanssa:
The fox is standing in the forest looking at trees, cinematic, mystical, 32k UHD, Pixar
The fox notices a butterfly close by, cinematic, mystical, 32k UHD, Pixar
The fox starts walking towards the butterfly, cinematic, mystical, 32k UHD, Pixar
The fox starts dancing with the butterfly, cinematic, mystical, 32k UHD, Pixar
Lopullinen video ei muistuta tätä tarinaa juuri ollenkaan, joten kyseessä on todellakin hyvin alkuvaiheessa olevaa teknologiaa.
Uskottavien videoiden luonti on pakostakin monimutkaisempaa kuin pelkkien kuvien, joten en usko tämän teknologian kehittyvän ihan yhtä nopeasti kuin mitä diffuusiomallit ovat kehittyneet kuvien luonnissa viimeisen 18 kuukauden aikana.
