Kai privačių įmonių įsipareigojimų nevykdymas siekia daugiau nei 9,2 % (didžiausias rodiklis per metus), rizikos kapitalo įmonė „Lux Capital“ neseniai patarė įmonėms, kurios remiasi dirbtiniu intelektu, kad jų skaičiavimo pajėgumų įsipareigojimai būtų patvirtinti raštu. Luxas perspėjo, kad dirbtinio intelekto tiekimo grandinėje plinta finansinis nestabilumas, susitarimo rankos paspaudimu neužtenka.
Tačiau yra ir kita galimybė – visiškai nustoti pasikliauti išorine skaičiavimo infrastruktūra. Mažesni dirbtinio intelekto modeliai, kurie veikia tiesiogiai paties vartotojo įrenginyje – nėra duomenų centro, debesijos paslaugų teikėjo, jokios sandorio šalies rizikos – tampa pakankamai geri, kad būtų verta apsvarstyti. Ir Multiverse Computing kelia ranką.
Ispanijos startuolis iki šiol išlaikė žemesnį profilį nei kai kurie jo kolegos, tačiau augant AI efektyvumo paklausai, tai keičiasi. Suglaudinusi modelius iš pagrindinių AI laboratorijų, įskaitant „OpenAI“, „Meta“, „DeepSeek“ ir „Mistral AI“, ji pristatė ir programą, kuri demonstruoja suspaustų modelių galimybes, ir API portalą – šliuzą, leidžiantį kūrėjams pasiekti šiuos modelius ir juos kurti, todėl jie tampa plačiau prieinami.
CompactifAI programa, kurios pavadinimas dalijasi su Multiverse kvantinio įkvėpimo glaudinimo technologija, yra AI pokalbių įrankis, panašus į ChatGPT arba Mistral Le Chat. Užduokite klausimą, o modelis atsakys. Pasak bendrovės, skirtumas yra tas, kad „Multiverse“ įtaisė „Gilda“ – tokį mažą modelį, kad jis gali veikti vietoje ir neprisijungus.
Galutiniams vartotojams tai yra DI skonis ant krašto, su duomenimis, kurie nepalieka jų įrenginių ir nereikalauja ryšio. Tačiau yra įspėjimas: jų mobiliuosiuose įrenginiuose turi būti pakankamai RAM ir atminties. Jei jie to nepadarys (ir daugelis senesnių „iPhone“ to nedarys), programa per API persijungia į debesies pagrindu veikiančius modelius. Maršrutą tarp vietinio ir debesies apdorojimo automatiškai tvarko sistema „Multiverse“, kurią pavadino Ash Nazg, kurios vardas skambės Tolkieno gerbėjams, nes nurodo „Žiedų valdovo“ užrašą „One Ring“. Tačiau kai programa nukreipiama į debesį, proceso metu ji praranda pagrindinį privatumo pranašumą.
Šie apribojimai reiškia, kad CompactifAI dar nėra visiškai pasirengęs masiniam klientų pritaikymui, nors to niekada ir nebuvo siekiama. Remiantis „Sensor Tower“ duomenimis, per pastarąjį mėnesį programa buvo atsisiųsta mažiau nei 5000 kartų.
Tikrasis tikslas yra verslas. Šiandien Multiverse pristato savitarnos API portalą, suteikiantį kūrėjams ir įmonėms tiesioginę prieigą prie suspaustų modelių – nereikia AWS Marketplace.
Techcrunch renginys
San Franciskas, Kalifornija
|
2026 m. spalio 13-15 d
„CompacifAI API portalas (dabar) suteikia kūrėjams tiesioginę prieigą prie suglaudintų modelių su skaidrumu ir valdymu, kurio reikia norint juos paleisti gamyboje“, – pranešime teigė generalinis direktorius Enrique Lizaso.
Naudojimo stebėjimas realiuoju laiku yra viena iš pagrindinių API funkcijų, ir tai neatsitiktinai. Be galimų diegimo pranašumų, mažesnės skaičiavimo sąnaudos yra viena iš pagrindinių priežasčių, kodėl įmonės svarsto mažesnius modelius kaip alternatyvą didelių kalbų modeliams (LLM).
Taip pat padeda tai, kad maži modeliai yra mažiau riboti nei anksčiau. Anksčiau šią savaitę „Mistral“ atnaujino savo nedidelę modelių šeimą išleisdama „Mistral Small 4“, kuri, kaip teigiama, vienu metu yra optimizuota bendriems pokalbiams, kodavimui, agentų užduotims ir samprotavimams. Prancūzų kompanija taip pat išleido „Forge“ – sistemą, leidžiančią įmonėms kurti pasirinktinius modelius, įskaitant mažus modelius, dėl kurių jos gali pasirinkti kompromisus, kuriuos jų naudojimo atvejai gali geriausiai toleruoti.
Naujausi „Multiverse“ rezultatai taip pat rodo, kad atotrūkis nuo LLM mažėja. Naujausias suglaudintas modelis HyperNova 60B 2602 sukurtas remiantis gpt-oss-120b – OpenAI modeliu, kurio pagrindinis kodas yra viešai prieinamas. Bendrovė teigia, kad dabar ji teikia greitesnius atsakymus už mažesnę kainą nei buvo gautas originalas, o tai ypač svarbu agentinio kodavimo darbo eigoms, kai AI savarankiškai atlieka sudėtingas kelių etapų programavimo užduotis.
Padaryti modelius pakankamai mažus, kad jie veiktų mobiliuosiuose įrenginiuose, tačiau išliktų naudingi, yra didelis iššūkis. „Apple Intelligence“ išvengė šios problemos, sujungdama įrenginyje esantį modelį ir debesies modelį. „Multiverse“ CompactifAI programa taip pat gali nukreipti užklausas į gpt-oss-120b per API, tačiau pagrindinis jos tikslas yra parodyti, kad vietiniai modeliai, tokie kaip „Gilda“ ir būsimi jo pakaitalai, turi pranašumų, kurie neapsiriboja išlaidų taupymu.
Kritinių sričių darbuotojams modelis, kuris gali veikti vietoje ir neprisijungus prie debesies, suteikia daugiau privatumo ir atsparumo. Tačiau didesnė vertė yra verslo naudojimo atvejais, kai tai gali atrakinti, pavyzdžiui, įterpiant AI į dronus, palydovus ir kitus nustatymus, kur ryšys negali būti laikomas savaime suprantamu dalyku.
Bendrovė jau aptarnauja daugiau nei 100 klientų visame pasaulyje, įskaitant Kanados banką, Bosch ir Iberdrola, tačiau išplėtusi savo klientų bazę galėtų padėti gauti daugiau lėšų. Praėjusiais metais surinkus 215 milijonų JAV dolerių B seriją, dabar sklando gandai, kad bus surinktas naujas 500 milijonų eurų finansavimo etapas, kurio vertė viršija 1,5 milijardo eurų.