Perplexity AI har nylig avduket det de kaller verdens første "hybride lokale/server agentiske inferensorkestrator" under Computex 2026 i Taipei. Dette systemet fordeler AI-oppgaver dynamisk mellom personlige datamaskiner og skyservere i sanntid, noe som forbedrer både effektivitet og personvern.
Administrerende direktør Aravind Srinivas presenterte plattformen sammen med Intels CEO Lip-Bu Tan under Intels hovedpresentasjon. Srinivas beskrev programvaren som en "flygeleder for AI-oppgaver" som vurderer hver forespørsel og bestemmer om den kan håndteres lokalt av PC-ens prosessor eller om den krever kraftigere maskinvare i skyen. Enkle operasjoner som tekstsummering eller lett klassifisering kjøres lokalt, mens mer komplekse oppgaver som krever flerstegsresonnering eller avansert generering sendes til datasenterets servere.
Denne beslutningsprosessen er usynlig for brukeren og skjer i sanntid, med balanse mellom personvern, kostnad og ytelse. Ifølge Intel er tilnærmingen drevet av "bekymringer som personvern, sikkerhet, samsvar og kostnad" som presser industrien mot hybride beregningsmodeller.
Srinivas understreket at plattformen er "chip-agnostisk" og fungerer med både Intel- og Nvidia RTX-prosessorer. "Akkurat som vi har vært modellagnostiske, planlegger vi å være chip-agnostiske her," sa Srinivas til Bloomberg Technology. Partnerskapet med Intel var kjøretøyet for kunngjøringen, men Perplexity posisjonerer seg som et programvarelag som ligger over enhver maskinvareleverandør.
Den praktiske effekten er at Perplexity kan betjene flere brukere til lavere kostnad ved å overføre en del av inferensarbeidet til de milliarder av PC-er som allerede er i omløp. Selskapets inntekter har nådd 500 millioner dollar ettersom etterspørselen etter AI-inferens fortsetter å belaste sentraliserte skyinfrastrukturer.
Denne kunngjøringen passer inn i en bredere bevegelse under Computex 2026 mot å distribuere AI-beregninger utover tradisjonelle datasentre. Intel brukte samme hovedpresentasjon til å avduke sine Xeon 6+-prosessorer og kunngjøre partnerskap for AI-infrastruktur med Foxconn og SambaNova. Bransjeforskning som ble sitert under presentasjonen, forutsier at AI-inferensarbeidsbelastninger vil stå for nesten 40 prosent av all datasenterets strømforbruk innen 2030, med agentisk AI som forbruker opptil 1 000 ganger flere tokens enn enkeltstegsresonnering.