Microsoft har nylig introdusert Fara-7B, en kompakt og effektiv AI-modell designet for å automatisere datamaskinoppgaver lokalt, uten behov for skytilkobling. Med sine 7 milliarder parametere er Fara-7B en liten språkmodell (SLM) som kan utføre komplekse oppgaver direkte på brukerens enhet.
Fara-7B opererer ved å analysere skjermbilder og utføre handlinger som klikk, rulling og skriving, uten å benytte seg av tilgjengelighetstrær eller HTML-parsing. Dette gjør at modellen kan navigere i brukergrensesnitt på samme måte som et menneske ville gjort. Ved å kjøre lokalt på enheten reduseres latens, og brukerdata forblir private.
For å trene modellen benyttet Microsoft en syntetisk datapipeline kalt FaraGen, som simulerte menneskelig atferd på over 70 000 nettsider. Dette resulterte i omtrent 145 000 verifiserte oppgaveløsninger med over en million handlinger. I interne tester oppnådde Fara-7B en suksessrate på 73,5 % i WebVoyager-testen, og overgikk dermed større modeller som GPT-4o. Modellen fullfører oppgaver i gjennomsnitt på 16 trinn, sammenlignet med 41 trinn for konkurrerende modeller som UI-TARS.
Microsoft er klar over risikoene knyttet til autonome agenter og har implementert sikkerhetstiltak i Fara-7B. Modellen er trent til å stoppe ved kritiske punkter, for eksempel før sending av e-post eller gjennomføring av finansielle transaksjoner, for å innhente brukerens godkjenning. Fara-7B er tilgjengelig under MIT-lisens på Microsoft Foundry og Hugging Face, og kan kjøres lokalt på Copilot+ PC-er med Windows 11.
Med lanseringen av Fara-7B viser Microsoft sitt engasjement for å bringe kraftige AI-verktøy til brukernes enheter, og tilbyr en effektiv løsning for lokal automatisering av datamaskinoppgaver.