Google käivitab Gemma 4, mis on ettevõtte suur panus avatud ja kohalikule tehisintellektile

  • Gemma 4 on neljast avatud tehisintellekti mudelist koosnev Gemini 3 tehnoloogial põhinev perekond, mille suurused ulatuvad E2B-st kuni 31B parameetriteni.
  • Mudelid ühendavad kõrge "parameetrite intelligentsuse" kohaliku teostuse mobiil-, serva- ja patenteeritud infrastruktuurides tänu kuni 256 000 tokeni kontekstiakendele.
  • Apache 2.0 litsents lubab piiramatut ärilist kasutamist, tugevdab digitaalset suveräänsust ja hõlbustab juurutamist reguleeritud keskkondades Euroopas.
  • Gemma 4 on multimodaalne (tekst, pilt, video ja heli väikestes mudelites), toetab enam kui 140 keelt ning on saadaval Google AI Studios, Hugging Faces, Kaggles ja Ollamas.

Gemma 4 tehisintellekti mudel

Google on oma strateegias astunud olulise sammu, et avatud tehisintellekt Gemma 4 turuletoomisega on uus mudeliperekond, mille eesmärk on ühendada kõrgetasemeline arutluskäik palju tagasihoidlikumate riistvaranõuetega. Ettevõte esitleb seda põlvkonda tõsise alternatiivina neile, kes peavad oma infrastruktuuril, alates mobiilseadmetest kuni andmekeskusteni, käitama täiustatud tehisintellekti.

Kaugel sellest, et olla üksainus mudel, Gemma 4 on neljast avatud variandist koosnev täielik valikSee ettepanek on mõeldud arendajatele, ettevõtetele ja avaliku sektori asutustele, kes soovivad oma andmete ja juurutuste üle suuremat kontrolli, ning sobib eriti hästi järgmiste nõuetega: Digitaalne suveräänsus ja regulatiivne vastavus Euroopaskus üha olulisemaks muutub õigus otsustada, kus teostus toimub ja kuhu andmeid salvestatakse.

Neljast mudelist koosnev perekond, mis keskendub "parameetripõhisele intelligentsusele"

Gemma 4 mudeliperekond

Gemma 4 on ehitatud samale tehnoloogilisele alusele nagu Kaksikud 3Kuid selge eesmärgiga: maksimeerida Google'i kõnede edastamist "parameetripõhine intelligentsus"Selle asemel, et konkureerida ainult suuruse poolest, kiitleb ettevõte sellega, et on saavutanud suhteliselt kompaktsetes mudelites palju suuremate süsteemidega võrreldava jõudluse.

Perekond koosneb neli erinevat suurustEfektiivne 2B (E2B), efektiivne 4B (E4B), mudel 26B koos ekspertide segu (MoE) arhitektuuriga ja tihe variant 31B parameetridViimane asub juba seal Arena AI avatud mudelite edetabelis 3 parimat, edestades alternatiive, mis korrutavad selle parameetrite arvu kahekümnega, mis on eriti oluline neile, kes soovivad vähendada GPU kulusid kvaliteeti ohverdamata.

mudel 26B Keskkonnaministeerium See on optimeeritud aktiveerima järeldustes ainult murdosa oma parameetritest (umbes 3,8 miljardit), parandades tokenite genereerimise kiirust ja energiatõhusust. Seevastu versioon 31B tihe See on eelistatud valik nõudlike peenhäälestusülesannete, keeruka orkestreerimise ja intensiivse kasutamise jaoks äri- või institutsionaalses keskkonnas.

Google rõhutab, et avalike võrdlusaluste osas konkureerivad need variandid otseselt teiste pakkujate raskemate mudelitega, sealhulgas Hiina tootjate nagu DeepSeek või Qwen mudelitega, mis on viimastel aastatel avatud lähtekoodiga ökosüsteemis tugevaks muutunud. Gemma 4 31B on Arena AI-s kolmanda parima avatud mudelina loetletud., samas kui 26B Keskkonnaministeerium on samuti kõrgel kohal.

Ärilisest vaatenurgast tähendab see suuruse ja tulemuslikkuse vaheline seos väiksemad riistvarakulud, madalam latentsus ja võime käivitada piirimudeleid ühes NVIDIA H100 80GB graafikakaartSee avab keskmise suurusega Euroopa ettevõtetele ukse töötada täiustatud tehisintellektiga ilma ebaproportsionaalselt suure taristu loomiseta.

Taskuformaadis tehisintellekt: mobiil, asjade internet ja servaarvutus

Gemma 4 mobiilseadmetes

Väiksemad mudelid, E2B ja E4BNeed on spetsiaalselt loodud töötama võrgu servas, st. mobiilseadmed, asjade internet ja kohalik riistvaraGoogle märgib, et need variandid on optimeeritud töötama Androidi nutitelefonid, Raspberry PiJetson Nano ja muud väikese energiatarbega süsteemid, väga madala latentsusega ja isegi ilma internetiühenduseta.

Selles segmendis pole prioriteediks mitte ainult toores jõud, vaid ka võime pakkuda multimodaalsed funktsioonid ja kiire reageerimine ressursipiiranguga keskkondades. Gemma 4 servamudelid saavad hakkama tekst, pildid ja videoja E2B ning E4B puhul lisavad nad natiivse toe heli-See võimaldab kasutada selliseid juhtumeid nagu kohalikud häälassistendid, pildituvastus välitingimustes või reaalajas videoanalüüs ilma andmete pilve saatmise vajaduseta.

Nende kergete mudelite kontekstiaken ulatub 128.000 märgidSellest piisab pikkade dokumentide, ulatuslike vestluste või asjakohaste koodijuppide töötlemiseks ühe käsuviibaga. Google'i sõnul aitab see laia konteksti ja lokaalse teostuse kombinatsioon hõõrdumist kõrvaldada. privaatsus, ühenduvus ja latentsusSee on väga oluline tööstus-, tervishoiu- või haridusprojektide jaoks Euroopas, kus andmetöötluse piirangud muutuvad üha rangemaks.

Riistvaratootjate vaatenurgast avab Gemma 4 ukse integratsioonile Täiustatud tehisintellekt otse tarbekaupadesseAlates nutitelefonidest ja tahvelarvutitest kuni meditsiiniseadmete ja tööstuslike anduriteni on ettevõte rõhutanud, et need mudelid on loodud töötama tavaliste Androidi ökosüsteemi pakkujate, näiteks Qualcommi ja MediaTeki kiipidega, hõlbustades nende laialdast kasutuselevõttu.

Lisaks kasutab servamudelite arhitektuur selliseid tehnikaid nagu Kihipõhised manustamised (PLE) parameetrite kasutamise efektiivsuse maksimeerimiseks, võimaldades arutluskäiku ja konteksti mõistmist palju madalamate arvutuskuludega kui tavaliselt üldotstarbelistes mudelites.

Multimodaalsus, agendid ja täiustatud arendajate tugi

Gemma 4 multimodaalset võimekust

Üks Gemma 4 tugevusi on selge pühendumus agentide töövoodMudelid ei piirdu ainult teksti genereerimisega: need integreeruvad natiivselt funktsioonide kutsumine, struktureeritud JSON-väljund ja süsteemijuhisedSee võimaldab luua autonoomseid agente, mis juhivad erinevaid samme, kutsuvad välja väliseid API-sid ja tagastavad tulemusi vormingutes, mida on lihtne ettevõtte rakendustega integreerida.

Google väidab, et kõik Gemma 4 perekonna mudelid on disainitud järgmiselt: kõrgetasemelised arutlejadseadistatavate mõtlemisrežiimidega, et kohandada arutluskäigu sügavust vastavalt ülesandele. See annab paremaid tulemusi mitmeastmeline arutluskäik, võrguühenduseta koodi genereerimine ja keerukate probleemide lahendamine, mis on võtmetähtsusega aspektid ettevõtete ja avaliku halduse keskkondades, kus on vaja usaldusväärsust.

Multimodaalsel tasandil saavad neli mudelit töödelda Erineva eraldusvõime ja kuvasuhtega tekst ja pildid, samas kui E2B ja E4B variandid laiendavad seda võimekust video ja heliSee kombinatsioon võimaldab näiteks luua süsteeme, mis analüüsivad dokumente graafika, tööstusliku seire videote või rikkaliku haridusliku sisu abil ning genereerivad kontekstuaalseid vastuseid reaalajas.

Kontekstiaken jõuab 256 000 žetooni suurimates mudelitesSee võimaldab kasutajatel ühe päringuga üles laadida terveid koodihoidlaid, pikki juriidilisi lepinguid või suuri mahtusid tehnilist dokumentatsiooni. Tugi-, konsultatsiooni- või IT-auditi meeskondade jaoks lihtsustab see ülesannete automatiseerimist, mis varem nõudsid tundidepikkust käsitsi läbivaatamist.

Keelte osas toetab Gemma 4 natiivselt rohkem kui 140 keeltEuroopa ja eriti Hispaania jaoks tähendab see, et saab arendada mitmekeelseid lahendusi, mis hõlmavad kõike alates ELi peamistest keeltest kuni vähem esindatud keelteni, aidates saavutada ligipääsetavuse ja kaasatuse eesmärke nii avalikes kui ka erasektori teenustes.

Pilveintegratsioon, digitaalne suveräänsus ja juurutamine Euroopas

Gemma 4 juurutamine ei piirdu ainult kohapealse riistvaraga. Google on need mudelid oma pilvepakkumisse integreerinud järgmiste meetodite kaudu: Vertex AI y Google Kubernetes Engine (GKE)mis võimaldab organisatsioonidel konfigureerida spetsiaalseid arvutusressursse ja skaleerida järelduste töökoormust vastavalt vajadusele. Reguleeritud Euroopa sektorite puhul on see kombineeritud võimalustega Suveräänne pilv ja õhuvahedega või kohapealsed juurutused, mis on kohandatud andmete asukoha nõuetele ja vastavusele isikuandmete kaitse üldmäärusele (GDPR).

Ettevõte rõhutab, et suuremate mudelite bfloat16 täppiskaalusid saab tõhusalt kasutada a üks 80 GB NVIDIA H100 graafikakaartvähendades sisenemistõket keskmise suurusega ettevõtetele või avalik-õiguslikele asutustele, kes soovivad säilitada kontrolli oma infrastruktuuri üle. Kvantiseeritud versioonides saavad mudelid töötada ka tarbijariistvara või tööjaamad, laiendades võimalike juurutuste valikut.

Hispaania ja ülejäänud Euroopa tehnoloogiajuhtide jaoks on see kombinatsioon avatud mudel, kontrollitud juurutamine ja suveräänne pilvetugi See võimaldab hübriidarhitektuuride kujundamist: osa intelligentsusest võib asuda kohalikes andmekeskustes, samal ajal kui teised vähem tundlikud töökoormused töötavad avalikus pilves, säilitades samal ajal ühise tehnoloogilise baasi.

Lisaks pakub Google Agendi arenduskomplekt (ADK)Modulaarne raamistik, mis lihtsustab Gemma 4-põhiste agentide loomist, testimist ja juurutamist. See tugineb ka sellistele teenustele nagu Pilvepõhine töö NVIDIA RTX PRO 6000 GPU-dega (Blackwell) serverita režiimis, mis võimaldab käivitada suure intensiivsusega pilootprojekte ilma, et oleks vaja esimesest päevast alates hankida oma riistvara.

Euroopa kontekstis, kus tehisintellekti käsitlev arutelu keerleb tavaliselt kontrolli, läbipaistvuse ja auditeeritavuse ümber, on võimalik, et Avatud mudelite juurutamine Apache 2.0 all kontrollitud infrastruktuurides See on eriti atraktiivne haldusasutustele, pankadele, kindlustusseltsidele või tervishoiusektori ettevõtetele, kes peavad innovatsiooni ühildama rangete regulatiivsete raamistikega.

Apache litsents 2.0, avatud ökosüsteem ja kogukonna toetus

Kui on üks aspekt, mis on kogukonnas erilist huvi tekitanud, siis on see otsus litsentsida Gemma 4 all Apache 2.0Gemma varasemad versioonid kasutasid kohandatud litsentse, mis tekitasid äritoodete puhul õiguslikke küsimusi; nüüd, standardse avatud lähtekoodiga litsentsiga, Arendajad ja ettevõtted saavad mudeleid palju väiksema hõõrdumisega muuta, ümber levitada ja rahaks teha.

See avamine toimub ajal, mil Google üritab taasavada positsiooni avatud mudelite ökosüsteemisSee tuleb pärast perioodi, mil alternatiivid nagu Meta Llama või Hiina mudelid (DeepSeek, Qwen, GLM, Minimax) olid populaarsust kogunud. Sektori mõjukad hääled, näiteks Hugging Face'i kaasasutaja, on kirjeldanud seda sammu kui kohaliku tehisintellekti "tohutut verstaposti", rõhutades, et juriidilistel meeskondadel on nüüd palju selgem raamistik Gemma 4-l põhinevate projektide heakskiitmiseks.

Gemma perekonda ümbritsev ökosüsteem näitas tugevust juba enne seda versiooni. Google märgib, et eelmised põlvkonnad ületavad... 400 miljonit allalaadimist ja et kogukond on loonud rohkem kui 100.000 varianti kohandatud erinevatele keeltele ja kasutusjuhtudele. Kõige silmatorkavamate näidete hulgas on mudelid, mis on spetsialiseerunud Bulgaaria keel või vähiuuringute vahendid, näiteks Cell2Sentence-skaala töötatud välja Yale'i ülikoolis.

Gemma 4-ga loodab ettevõte, et "Gemmaverse" laieneb veelgi, kutsudes... Euroopa idufirmad, ülikoolid ja teaduskeskused luua oma tuletisi. Lubava litsentsi ja avatud kaalude kombinatsioon võimaldab arendada versioone, mis on suunatud konkreetsetele sektoritele, nagu tervishoid, õigus, Tööstus 4.0 või haridus, ning mida saab seejärel jagada või turustada ilma liigsete piiranguteta.

Hispaania ettevõtete jaoks tähendab see olukorda, et Gemma 4-le on võimalik luua patenteeritud lahendusi – näiteks sisemisi assistente, ettevõtte otsingumootoreid või täiustatud analüütilisi süsteeme –, säilitades samal ajal kontrolli koodi, andmete ja infrastruktuuri üle, mis sobib hästi trendiga tugevdada Euroopa tehnoloogiline suveräänsus.

Kasutusjuhud: idufirmadest suurettevõteteni

Gemma 4-le on esitatud lai valik potentsiaalsed rakendusedÄrimaailmas saab mudeleid kasutada loomiseks mitmekeelsed virtuaalsed assistendid võimeline keerukate päringutega tegelema täiustatud arutluskäigu abil või automatiseerima koodi genereerimist ja ülevaatamist arendusmeeskondades.

Suuremad mudelid on suunatud sellistele ülesannetele nagu agentide orkestreerimine, suurte dokumentatsioonimahtude analüüsSee hõlmab tehniliste aruannete koostamist või juriidiliste ja vastavusosakondade abistamist. Laia konteksti akende ja multimodaalse toe kombinatsioon muudab ühel agendil lihtsaks töötada lepingute, meilide, diagrammide, jälgimissüsteemi piltide ja helisalvestistega – kõik sama töövoo raames.

Hariduses ja avalikus sektoris võimaldab teksti, piltide ning mõnel juhul ka video ja heli töötlemise võime luua õppimist toetavad platvormid mis genereerivad kokkuvõtteid, samm-sammult selgitusi või erinevatele tasemetele kohandatud materjale. Kohalik rakendamine aitab austada ka privaatsusnõudeid alaealiste või haavatavate rühmade tundlike andmetega töötamisel.

Startup-maailmas võib Gemma 4 olla aluseks vertikaalsed tooted Finantstehnoloogia, digitaalse tervishoiu, logistika või B2B SaaS-i valdkonnas saavad meeskonnad tänu Apache 2.0 pakutavale paindlikkusele teha järgmist peenhäälestus mudelit oma andmetel rakendada, seda kohapeal või pilves juurutada ja tulemust turustada ilma rangete omandiõigusega litsentsideta.

Euroopa jaoks on eriti huvitav arenguvõimalus kohalikud tehisintellekti lahendused mis austavad riiklikke ja ühenduse eeskirju, näiteks salvestades andmeid Euroopa territooriumil asuvatesse andmekeskustesse ja hoides mudeleid organisatsiooni otsese kontrolli all, mis võib olla võtmetähtsusega tulevase ELi tehisintellekti määrusega seotud projektide jaoks.

Kus ja kuidas Gemma 4-le ligi pääseda

Google on teinud Gemma 4 kaalud kättesaadavaks erinevate kanalite kaudu, et hõlbustada nende kasutuselevõttu arendajate ja teadlaste poolt. Avatud kaalud saab alla laadida aadressilt Kallistav nägu y GitHub, samas kui liidese ja API-de kaudu kasutamine on saadaval Google AI StudioIntegratsioone pakutakse ka koos OllamaDocker, Kaggle ja tööriistad nagu LM Studio.

Ettevõtte sõnul saab Gemma 4-d käitada lokaalselt «miljardeid Android-seadmeid» ja laias valikus riistvara puhul: alates Sülearvuti graafikaprotsessorid ja tööjaamadest kuni spetsiaalsete arenduskiirendikeskusteni välja. See on kooskõlas strateegiaga laiendada täiustatud tehisintellekti suurtest andmekeskustest kaugemale lõppkasutajate seadmetesse ja servaarvutite keskkondadesse.

Neile, kes soovivad alustada kiirtestidega, on kõige otsesem variant kasutada Google AI Studio 26B ja 31B mudelite või Google'i tehisintellekti servade galerii E2B ja E4B variantide puhul. Paralleelselt avaldavad arendajate kogukonnad platvormidel nagu Hugging Face juba kohandusi ja kasutusvalmis konfiguratsioone erinevate keskkondade jaoks.

Hispaanias ja teistes Euroopa riikides on oodata, et kohalikud integraatorid ja hallatud teenuste pakkujad hakkavad pakkuma Gemma 4 baasil valminud võtmed kätte lahendused, ühendades suveräänsed pilveteenuste juurutused, hispaaniakeelse toe ja kohandamise konkreetsete sektorite, näiteks finantsteenuste või tervishoiu eeskirjadega.

Üldiselt positsioneerib Gemma 4 turuletoomine Google'i kui ühe olulisema tegija selles valdkonnas. avatud ja lokaalselt käivitatavad tehisintellekti mudelidajal, mil Euroopa tööstus nõuab just tööriistu, mis ühendavad endas suure jõudluse, andmete kontrolli ja selged litsentsimisraamistikud pikaajaliste kommertstoodete loomiseks.

serva tehisintellekti abil rohkem privaatsust
Seotud artikkel:
Edge AI ja privaatsus: võimas AI ilma teie andmeid reetmata