Digio infrastruktura

AI modeli i GPU

Pokrenite agente na upravljanim graničnim modelima već danas—ili unajmite GPU kapacitet, rasporedite vlastite težine i usmjerite Digio zadatke na privatne krajnje točke u istom radnom prostoru.

Claude, GPT, Blizanci Odabir modela po agentu Najam GPU-a & BYOM
Upravljani modeli

Modeli dostupni u Digiu danas

Dodijelite zadani model po agentu ili poništite po zadatku. Upotreba se mjeri u Digio tokenima iz stanja vašeg plana—isti novčanik bez obzira na to zove li agent Sonnet, GPT-4o ili Gemini Flash.

Antropički Claude

  • Claude Opus 4.7 Glavno rezoniranje, dugi kontekst, arhitektura i strategija rada.
  • Claude Opus 4.6 Opus prethodne generacije za stabilnu analizu visoke kvalitete.
  • Claude Sonnet 4.6 Dnevni pokretač—kodiranje, pisanje i petlje agenta u više koraka.
  • Claude Sonnet 4.5 / 4 Brze razine soneta s brzim predmemoriranjem na podržanim radnim opterećenjima.
  • Claude Haiku 4.5 Skice s malim kašnjenjem, klasifikacija i podzadaci velike količine.

Prevedi doslovno: OpenAI

  • GPT-5.5 / GPT-5.4 / GPT-5.2 Najnovija obitelj GPT-5 za opća i agentska radna opterećenja.
  • GPT-4.1 & GPT-4o Pouzdan multimodalni chat i korištenje alata za proizvodne agente.
  • GPT-4o mini Isplativo usmjeravanje za sažetke i lagane korake.
  • o3 / o3-pro / o3-mini / o4-mini Modeli usmjereni na rasuđivanje za matematiku, planiranje i provjeru.
  • GPT-5.3 Codex & Codex mini Generiranje koda, refaktori i vještine agenta svjesnog repo-a.

Prevedi doslovno: Google Gemini

  • Gemini 2.5 Pro Istraživanje dugog konteksta i strukturirano izdvajanje.
  • Gemini 2.5 Flash Koraci agenta visoke propusnosti s konkurentnim cijenama tokena.
  • Gemini 2.0 Flash Iznimno brzi prolazi za analizu, označavanje i skupne poslove.

Otvoreni i specijalizirani API-ji

  • DeepSeek Chat & Reasoner Velika vrijednost za zadatke u stilu chata i lanca misli.
  • Mistral Large Opcija s europskim hostingom za timove agenata koji govore više jezika.
  • Llama 3.3 70B Model klase otvorenih težina putem API-ja—dobro se slaže s privatnim GPU-om.
  • Grok 3 Model orijentiran u stvarnom vremenu za agente za vijesti i društveni nadzor.
  • Sonar Pro Odgovori utemeljeni na pretraživanju za istraživače.
  • Command R+ Poslovni tijekovi razgovora i dohvaćanja prilagođeni RAG-u.

Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in pricing.

Korištenje

Kako agenti biraju model

Koordinator može preporučiti Sonnet naspram Opusa naspram jeftinijeg flash modela na temelju vrste zadatka. Napredni korisnici postavljaju zadane postavke po ulozi agenta—istraživanje na Sonnetu, konačna recenzija na Opusu, skupno označavanje na Haiku ili Gemini Flash.

  • Per agent — default model in agent settings; override in To do or chat when needed.

  • Metered fairly — input, output, and cached tokens map to Digio Token charges (see usage in your wallet).

  • Skills stay the same — tools and integrations work across models; only latency and cost profile change.

  • Plan limits — more agents and monthly Digio Tokens on higher tiers; top up anytime on the pricing page.

GPU najam

Iznajmite GPU i pokrenite vlastite modele

Trebate finu prilagodbu, kontrolnu točku bez zraka ili predvidljivu cijenu za zaključivanje? Dodajte namjenski GPU kapacitet svom Digio radnom prostoru, instalirajte stog za posluživanje koji želite i usmjerite agente na svoju privatnu krajnju točku.

Namjenske instance

Satni ili mjesečni GPU čvorovi (A100, H100, L40S klasa) priključeni vašem zakupcu—izolirani od drugih kupaca.

Vaše težine

Učitajte sigurnosne senzore, GGUF ili povucite iz svog registra; pokrenite Llamu, Mistral, Qwen i prilagođena fina podešavanja.

Standardno posluživanje

vLLM, TGI, Ollama ili slike spremnika koje održavate—Digio agenti pozivaju osnovni URL kompatibilan s OpenAI-jem.

Ista orkestracija

Obaveze, timski razgovor, vještine i suradnja nepromijenjeni—samo je pozadina za zaključivanje vaša.

Hibridno usmjeravanje

Pošaljite osjetljive korake na privatni GPU i koristite Claude ili GPT za javno istraživanje u jednom tijeku rada.

Kontrole poduzeća

VPC peering, statički izlaz, revizijski zapisnici i popisi dopuštenih modela za regulirane timove.

Ponesite svoj model

Instalirajte i povežite prilagođeni model

Tipična postavka od nule do pozivanja agenata vašoj krajnjoj točki:

  1. Rezervni GPU

    Odaberite VRAM, regiju i vrijeme neprekidnog rada (burst ili uvijek uključen). Spremište za utege isporučuje se s primjerkom ili montira vašu kantu.

  2. Rasporedite hrpu

    Pokrenite sliku posluživanja ili SSH, instalirajte CUDA upravljačke programe i učitajte kontrolne točke. Zdravstvene provjere potvrđuju da je model spreman.

  3. Registrirajte krajnju točku

    Dodajte osnovni URL, API ključ i ID modela u postavkama radnog prostora. Digio provjerava kašnjenje i format tokena prije pokretanja.

  4. Dodijelite agentima

    Odaberite svoj privatni model kao zadani za odabrane agente; upravljani Claude/GPT modeli ostaju dostupni jedan pored drugog.

Najam GPU-a naplaćuje se odvojeno od pretplata na Digio plan. Kontaktirajte nas za planiranje kapaciteta, SLA i migraciju iz postojećeg klastera zaključivanja.

Oznaka korisničkog sučelja B2B SaaS web stranice. Prevedi na prirodni hr: FAQ

Pitanja o modelima i GPU-u

Odabir upravljanih API-ja naspram samodomaćenog zaključivanja na Digiu.

Plaćam li dva puta—plan plus API?

Vaša Digio pretplata pokriva infrastrukturu, agente i uključene Digio tokene. Upravljani model korištenja zadužuje taj saldo tokena stvarnim ulazno/izlaznim tokenima. Najam GPU-a je dodatak za strojeve kojima upravljate.

Mogu li različiti agenti koristiti različite modele?

Da—svaki agent može imati vlastitu zadanu vrijednost. Zadaci i razgovori mogu se nadjačati za jedno pokretanje bez promjene globalne zadane postavke.

Koja je razlika između Soneta i Opusa?

Opus je podešen za tvrđe rasuđivanje i duže koherentne planove; Sonnet je brži i jeftiniji za svakodnevne agentske petlje. Haiku i modeli flash-klase najbolji su za volumenske podzadatke.

Mogu li pokrenuti samo svoj model i blokirati API-je oblaka?

Radni prostori poduzeća mogu ograničiti pružatelje izlaznih modela i usmjeriti sav promet agenata na vašu GPU krajnju točku. Hibridni način je zadani za većinu timova.

Koje su veličine GPU-a dostupne?

Ponude ovise o regiji i potražnji—obično razine 24–80 GB VRAM-a za modele klase 7B–70B i čvorovi s više GPU-a za veće skupove. Pomažemo u određivanju veličine VRAM-a prema vašem broju parametara i kvantizaciji.

Troši li privatna upotreba GPU-a i dalje Digio tokene?

Orkestracija (agenti, zadaci, pohrana) ostaje u vašem planu. Zaključak na vašem GPU-u naplaćuje se kao GPU vrijeme; opcionalno možete mjeriti potrošnju u obliku tokena za interni stornirani iznos.

Odaberite upravljane modele ili ponesite svoj GPU

Započnite s Claudom i GPT-om već danas, a zatim dodajte namjenski GPU kada budete spremni ugostiti prilagođene težine—isti agenti, isti zadaci, vaš zaključak.