Орталық суперкомпьютерді желі арқылы “бәріне ортақ” ету — есептеу ресурсынан бөлек, кезек, пик, жоспарлау, желі және периметр тәуекелдерін қоса әкеледі. SOILEGPT.CHAT тәсілі: бір клиент — бір edge. Бұл модельде “көршінің шуылы” жоқ, қуат алдын ала белгілі, ал дерек клиент периметрінде қалады.
| Center → cable | SOILEGPT.CHAT (edge) |
|---|---|
| Клиенттер бір GPU-пулды бөліседі → кезек пен пик “жұғады”. | Ресурс бөлінбейді → әр клиенттің қуаты тұрақты. |
| SLA = compute + network + scheduler. | SLA = local compute (network тек әкімшілікке). |
| Периметр: VPN/MPLS, IAM, аудит, шифрлау, шлюздер. | Клиент периметрі “табиғи”: дерек шықпайды, басқару жеңіл. |
k = бір H200-ға бір мезетте қанша клиент отырғызылған (орталықтағы нақты oversubscription). Бұл “клиентке шаққандағы” үлесті анықтайды.
Digitalqazaqstan стиліндегі “телеметрия” логикасы: әр модуль — операциялық өлшенетін бірлік. Мұнда сан емес, принцип маңызды: edge-та кезек пен пик оқшауланады.
On‑prem inference node (one client — one compute).
Kazakh‑first multilingual 72B‑class LLM interface.
PII gate + policy enforcement in the client domain.
Орталық есептеу — тек бір қабат. Клиентке нақты сервисті жеткізу үшін төмендегі жүйелер міндетті түрде қосылады. Edge-та олардың көп бөлігі қажет емес немесе клиенттің өз инфрақұрылымына “сіңіп” кетеді.
VPN/MPLS, gateways, encryption, IAM, session control.
Quota, batching, fairness, admission control, noisy‑neighbor mitigation.
Data flows, retention, logs, policy, change management.
Қолданылған прокси: FP16 Tensor peak. Бұл толық сервингтің бәрін қамтымайды, бірақ архитектуралық масштабты дәл береді (бір кластың GPU-на шаққандағы order‑of‑magnitude).
Бір GPU-пулға көптеген клиенттің сұраныстары “қабаттасқанда” — кезек пайда болады. Кезек теориясында ρ→1 болғанда, күту уақыты тез өседі. Edge-та бұл жұқтыру жоқ (оқшаулану).
72B = 72 миллиард параметр. Параметрлер — модельдің салмақтары: тілдік заңдылықтар, семантика және көптілді сәйкестік солар арқылы сақталады. 72B‑класта қазақша‑орысша аралас диалогта мағына жоғалтпай, күрделі тапсырмаларда тұрақтырақ жауап беру оңайырақ.
| Неге бұл “супер” сезіледі | Қолданушыға әсері |
|---|---|
| Көбірек параметр | Мағыналық дәлдік, ұзын нұсқаулықты орындау, контекстті ұстап тұру. |
| Көптілді орта | kk/ru/en аралас мәтінде “код ауыстыру” тұрақтылығы. |
| Edge оқшаулауы | Сапа тек модельмен емес, латенттіліктің тұрақтылығымен де өлшенеді: кезек жоқ. |
| Жергілікті бақылау | Саясат, PII, журналдар — клиентте. “Сыртқы” тәуекел азаяды. |
Берілген шарт: $15,000 бір edge. Бағам: 520 ₸ = $1.
Орталық модельде тек GPU емес: периметр, желілік жеткізу, планировщик, NOC және жүктеме шыңдары үшін артық қуат қажет болады (қызмет көрсету деңгейін ұстап тұру үшін).
| Workstream | Неге қымбат/ұзақ |
|---|---|
| Connectivity | Канал, резерв, QoS, шифрлау, шлюздер. |
| Scheduling | Кезек пен пикті басқару; admission control; fairness. |
| Operations | Инцидент, мониторинг, аудит, өзгеріс менеджменті. |
| Onboarding | Клиент интеграциясы, тест, қауіпсіздік рәсімдері. |
| Week | Outcome |
|---|---|
| 1–2 | Edge стандарт: образ, саясат, мониторинг минимум, “бір клиент — бір edge”. |
| 3–6 | Пилот: 3–10 клиент. Орнату регламенті, жаңарту, кері қайту (rollback). |
| 7–10 | Масштабтау: логистика, сервистік қолдау, тұрақты релиз. |
| 11–12 | Қабылдау: құжат, білім базасы, партиялық жеткізу. |