Private AI
na waszej infrastrukturze

Chatbot na dokumentach firmowych, wyszukiwarka wiedzy, asystent dla pracowników, automatyzacje — uruchomione lokalnie lub na waszym Proxmoxie. Dane nie wychodzą poza środowisko, które kontrolujecie. Bez ChatGPT-a, bez wycieków, bez compliance fire drilla.

Po co prywatne AI?

Pracownicy używają AI, czy chcecie tego czy nie. Wpisują pytania do ChatGPT, wrzucają dokumenty do darmowych narzędzi, kopiują kod, umowy, dane klientów. Macie wybór: zignorować to (i czekać na incydent), zablokować (i zostać firmą bez AI w 2026) — albo dać im kontrolowane, bezpieczne narzędzie u siebie.

Prywatne AI to nie kompromis. To dokładnie ten sam typ asystenta co ChatGPT/Claude, ale uruchomiony na waszym serwerze, z dostępem do waszych dokumentów, z logami dostępu i uprawnieniami per użytkownik.

Co konkretnie wdrażamy

Lokalny LLMLlama 3.3, Qwen 2.5, Mistral — od 8B do >30B parametrów
RAG na dokumentachindeksowanie PDF, DOCX, MD, HTML, kody
Panel wwwchat, historia, uprawnienia, audyt
API dla aplikacjiOpenAI-compatible — można podpiąć istniejące narzędzia
IntegracjeSlack, Teams, mail, Confluence, SharePoint
Embeddings + vector DBpgvector, Qdrant, Weaviate
GPU lub CPURTX 4090 / A100 / H100 / Mac Studio / CPU-only
Multi-tenantróżne zespoły, różne uprawnienia, różne knowledge base'y
Logi i audytkto, co, kiedy zapytał — pełna kontrola

Typowe zastosowania

Knowledge base dla firmy

Pracownik wpisuje pytanie i dostaje odpowiedź na podstawie regulaminów, instrukcji, ofert, umów, dokumentacji technicznej i mailowej historii. Z cytatami i linkami do źródła. Zamiast „spytaj Marka, on wie" — masz wiedzę firmy dostępną 24/7.

Asystent dla działu wsparcia

Helpdesk dostaje ticket, AI proponuje odpowiedź na podstawie poprzednich zgłoszeń, dokumentacji i bazy wiedzy. Czas obsługi spada 2-3x. Junior agent działa jak senior.

Asystent dla działu sprzedaży

Handlowiec pyta o specyfikację produktu, cenę, warunki, historię klienta — AI odpowiada na podstawie CRM, ofert, korespondencji. Bez przerzucania zakładek.

Wyszukiwarka prawno-procesowa

Dla kancelarii, działów prawnych, działów compliance. Pytanie po polsku, odpowiedź z przepisami, orzeczeniami i precedensami z bazy klienta. Bez wysyłania umów na zewnętrzne API.

Automatyzacje wewnętrzne

AI pisze maile, podsumowuje spotkania, generuje raporty z danych firmowych, klasyfikuje dokumenty, ekstrakcja danych z faktur i umów. Wszystko lokalnie.

Czemu na Proxmox / on-premise?

Compliance i RODO

Dane wrażliwe nie wychodzą poza środowisko, które kontrolujecie. Łatwiej argumentować w audycie, w sektorze regulowanym, przy umowach z klientami enterprise.

Brak limitu kosztów per użytkownik

OpenAI/Anthropic API dla 50 pracowników to 5-15 tys. zł / mies. Lokalny model na własnym GPU ma stały koszt sprzętu (jednorazowy) i brak limitu zapytań. ROI po 3-12 miesiącach.

Pełna kontrola nad modelem

Wybór modelu, dostrojenie do waszej domeny (fine-tuning), kontrola wersji, brak niespodziewanych zmian zachowania (które dzieją się w API publicznych).

Brak ryzyka, że jutro ktoś zmieni warunki

Komercyjne API mogą zmienić ceny, limity, polityki danych z dnia na dzień. Lokalny model masz na zawsze.

Pakiety i ceny

AI Knowledge Base

Chatbot na dokumentach firmowych. RAG, panel www, podstawowe uprawnienia. Do 50 użytkowników, do 100 GB dokumentów. Działa na średnim GPU (A6000, L40S itp.). od 40 000 zł netto wdrożenie + od 3 000 zł / mies. utrzymanie.

Private AI Appliance

Pełne wdrożenie z dedykowanym serwerem GPU (lub kolokacją u nas). Lokalny LLM >30B, RAG, multi-tenant, integracje, panel admina. Do 500 użytkowników. od 80 000 zł netto + od 8 000 zł / mies..

AI Helpdesk / Sales Assistant

Asystent zintegrowany z CRM, mailem, ticketami. Customowe workflow, fine-tuning na waszych danych, integracje z istniejącymi narzędziami. od 60 000 zł netto + od 5 000 zł / mies..

AI Hosting Managed

Dla firm, które już mają model, ale chcą hostingu z gwarancjami. Inferencja, autoscaling, monitoring, GPU management. od 3 000 do 30 000 zł / mies..

Stack technologiczny

ModeleLlama 3.3, Qwen 2.5, Mistral, DeepSeek, Phi
InferenceOllama, vLLM, llama.cpp, TGI
EmbeddingsBGE-M3, multilingual-e5, OpenAI-compat
Vector DBpgvector, Qdrant, Weaviate, Chroma
FrontendOpenWebUI, customowy panel React/Next
OrchestrationLangChain, LlamaIndex, customowy pipeline
AuthOIDC / SAML / LDAP / AD / Google Workspace
MonitoringLangfuse, Prometheus, Grafana

Chcecie AI bez ryzyka utraty danych?

45 minut rozmowy. Pokażemy demo, omówimy use case'y w waszej firmie, oszacujemy koszt sprzętu i wdrożenia.

Umów rozmowę