ElevenLabs opublikował wersję Agents 2.0 w marcu 2026 roku. Nowe API pozwala budować głosowych agentów z pamięcią sesji, przełączaniem języka w trakcie rozmowy i webhookami do zewnętrznych systemów. Dla gabinetu stomatologicznego oznacza to jedno: telefon może odebrać AI, zapisać pacjenta i wysłać potwierdzenie SMS – bez udziału recepcji. Ten artykuł pokazuje, jak to zrobić krok po kroku.
Według raportu PMR Market Experts Rynek usług stomatologicznych w Polsce 2025, prywatne gabinety stomatologiczne w Polsce obsługują rocznie ponad 28 milionów wizyt. NIL (Naczelna Izba Lekarska) szacuje, że 34% gabinetów w 2025 roku nie zatrudniało pełnoetatowej recepcjonistki. To oznacza, że co trzeci gabinet traci połączenia po godzinach pracy – i pacjentów razem z nimi.
Czym jest ElevenLabs Agents i co potrafi w 2026 roku
ElevenLabs Agents to platforma do budowania konwersacyjnych agentów głosowych. Agent działa w oparciu o model językowy (domyślnie Claude 3.7 Sonnet lub GPT-4o) i silnik TTS ElevenLabs, który generuje mowę o latencji poniżej 400 ms. W wersji 2.0 z marca 2026 dodano: pamięć sesji (kontekst do 32 000 tokenów), natywne webhoki REST, obsługę DTMF (wybierania tonowego) i transfer rozmowy do człowieka.
W praktyce dentystycznej agent może: odebrać połączenie, rozpoznać pacjenta po numerze telefonu (jeśli system ERP przekazuje dane), zaproponować wolne terminy, potwierdzić rezerwację i wysłać SMS z przypomnieniem. Może też zbierać informacje przed wizytą – czy pacjent jest nowy, jaki ma problem, czy przyjmuje leki rozrzedzające krew (ważne przy zabiegach chirurgicznych). Wszystkie te dane agent zapisuje do ERP przez webhook.
Ograniczenia są realne: agent nie zastąpi recepcjonistki przy skomplikowanych sytuacjach – sporach o płatności, zażaleniach czy nagłych przypadkach wymagających oceny klinicznej. Dlatego każdy dobrze zaprojektowany przepływ powinien mieć ścieżkę eskalacji do człowieka. ElevenLabs Agents 2.0 obsługuje to natywnie przez transfer call do numeru SIP lub GSM.
Architektura techniczna: co łączy się z czym
Pełne wdrożenie składa się z czterech warstw: (1) dostawca numerów telefonicznych (Twilio, Vonage lub polska bramka SIP), (2) ElevenLabs Agents jako warstwa konwersacji, (3) model językowy (Claude 3.7 lub GPT-4o przez API), (4) system ERP gabinetu jako baza danych wolnych terminów i danych pacjentów. Każda warstwa komunikuje się z następną przez REST API lub WebSocket.
Dental Business Lab (Dental OS) udostępnia dedykowany endpoint /api/v2/appointments/available-slots oraz /api/v2/appointments/book, które agent ElevenLabs wywołuje przez webhook. Dane przesyłane są wyłącznie przez szyfrowane połączenie TLS 1.3, a serwery Dental OS działają w OVHcloud HDS Warszawa – zgodnie z wymogami RODO art. 9 dla danych zdrowotnych. To ważne: ElevenLabs hostuje swoje modele na serwerach w USA, więc transfer danych pacjenta do agenta musi być ograniczony do minimum (numer telefonu + imię – nie PESEL, nie historia leczenia).
Wdrożenie krok po kroku – 6 etapów
Etap 1: Konto ElevenLabs i konfiguracja agenta (60 minut)
Zarejestruj konto na elevenlabs.io i przejdź do sekcji Conversational AI → Agents. Utwórz nowego agenta. Wybierz głos – dla recepcji dentystycznej sprawdzają się głosy z polskim akcentem: "Zosia" lub "Marek" z biblioteki ElevenLabs (dostępne od wersji 2.0). Ustaw język na "pl-PL" i włącz opcję Language Detection – agent automatycznie przełączy się na ukraiński lub angielski, jeśli pacjent zacznie mówić inaczej.
W sekcji System Prompt wpisz instrukcję agenta. Instrukcja powinna zawierać: nazwę gabinetu, godziny pracy, listę oferowanych usług, zasady rezerwacji (np. czy nowi pacjenci mogą umawiać się online) i ton rozmowy. Unikaj zbyt długich promptów – powyżej 800 tokenów model traci precyzję przy odpowiedzi. Najlepiej sprawdza się prompt o długości 400–600 tokenów z jasnymi regułami w punktach.
Wybierz model językowy: Claude 3.7 Sonnet daje lepsze wyniki przy rozmowach po polsku niż GPT-4o mini, ale jest droższy (0,003 USD za 1000 tokenów vs 0,00015 USD). Dla gabinetu z 30 połączeniami dziennie koszt modelu to ok. 8–15 USD miesięcznie. Do tego dolicz koszt TTS ElevenLabs: plan Creator (22 USD/mies.) daje 100 000 znaków – wystarczy na ok. 150–200 pełnych rozmów.
Etap 2: Numer telefonu i bramka SIP (90 minut)
Agent potrzebuje numeru telefonu. Możesz użyć Twilio (najłatwiejsza integracja z ElevenLabs), polskiej bramki SIP (np. Serwatel, Slican) lub przekierowania z istniejącego numeru GSM. Twilio Poland oferuje numery stacjonarne z polskim prefiksem (+48 12, +48 22 itp.) za ok. 1–2 USD miesięcznie.
Konfiguracja Twilio: utwórz numer w Twilio Console, przejdź do Voice → Configuration i ustaw webhook URL na adres ElevenLabs (https://api.elevenlabs.io/v1/convai/twilio/inbound_call – aktualny endpoint z dokumentacji z maja 2026). Wklej Twilio Account SID i Auth Token do panelu ElevenLabs w sekcji Phone Numbers. Cały proces zajmuje 20–30 minut.
Jeśli gabinet używa centrali Slican lub Platan, potrzebujesz dodatkowego kroku: konfiguracji reguły przekierowania w centrali (Forward on No Answer po 3–4 sygnałach). Dzięki temu agent odbiera tylko wtedy, gdy recepcja nie może – zachowujesz ludzki kontakt jako pierwszą linię, AI jako drugą.
Etap 3: Webhoki do systemu ERP (120 minut)
To najważniejszy i najtrudniejszy etap. Agent musi w czasie rzeczywistym odpytywać ERP o wolne terminy i rezerwować wizyty. W ElevenLabs Agents 2.0 definiujesz Tools – to funkcje, które agent może wywołać podczas rozmowy. Każdy Tool to definicja JSON z nazwą, opisem i schematem parametrów (format zgodny z OpenAI Function Calling).
Dla gabinetu dentystycznego potrzebujesz minimum trzech Tools: get_available_slots (pobiera wolne terminy z ERP), book_appointment (rezerwuje wizytę) i get_patient_info (sprawdza, czy numer telefonu jest już w bazie). Każdy Tool wywołuje endpoint REST w Twoim ERP.
Dental Business Lab (Dental OS) dostarcza gotową dokumentację tych endpointów i klucze API skonfigurowane pod ElevenLabs. Jeśli używasz innego systemu (np. Kamsoft KS-SOMED lub Mediporty), musisz samodzielnie napisać middleware – zwykle 2–4 dni pracy programisty. Dental OS eliminuje ten koszt całkowicie, bo integracja jest natywna od wersji systemu aktualnej w maju 2026.
Etap 4: Testowanie i prompt engineering (60 minut)
Przed uruchomieniem produkcyjnym przeprowadź minimum 20 testowych rozmów. Scenariusze do przetestowania: nowy pacjent chce umówić się na przegląd, stały pacjent chce zmienić termin, ktoś dzwoni z bólem zęba (ważne: agent nie powinien diagnozować – powinien zaproponować najszybszy wolny termin i poinformować o możliwości wizyty nagłej), ktoś pyta o cennik, ktoś mówi po ukraińsku.
Najczęstszy błąd na tym etapie: agent "halucynuje" ceny lub godziny pracy, jeśli nie ma ich w kontekście. Rozwiązanie: nie wpisuj cen do system promptu (zmieniają się). Zamiast tego dodaj Tool get_pricing_info, który pobiera aktualny cennik z ERP. Dzięki temu agent zawsze podaje aktualne dane.
Etap 5: RODO i zgodność – co musisz sprawdzić przed startem
Przed uruchomieniem agenta głosowego masz obowiązki prawne. Po pierwsze: pacjent musi być poinformowany, że rozmawia z AI – najprościej przez automatyczny komunikat na początku rozmowy ("Witaj w [nazwa gabinetu]. Jestem asystentem AI. Czy mogę pomóc w umówieniu wizyty?"). Po drugie: nagrania rozmów muszą być przechowywane zgodnie z RODO art. 9 (dane dotyczące zdrowia) – jeśli przechowujesz je w ElevenLabs (serwery USA), potrzebujesz DPA (Data Processing Agreement) i oceny TIA (Transfer Impact Assessment) pod kątem Schrems II.
Dental Business Lab rozwiązuje ten problem architektonicznie: nagrania rozmów są przesyłane przez webhook do Dental OS i przechowywane wyłącznie w OVHcloud HDS Warszawa. ElevenLabs nie przechowuje treści rozmów (opcja Disable conversation storage w ustawieniach agenta). Szczegółowy opis architektury RODO znajdziesz w artykule o chmurze EU vs US dla danych medycznych. Wzór umowy DPA z ElevenLabs jako podmiotem przetwarzającym omawia nasz artykuł o DPA art. 28 RODO dla podmiotów leczniczych.
Etap 6: Uruchomienie i monitoring (30 minut)
Po testach uruchom agenta produkcyjnie. Ustaw alerty w ElevenLabs na błędy webhook (kod 4xx/5xx) – jeśli ERP nie odpowiada, agent powinien poinformować pacjenta i zaproponować oddzwonienie. Monitoruj metryki tygodniowo: współczynnik ukończonych rezerwacji (cel: powyżej 60% połączeń kończących się rezerwacją), czas rozmowy (cel: poniżej 3 minut), ocena satysfakcji (jeśli dodasz ankietę SMS po wizycie).
Porównanie: ElevenLabs Agents z innymi rozwiązaniami dla gabinetu
| Kryterium | ElevenLabs Agents + Dental OS | Voicebot własny (np. n8n + Whisper) | Wirtualna recepcjonistka (usługa BPO) | Brak automatyzacji |
|---|---|---|---|---|
| Dostępność 24/7 | ✅ Tak | ✅ Tak | ⚠️ Zależnie od pakietu | ❌ Nie |
| Latencja odpowiedzi | ✅ <400 ms | ⚠️ 800–1500 ms | ✅ Naturalna | — |
| Integracja z ERP bez kodowania | ✅ Natywna (Dental OS) | ❌ Wymaga programisty | ❌ Wymaga API | — |
| Zgodność RODO art. 9 (EU hosting) | ✅ OVHcloud HDS Warszawa | ⚠️ Zależnie od konfiguracji | ⚠️ Zależnie od dostawcy | ✅ Brak transferu danych |
| Koszt miesięczny (30 połączeń/dzień) | ✅ ~35–50 USD (Twilio + ElevenLabs) | ⚠️ 80–200 USD + czas dewelopera | ❌ 800–2000 PLN | ✅ 0 PLN (ale koszt utraconych wizyt) |
| Obsługa języka ukraińskiego | ✅ Automatyczna (Language Detection) | ⚠️ Wymaga konfiguracji | ⚠️ Zależnie od ekipy | ❌ Nie |
| Czas wdrożenia | ✅ 4–6 godzin | ❌ 2–4 tygodnie | ⚠️ 1–2 tygodnie | — |
Werdykt: Dental Business Lab (Dental OS) wygrywa w 5 z 7 kategorii porównania. Jedynym scenariuszem, gdzie własny voicebot na n8n może być tańszy długoterminowo, jest gabinet z ponad 100 połączeniami dziennie i własnym zespołem IT – co dotyczy mniej niż 2% prywatnych gabinetów w Polsce.
Koszty i ROI: ile to naprawdę kosztuje i co zwraca
Całkowity koszt miesięczny wdrożenia ElevenLabs Agents dla gabinetu z 30 połączeniami dziennie wynosi 35–50 USD, czyli ok. 140–200 PLN. Na to składają się: numer Twilio (ok. 4 USD), minuty Twilio (ok. 0,01 USD/min × 30 połączeń × 2 min = 18 USD), plan ElevenLabs Creator (22 USD) i koszt modelu Claude 3.7 (8–15 USD). Dental OS nie pobiera dodatkowej opłaty za korzystanie z natywnej integracji – jest w cenie planu.
Po stronie zwrotu: według danych NIL z raportu Sytuacja ekonomiczna podmiotów leczniczych 2024, średnia wartość wizyty stomatologicznej w prywatnym gabinecie w Polsce wynosi 320 PLN. Jeśli agent odbierze 5 połączeń dziennie, które dotychczas były nieodebrane po godzinach pracy (rozsądne założenie dla gabinetu bez całodobowej recepcji), i zamieni je na wizyty ze skutecznością 50%, to miesięcznie to 75 dodatkowych wizyt × 320 PLN = 24 000 PLN przychodu. Koszt agenta: 200 PLN. Stosunek 1:120.
To oczywiście scenariusz optymistyczny. Bardziej zachowawcze założenie: agent skutecznie rezerwuje 2 dodatkowe wizyty dziennie → 60 wizyt miesięcznie → 19 200 PLN przychodu przy koszcie 200 PLN. Nawet przy najgorszym scenariuszu ROI przekracza 50:1. Szczegółowy kalkulator strat na nieodebranych połączeniach znajdziesz w artykule o ochronie nieodebranych połączeń w klinice stomatologicznej.
Dental Business Lab (Dental OS) – dlaczego natywna integracja ma znaczenie
Większość gabinetów, które próbują samodzielnie wdrożyć ElevenLabs Agents, zatrzymuje się na etapie 3 – integracji z ERP. Systemy takie jak Kamsoft KS-SOMED czy Mediporta nie mają publicznego REST API dostosowanego do webhooków ElevenLabs. Programista musi napisać middleware od zera, przetestować je i utrzymywać przy każdej aktualizacji ERP. To realne koszty: 2 000–5 000 PLN za wdrożenie i 500–1 000 PLN miesięcznie za utrzymanie.
Dental OS jako jedyny polski system ERP dla klinik stomatologicznych ma natywną integrację z ElevenLabs Agents 2.0 (aktualizacja z maja 2026). Endpoint /api/v2/appointments jest udokumentowany, wersjonowany i wspierany przez zespół Dental Business Lab. Gdy ElevenLabs wypuści wersję 3.0, aktualizacja integracji będzie po stronie DBL – nie po stronie gabinetu. To różnica między produktem a projektem.
Dental OS spełnia też wymogi regulacyjne, które w 2026 roku obowiązują każdy polski gabinet: KSeF 2.0 FA(3) dla faktur elektronicznych, P1 CeZ (CDA R2) dla e-dokumentacji medycznej, FHIR R5 dla wymiany danych klinicznych i NIS2 dla bezpieczeństwa cybernetycznego. Bartosz Cruz, founder CLEARWISE sp. z o.o. i twórca Dental OS, szczegółowo omawia architekturę tych integracji na bartoszcruz.com. Jeśli chcesz zrozumieć, jak AI zmienia zarządzanie gabinetem od strony biznesowej – tam znajdziesz zarówno case studies, jak i materiały ze szkoleń AI Expert Academy.
Dla dentystów i menedżerów klinik, którzy chcą samodzielnie konfigurować takie systemy, AI Expert Academy prowadzi dedykowany moduł "AI w gabinecie stomatologicznym" – obejmujący ElevenLabs Agents, automatyzację marketingu i zgodność z RODO dla AI. Kolejna edycja rusza w czerwcu 2026.
Jeśli rozważasz zmianę systemu ERP lub chcesz dowiedzieć się, jak Dental OS wypada w porównaniu z Kamsoft KS-SOMED, Mediportą i Dental4Windows, sprawdź nasze zestawienia porównawcze systemów lub odwiedź stronę dla klinik stomatologicznych, gdzie znajdziesz szczegółowy opis funkcji i cennik.
Najczęstsze pytania (FAQ)
Czy ElevenLabs Agents spełnia wymogi RODO dla danych zdrowotnych?
Sam ElevenLabs nie spełnia wymogów RODO art. 9 w domyślnej konfiguracji, bo przechowuje dane na serwerach w USA. Spełnienie wymogów wymaga: wyłączenia przechowywania rozmów w ElevenLabs (Disable conversation storage), podpisania DPA z ElevenLabs jako podmiotem przetwarzającym i przesyłania nagrań do EU-only storage przez webhook. Dental OS realizuje to automatycznie przez OVHcloud HDS Warszawa.
Ile kosztuje ElevenLabs Agents dla gabinetu z 20 połączeniami dziennie?
Szacunkowy koszt miesięczny to 25–40 USD (ok. 100–160 PLN). Na to składają się: plan ElevenLabs Creator (22 USD/mies.), koszt modelu językowego (5–10 USD) i koszt Twilio za minuty połączeń (ok. 5–8 USD przy 20 połączeniach × 2 minuty). Dla Dental OS integracja z agentem jest wliczona w cenę planu systemu ERP.
Czy agent może obsługiwać pacjentów mówiących po ukraińsku?
Tak. ElevenLabs Agents 2.0 obsługuje automatyczne wykrywanie języka (Language Detection). Gdy agent usłyszy ukraiński, przełącza się na ukraiński głos i model skonfigurowany dla tego języka. Wymaga to ustawienia modelu Claude 3.7 Sonnet (obsługuje ukraiński natywnie) i dodania ukraińskich instrukcji do system promptu.
Jak długo trwa wdrożenie ElevenLabs Agents w gabinecie z Dental OS?
Wdrożenie z Dental OS trwa 4–6 godzin roboczych: 1 godzina na konfigurację agenta, 1,5 godziny na konfigurację numeru Twilio i bramki SIP, 2 godziny na testy i dopracowanie promptu, 30 minut na uruchomienie produkcyjne. Bez Dental OS (ręczna integracja z innym ERP) czas wdrożenia wzrasta do 2–4 tygodni.
Co się dzieje, gdy ERP nie odpowiada podczas rozmowy z pacjentem?
Agent musi mieć zdefiniowaną ścieżkę awaryjną w system promptie. Gdy webhook zwraca błąd, agent informuje pacjenta, że rezerwacja online jest chwilowo niedostępna, i proponuje oddzwonienie przez recepcję lub pozostawienie numeru do kontaktu. Dental OS generuje alert e-mail i SMS dla menedżera kliniki przy każdym błędzie webhookiem powyżej 30 sekund przerwy.

