Что такое голосовой MCP-провайдер и зачем он AI-агенту?
MCP (Model Context Protocol) — открытый стандарт, через который AI-агент получает доступ к внешним инструментам: базы данных, поиск, файловые системы. Голосовой MCP-провайдер добавляет в этот набор канал звонков и SMS: ваш агент может позвонить клиенту, отправить SMS, запланировать callback через одну функцию-tool. Stexa — первый голосовой MCP-провайдер с поддержкой русскоязычных AI-агентов и ФЗ-152 compliance (на момент мая 2026). В реестрах Smithery + mcp.so числится 9 400+ MCP-серверов, ни один из них не закрывает телефонию для российского рынка.
Сколько стоит и есть ли бесплатный тариф?
7 дней бесплатно без карты — 100 минут разговоров + 50 tool-call'ов. Далее тариф «Старт» 2 990 ₽/мес (500 минут, 1 номер), «Бизнес» 7 990 ₽/мес (2 000 минут, до 3 номеров). Дополнительные минуты — 4 ₽/мин. Все MCP-tools и API-ключ доступны на всех тарифах, включая trial. Регистрация и активация — за 1 минуту, без звонка менеджера и без сбора реквизитов.
Какая латентность от tool-call до момента когда клиент слышит гудок?
Среднее время от приёма JSON-RPC запроса до фактического набора номера в Asterisk — 400-600 мс. Это значительно ниже типичных 2-4 секунд у обычных voice-API через REST. Латентность достигается за счёт прямого моста MCP → Asterisk ARI без промежуточной REST-очереди. Если у вас уже идёт активная сессия с LLM, бот «думает вслух» («секундочку, набираю…») пока инициируется звонок — клиент не слышит тишину.
Как обстоят дела с безопасностью и ФЗ-152?
Bearer-токен per-tenant с возможностью ротации в кабинете. Все запросы по TLS 1.3, серверы Stexa AI в РФ (Yandex Cloud Москва), договор обработки ПДн по поручению по ст. 6 ч. 3 ФЗ-152 подписывается на тарифах от «Бизнес» и выше. В начале каждого исходящего звонка бот проговаривает текст согласия и фиксирует ответ клиента — запись хранится 3 года как юридический документ. OAuth 2.1 PKCE — roadmap Q2 2026, до того момента Bearer-токены вращаются вручную через кабинет.
Какие LLM-провайдеры поддерживаются?
Stexa Voice MCP — это серверная сторона транспорта. На клиенте может быть любой LLM, понимающий MCP: Claude (Anthropic), GPT-4/5 (OpenAI), YandexGPT, GigaChat, локальные модели через LM Studio. Внутри самого Stexa для понимания речи клиента в звонке используется YandexGPT Pro по умолчанию (точность распознавания русской речи 98%), но при использовании MCP-канала LLM-оркестрация остаётся на вашей стороне — мы только исполняем tool-вызовы make_call/send_sms/etc.
Как тестировать без подключения реальной телефонии?
После регистрации в кабинете доступна demo-песочница: фейковый Asterisk, который принимает make_call и логирует JSON-RPC запросы вместо реального звонка. В логах кабинета видна полная трассировка: tool-call → resolved DID → имитация дозвона → mock-транскрипт ответа клиента. Параллельно вы можете позвонить с реального номера на наш sandbox-DID и услышать как ваш агент отвечает голосом. Переход на боевую телефонию (BYO Novofon / Beeline / МТС) — после первого пополнения баланса.
Чем это отличается от обычного Twilio/Vonage REST API?
Twilio/Vonage — REST/Webhook модель: вы пишете backend, регистрируете webhook-URL, при звонке Twilio постит вам JSON, вы отвечаете TwiML. Это требует backend-инфраструктуры и не интегрируется напрямую в LLM-агент. MCP-модель Stexa: ваш AI-агент сам становится клиентом, без backend между ним и телефонией. В Claude Desktop добавляется одна строка в config.json, и LLM получает tool make_call в свой контекст. Никакого webhook-сервера. Для AI-агентов это on-ramp без code.