Come abbiamo costruito un interprete simultaneo tra SIP e Vertex AI.
Le scelte tecniche dietro il nostro voice gateway.
Leggi: il gateway SIP ↔ Vertex AI →Costruiamo assistenti vocali AI, automazioni documentali e integrazioni su misura su Google Cloud. Software che risponde al telefono, consulta CRM e calendari, legge documenti e trasforma conversazioni e file in dati utilizzabili.
SipAiGateway, il ponte tra rete telefonica e modelli AI di Google, è il caso più visibile. La stessa logica si applica a knowledge base, workflow interni e processi aziendali.
Sviluppiamo software che porta l'AI di Google Cloud dentro i processi delle aziende: assistenti vocali che prenotano e rispondono, analisi documentale automatizzata, integrazioni con CRM, calendari, ticketing e knowledge base.
Niente IVR a menu, niente silenzi tra un turno e l'altro, niente voci robotiche. Il sistema ascolta, elabora e risponde con tempi da conversazione naturale — e sa anche quando tacere.
Non un software pacchettizzato per un settore. Un motore configurabile — omnicanale, multi-tenant, personalizzabile per ogni cliente.
Mentre conversa, l'assistente recupera la scheda cliente, verifica ordini o slot disponibili, consulta la knowledge base e prepara la conferma. La complessità tecnica resta dietro l'interfaccia.
La chiamata non finisce quando si chiude. Il dialogo viene compreso, strutturato, indicizzato — e diventa il dataset proprietario dell'azienda.
Progettiamo l'infrastruttura su Google Cloud Platform: Vertex AI per i modelli, GKE per l'orchestrazione, AlloyDB per i dati, Secret Manager per le chiavi. Residenza dati in Europa, progettazione secondo principi GDPR.
Quando una persona alza la cornetta e parla con un'AI di Google, da una parte c'è il formato della rete telefonica — un protocollo vecchio di decenni, pensato per i telefoni — dall'altra un cervello digitale che ragiona in tempo reale. Sono due lingue diverse. In mezzo, il nostro software fa l'interprete.
La voce del chiamante viene ripulita e riconfezionata in pacchetti che l'AI di Google sa leggere, inviati pezzo dopo pezzo, senza aspettare la fine della frase.
La voce sintetica generata dall'AI viene riadattata al formato della telefonia tradizionale e rispedita alla cornetta in tempo reale.
I due flussi corrono in parallelo, contemporaneamente. Una persona può anche interrompere l'altra — proprio come in una conversazione vera. È questa simultaneità la parte difficile da far funzionare bene.
Prendiamo qualcosa che vi porta via ore — una conversazione, un audio, una visita — e lo trasformiamo in dati pronti all'uso.
Gli operatori che seguono studenti con difficoltà passano ogni giorno mezz'ora o più a redigere report. Con un'AI con cui parlare per 6–7 minuti in forma anonima sui ragazzi, restituiamo un report strutturato e i parametri pronti per essere analizzati nel tempo.
Decine di messaggi vocali al giorno, nessuno ha tempo di riascoltarli uno a uno. L'AI trasforma ogni messaggio in testo, ne estrae motivo, urgenza e contatti, e lo consegna al team in formato leggibile e ricercabile.
L'AI ascolta la visita e svolge due compiti distinti — supporto organizzativo (struttura gli appunti, prepara il referto) e supporto cognitivo (suggerisce valutazioni, segnala possibili sviste). Mai sostitutivo del giudizio clinico: sempre integrativo. I dati strutturati nel tempo abilitano analisi longitudinali sui pazienti che ritornano.
Per attività di compliance e analisi documentale — audit, due diligence, valutazioni normative — gli avvocati ascoltano ore di meeting e compilano a mano schede con centinaia di campi. L'AI trascrive 3 ore in ~15 min e popola automaticamente la scheda con i 200 campi richiesti.
Il vostro settore non è qui? La logica è sempre la stessa: voce, audio o documenti da capire e trasformare in informazioni utilizzabili. Si può applicare ovunque.
Parliamone →Ogni progetto è diverso, ma il percorso è chiaro. Si parte sempre con una conversazione gratuita, si scala solo quando ha senso. I costi dettagliati di setup, infrastruttura cloud e utilizzo AI sono nel listino dedicato.
Modello di pricing logico e progressivo: setup una tantum, infrastruttura cloud mensile, utilizzo AI a consumo. Niente preventivi sorpresa.
Configurazione di tutti i dati e attribuzione della corretta struttura cloud per avviare il progetto alle migliori condizioni.
Ecosistema Google Cloud per garantire continuità, sicurezza e performance.
Risorse cloud (database e applicativo) condivise con altri clienti, con dati separati per garantire sicurezza. Soluzione performante per la maggioranza delle aziende che storicizzano interazioni senza farsi carico di macchine ad uso esclusivo.
Setup (01) e canone (02) sono identici nei due piani. Cambia cosa fa il sistema quando il telefono squilla. In entrambi i casi il servizio non si interrompe per superamento di soglie: avvisi, mai blocchi automatici.
Il chiamante lascia un messaggio come a una segreteria normale. L'AI lavora in background: trascrive, struttura, recapita un ticket pronto da gestire al referente giusto.
Fair-use 1.000 messaggi voicemail elaborati/mese inclusi. Oltre soglia: avvisi al 70% e 90%, ricalibrazione consensuale del canone — il servizio non si interrompe.
L'AI risponde dal primo squillo, dialoga col chiamante, conferma appuntamenti, prequalifica le richieste. Tutto il backend del Piano A — ma in tempo reale.
Per architetture non standard ed esigenze di sviluppo estreme. In caso di necessità complesse — GKE, comportamenti DB non standard, function call avanzate, workflow di post-analisi articolati — i costi standard non sono applicabili. Si stila un progetto dedicato con preventivo basato sulle tariffe consulenziali per giornata.
Il listino sopra vale trasversalmente per tutti i servizi Bintware — voicemail aziendale, supporto al medico durante la visita, analisi documentale, agenti vocali. Il report standard di ogni servizio è incluso nel costo a consumo: niente sovrapprezzi sul singolo report, niente sorprese in fattura.
Per pipeline su misura — flussi non standard, integrazioni con software gestionali specifici, modelli costruiti sui dati del cliente, analisi longitudinali con dataset proprietari — il costo si concorda a progetto secondo il listino enterprise (voce 04). È la differenza tra "compri un servizio dal catalogo" e "ci progetti insieme un sistema dedicato".
In nessun caso il servizio si interrompe per superamento di soglie di consumo. Avvisi al 70% e al 90%, conversazione esplicita, mai blocchi automatici.
Trascrizioni, ticket strutturati, report e analisi non restano in una console isolata. Sono accessibili in ogni momento da tre interfacce diverse sullo stesso database — pensate per momenti d'uso diversi, ma con le stesse regole di sicurezza e conformità.
Tutti i canali rispettano le stesse regole di accesso — autenticazione, profili autorizzativi distinti per ruolo, log degli accessi conservati per le esigenze di audit GDPR. I dati restano su Google Cloud europe-west8 (Milano), niente trasferimenti extra-UE.
In che cosa siamo diversi da una grande consulenza, da un freelance singolo o da una SaaS pacchettizzata.
Idee, esperimenti, casi d'uso e scelte tecniche dal nostro lavoro quotidiano con l'AI generativa su Google Cloud.
Le scelte tecniche dietro il nostro voice gateway.
Leggi: il gateway SIP ↔ Vertex AI →Quando un report parlato vale più di uno scritto.
ProssimamenteAlloyDB, embedding o vector store: quando usare cosa.
ProssimamenteTrenta minuti di chiamata, gratuiti, per capire insieme se ha senso lavorare insieme. Vi raccontiamo come affronteremmo il vostro caso d'uso, con quali tecnologie, in che tempi e a quali costi.
Laureato in Ingegneria Meccanica nel 2023. Sviluppa applicativi in C# e Python da 3 anni e lavora con Google Cloud Platform e AI generativa da 3 anni.
Trent'anni di esperienza nel settore IT, dirigente IT presso Irplast (Empoli). Lavora con Google Cloud Platform e AI generativa da 3 anni, specializzato in C# e database relazionali (PostgreSQL, AlloyDB).