Studio · Applicativi AI su Google Cloud · Italia

Tra il vostro telefono
e l'intelligenza artificiale,
un interprete simultaneo.
Lo costruiamo noi.

Costruiamo assistenti vocali AI, automazioni documentali e integrazioni su misura su Google Cloud. Software che risponde al telefono, consulta CRM e calendari, legge documenti e trasforma conversazioni e file in dati utilizzabili.

SipAiGateway, il ponte tra rete telefonica e modelli AI di Google, è il caso più visibile. La stessa logica si applica a knowledge base, workflow interni e processi aziendali.

Studio · Anno2026
Stack coreGCP
Latenza voce target<900ms
Residenza datiUE
DEMO · Assistente Sanitario · esempio
00:42
Chiamante Buongiorno, avrei bisogno di prenotare una visita cardiologica, magari questa settimana…
Agente AI Certo, vedo subito. È un primo accesso o un controllo?
Chiamante È un controllo. Anzi, scusi: preferirei giovedì pomeriggio.
Agente AI Nessun problema, adatto subito la ricerca. Sto verificando le disponibilità di giovedì pomeriggio per cardiologia di controllo…verifica calendario
IntentPrenotazione
Sentiment● Positivo
AzioneCalendario
Manifesto — 00

Due professionisti, applicativi AI su misura.

Sviluppiamo software che porta l'AI di Google Cloud dentro i processi delle aziende: assistenti vocali che prenotano e rispondono, analisi documentale automatizzata, integrazioni con CRM, calendari, ticketing e knowledge base.

01
Real-Time Audio

Conversazioni naturali, in tempo reale.

Niente IVR a menu, niente silenzi tra un turno e l'altro, niente voci robotiche. Il sistema ascolta, elabora e risponde con tempi da conversazione naturale — e sa anche quando tacere.

Latenza conversazionale
Risposte vocali intorno ai 900ms quando non servono tool esterni; se deve consultare sistemi, l'AI gestisce l'attesa.
Ascolto attivo e interruzioni
Se l'utente interviene, l'AI si ferma, riadatta il contesto e riparte senza perdere il filo.
Modulazione del tono
Tono e ritmo si adattano allo stato del chiamante.
Turno di dialogo · 01:24 ● LIVE
AI
Perfetto. Le sto riassumendo la policy di rimborso: entro 14 giorni ha diritto a…
Turno AI · interrotto
U
Scusi, ma la fattura è intestata a mia moglie.
Interruzione rilevata a 0.4s
AI
Capito, nessun problema. Allora il rimborso può essere richiesto direttamente da lei, a suo nome. Posso avere il codice fiscale della titolare?
Contesto riadattato state.update
U
Aspetti un attimo, non la trovo… ah eccola.
Pausa naturale 1.9s affective: paziente
AI
Con calma. Sono qui quando ce l'ha.
Risposta empatica generata
02
Un cervello · Più scenari

Modulare per design. Multi-canale, multi-tenant.

Non un software pacchettizzato per un settore. Un motore configurabile — omnicanale, multi-tenant, personalizzabile per ogni cliente.

Omnicanalità
Telefono, WhatsApp, SMS, Email — il contesto del cliente segue ogni canale senza strappi.
Multi-tenancy
Ogni brand con la propria voce, le proprie regole, una sola console.
App native
App native per Android e Windows — operatori e clienti vedono stato e dati in tempo reale.
Configurazione tenant · demo-clinic-01 4 canali attivi
Voce · SIP
142 attive
WhatsApp
87 chat
Email + SMS
31 ticket
Core · Orchestratore intelligente SHARED
Un unico cervello. Quattro personalità. Stesso stato condiviso.
Aria · Concierge
Dott. Vox · Triage
Noa · Sales
Max · Support
03
Integrazioni · Azioni reali

AI che esegue azioni, non solo conversa.

Mentre conversa, l'assistente recupera la scheda cliente, verifica ordini o slot disponibili, consulta la knowledge base e prepara la conferma. La complessità tecnica resta dietro l'interfaccia.

Schede e ordini mentre parla
Durante la chiamata recupera storico cliente, stato ordine e dati di contatto dai sistemi aziendali.
Risposte da documenti aziendali
Quando una domanda richiede manuali, policy o ticket storici, consulta la knowledge base privata e restituisce una risposta contestualizzata.
Gestione dell'attesa
Intermezzi vocali naturali mentre il sistema lavora. Niente silenzi imbarazzanti.
Trace · turn #14 ● ~6s total
crm.lookup_customer()
Recupero profilo cliente e storico ordini
args: {phone:"+39…"}0.4s
rag.search_kb()
Ricerca semantica su 1.274 documenti tecnici
query: "errore firmware v2.3"5.6s
calendar.check_availability()
Verifica slot liberi del tecnico specializzato
range: giovedì · 14–18in corso…
sms.send_confirmation()
Conferma con link e modulo pre-compilato
in attesa
Intermezzo vocale generato
"Mi dia solo un attimo, sto verificando a sistema…"
04
Dati · Conoscenza continua

Le conversazioni diventano dati.

La chiamata non finisce quando si chiude. Il dialogo viene compreso, strutturato, indicizzato — e diventa il dataset proprietario dell'azienda.

Tracciabilità
Ogni dialogo trascritto, indicizzato, esplorabile. Trend e opportunità emergono dai dati.
Struttura + vettori
L'AI estrae entità in SQL relazionale e indicizza embedding per ricerca semantica.
Fondamenta per il ML
Dataset proprietari ad alta qualità per modelli predittivi su misura.
Pipeline · conversations → warehouse +148 oggi
Input · trascritto
"…vorrei prenotare una manutenzione per la caldaia, è da circa due settimane che fa un rumore strano quando si accende…"
Output · entità estratte
intentservice_request
productcaldaia
issuerumore_anomalo
duration2_settimane
sentimentpreoccupato
Trend · intent per ora (ultime 24h)
Architettura — 05

Costruita su Google Cloud.

Progettiamo l'infrastruttura su Google Cloud Platform: Vertex AI per i modelli, GKE per l'orchestrazione, AlloyDB per i dati, Secret Manager per le chiavi. Residenza dati in Europa, progettazione secondo principi GDPR.

Come funziona davvero

L'interprete simultaneo SIP ↔ Vertex.

Logo del prodotto AI Gateway
AI Gateway
L'applicativo Bintware che fa da interprete in tempo reale tra la rete telefonica e Vertex AI di Google Cloud. Backend di servizio e app desktop, Android e iOS per la gestione operativa.

Quando una persona alza la cornetta e parla con un'AI di Google, da una parte c'è il formato della rete telefonica — un protocollo vecchio di decenni, pensato per i telefoni — dall'altra un cervello digitale che ragiona in tempo reale. Sono due lingue diverse. In mezzo, il nostro software fa l'interprete.

Diagramma del flusso bidirezionale tra telefono e Vertex AI: voce in entrata via RTP 8 kHz convertita a PCM 16 kHz su WebSocket verso Vertex; risposta in PCM 24 kHz dal cloud riconvertita a RTP 8 kHz verso la cornetta. Il gateway Bintware sta al centro.
Due flussi paralleli e indipendenti tra telefono e Vertex AI · Bintware AI Gateway
SIP → Vertex

La voce del chiamante viene ripulita e riconfezionata in pacchetti che l'AI di Google sa leggere, inviati pezzo dopo pezzo, senza aspettare la fine della frase.

Vertex → SIP

La voce sintetica generata dall'AI viene riadattata al formato della telefonia tradizionale e rispedita alla cornetta in tempo reale.

I due flussi corrono in parallelo, contemporaneamente. Una persona può anche interrompere l'altra — proprio come in una conversazione vera. È questa simultaneità la parte difficile da far funzionare bene.

Canali di contatto 01 — INGRESS
Telefonia SIP WhatsApp Business API SMS gateway Email (SMTP/IMAP) App Android / Windows
02 · Cognitive
Vertex AI
Modelli Gemini multimodali, audio real-time, ragionamento avanzato.
Gemini 2.x Audio RT Affective
03 · Orchestration
GKE Cluster
Google Kubernetes Engine — scaling automatico, multi-region.
Autoscale Multi-tenant HPA
04 · Realtime
Compute Engine · VM
VM ad alte prestazioni per media pipeline e inference low-latency.
Low-lat GPU pool
05 · Relational
AlloyDB · PostgreSQL
Database relazionale gestito per entità strutturate e transazioni.
SQL ACID Managed
06 · Vector / RAG
Vertex Vector Search
Indicizzazione semantica della knowledge base aziendale.
Embeddings kNN Semantic
07 · Integrations
Function Calling Hub
Connettori verso CRM, ERP, calendari, ticketing, wiki aziendali.
REST Webhook OAuth2
Sicurezza · Privacy · Compliance 08 — FOUNDATION
Secret Manager VPC privata · zero trust IAM granulare Residenza dati EU GDPR-by-design Audit log completo
Scenari — 06

Quattro settori, uno schema comune.

Prendiamo qualcosa che vi porta via ore — una conversazione, un audio, una visita — e lo trasformiamo in dati pronti all'uso.

Illustrazione: silhouette di un operatore che parla in un microfono mentre un report strutturato con bullet point e checkbox si materializza dall'altra parte; un piccolo orologio in alto richiama il tempo risparmiato.
Scenario · 01 · Scuola / Supporto sociale

Report giornalieri parlati, non scritti.

Gli operatori che seguono studenti con difficoltà passano ogni giorno mezz'ora o più a redigere report. Con un'AI con cui parlare per 6–7 minuti in forma anonima sui ragazzi, restituiamo un report strutturato e i parametri pronti per essere analizzati nel tempo.

~10 min con AI · contro ≥30 min manuali, ogni giorno per operatore
ScuolaSupporto socialeReport automatici
Illustrazione: a sinistra una colonna disordinata di messaggi vocali con icone play e onde audio; al centro frecce arancioni che indicano la trasformazione; a destra una lista pulita e ordinata di voci con etichette di priorità High, Normal, Low.
Scenario · 02 · Voicemail intelligente

Segreterie telefoniche che si leggono in 10 secondi.

Decine di messaggi vocali al giorno, nessuno ha tempo di riascoltarli uno a uno. L'AI trasforma ogni messaggio in testo, ne estrae motivo, urgenza e contatti, e lo consegna al team in formato leggibile e ricercabile.

Nessuna chiamata persa · contatti gestiti per priorità
VoicemailSpeech-to-textLead intake
Scopri la soluzione Voicemail →
Illustrazione: due silhouettes sedute a un tavolo durante una conversazione clinica, con sopra una sottile onda di ascolto che rappresenta l'AI in osservazione, e a fianco un pannello con appunti strutturati e segni di verifica.
Scenario · 03 · Sanità / Studi medici privati

Un secondo paio di orecchie dentro la visita.

L'AI ascolta la visita e svolge due compiti distinti — supporto organizzativo (struttura gli appunti, prepara il referto) e supporto cognitivo (suggerisce valutazioni, segnala possibili sviste). Mai sostitutivo del giudizio clinico: sempre integrativo. I dati strutturati nel tempo abilitano analisi longitudinali sui pazienti che ritornano.

Visite più ordinate · secondo punto di vista in tempo reale
SanitàAffectiveSupporto cognitivo
Scopri il secondo paio di orecchie →
Illustrazione: a sinistra una pila caotica di documenti e onde audio; al centro un flusso di frecce arancioni che attraversa una clessidra; a destra una scheda strutturata con una griglia di caselle quasi tutte compilate.
Scenario · 04 · Studi legali / Compliance e analisi documentale

Da 3 ore di registrazione a 200 campi compilati in 25 minuti.

Per attività di compliance e analisi documentale — audit, due diligence, valutazioni normative — gli avvocati ascoltano ore di meeting e compilano a mano schede con centinaia di campi. L'AI trascrive 3 ore in ~15 min e popola automaticamente la scheda con i 200 campi richiesti.

~25 minuti totali · contro giorni di lavoro manuale per pratica
LegaleComplianceDocument AI

Il vostro settore non è qui? La logica è sempre la stessa: voce, audio o documenti da capire e trasformare in informazioni utilizzabili. Si può applicare ovunque.

Parliamone →
Come lavoriamo — 07

Quattro modi di iniziare. Trasparenti.

Ogni progetto è diverso, ma il percorso è chiaro. Si parte sempre con una conversazione gratuita, si scala solo quando ha senso. I costi dettagliati di setup, infrastruttura cloud e utilizzo AI sono nel listino dedicato.

01
Discovery Call
30 minuti Gratuita
Capiamo se ha senso. Ti raccontiamo come affronteremmo il tuo caso d'uso, quali tecnologie useremmo, quali rischi vediamo. Senza impegno.
Prenota →
03
Prototipo · Pilot
4 – 6 settimane Vedi listino →
Costruiamo un MVP funzionante con i tuoi dati. Operativo su un perimetro definito — un canale, un caso d'uso, un team. Misurabile.
Parliamone →
04
Production Build
3 – 6 mesi Su misura
Implementazione completa: integrazione coi sistemi esistenti, training del team, documentazione, SLA. Engagement continuativo opzionale.
Parliamone →
Listino — 08

Quanto costa, esattamente.

Modello di pricing logico e progressivo: setup una tantum, infrastruttura cloud mensile, utilizzo AI a consumo. Niente preventivi sorpresa.

01

Setup iniziale

Configurazione di tutti i dati e attribuzione della corretta struttura cloud per avviare il progetto alle migliori condizioni.

Una tantum € 1.500
03

Modalità di utilizzo · scegli il piano

Setup (01) e canone (02) sono identici nei due piani. Cambia cosa fa il sistema quando il telefono squilla. In entrambi i casi il servizio non si interrompe per superamento di soglie: avvisi, mai blocchi automatici.

Piano A · Punto di ingresso

Voicemail analisi

Il chiamante lascia un messaggio come a una segreteria normale. L'AI lavora in background: trascrive, struttura, recapita un ticket pronto da gestire al referente giusto.

  • Trascrizione e analisi semantica del messaggio vocale
  • Estrazione automatica dei dati (nome, numero, motivo, urgenza)
  • Recapito al referente giusto · email, dashboard, integrazione CRM
  • Reportistica direzionale: SLA di richiamo, performance commerciali
Costo aggiuntivo incluso nel canone

Fair-use 1.000 messaggi voicemail elaborati/mese inclusi. Oltre soglia: avvisi al 70% e 90%, ricalibrazione consensuale del canone — il servizio non si interrompe.

Piano B · Evoluzione tecnologica

Voicemail realtime · IA conversazionale

L'AI risponde dal primo squillo, dialoga col chiamante, conferma appuntamenti, prequalifica le richieste. Tutto il backend del Piano A — ma in tempo reale.

  • Risposta dal primo squillo · niente attesa, niente "bip" della segreteria
  • Conversazione bidirezionale · domande di chiarimento, conferme dirette
  • Pre-qualificazione del lead durante la chiamata stessa
  • Tutto il backend del Piano A incluso: trascrizione, estrazione dati, ticket, reportistica
Costo aggiuntivo · sui minuti di conversazione effettiva
Interazione standard € 0,15 /min
  • Conversazione realtime con AI
  • Report post-conversazione: sola trascrizione
04

Enterprise & Custom

Per architetture non standard ed esigenze di sviluppo estreme. In caso di necessità complesse — GKE, comportamenti DB non standard, function call avanzate, workflow di post-analisi articolati — i costi standard non sono applicabili. Si stila un progetto dedicato con preventivo basato sulle tariffe consulenziali per giornata.

Tariffe per diem
Principal Enterprise Architect € 900 – 1.200 / giorno
Junior AI Solutions Engineer € 400 – 600 / giorno
Standard incluso · Custom a progetto

Una logica unica per tutti i servizi del catalogo

Il listino sopra vale trasversalmente per tutti i servizi Bintware — voicemail aziendale, supporto al medico durante la visita, analisi documentale, agenti vocali. Il report standard di ogni servizio è incluso nel costo a consumo: niente sovrapprezzi sul singolo report, niente sorprese in fattura.

Per pipeline su misura — flussi non standard, integrazioni con software gestionali specifici, modelli costruiti sui dati del cliente, analisi longitudinali con dataset proprietari — il costo si concorda a progetto secondo il listino enterprise (voce 04). È la differenza tra "compri un servizio dal catalogo" e "ci progetti insieme un sistema dedicato".

In nessun caso il servizio si interrompe per superamento di soglie di consumo. Avvisi al 70% e al 90%, conversazione esplicita, mai blocchi automatici.

I prezzi sono indicativi e soggetti a variazioni in base alle modifiche dei listini di Google Cloud Platform e dei provider di modelli LLM.
Accesso ai dati — 09

I tuoi dati, sempre con te.

Trascrizioni, ticket strutturati, report e analisi non restano in una console isolata. Sono accessibili in ogni momento da tre interfacce diverse sullo stesso database — pensate per momenti d'uso diversi, ma con le stesse regole di sicurezza e conformità.

01
Console web Bintware
Interfaccia primaria di gestione, accessibile da qualunque browser senza installazione. Pensata per l'uso operativo durante la giornata di lavoro: revisione di trascrizioni, controllo dei ticket aperti, lettura dei report.
02
App desktop · Windows e macOS
Applicativo nativo per uso intensivo: trascrizione live in studio o in azienda, ricerca veloce sull'archivio, esportazioni. Per chi lavora ogni giorno con flussi strutturati e vuole un'esperienza più reattiva del browser.
03
App mobile · Android e iOS
Per consultazioni in mobilità. Rivedere una visita prima di un consulto, controllare lo storico di un cliente fuori sede, condividere rapidamente un report con un collega. I dati ti seguono, sempre nel perimetro GDPR.

Tutti i canali rispettano le stesse regole di accesso — autenticazione, profili autorizzativi distinti per ruolo, log degli accessi conservati per le esigenze di audit GDPR. I dati restano su Google Cloud europe-west8 (Milano), niente trasferimenti extra-UE.

Come operiamo — 10

Tre principi che teniamo fermi.

In che cosa siamo diversi da una grande consulenza, da un freelance singolo o da una SaaS pacchettizzata.

01
Founder-led
Ogni progetto è seguito personalmente da un architetto. Niente junior, niente delega, niente sorprese in produzione. Parli sempre con chi costruisce.
02
Architecture-first
Prima del codice scriviamo un documento di architettura. Tu sai cosa stiamo costruendo, perché, e quanto costa — prima che parta una sola riga.
03
Senza lock-in
Il sistema costruito appartiene all'azienda. Documentato, gestibile e portabile — può essere mantenuto e fatto evolvere anche senza di noi.
Blog — 11

Appunti dallo studio.

Idee, esperimenti, casi d'uso e scelte tecniche dal nostro lavoro quotidiano con l'AI generativa su Google Cloud.

Caso d'uso In arrivo

10 minuti di AI valgono mezz'ora di scrittura.

Quando un report parlato vale più di uno scritto.

Prossimamente
Tecnologia In arrivo

AlloyDB e ricerca vettoriale: quando ne vale la pena?

AlloyDB, embedding o vector store: quando usare cosa.

Prossimamente
Contatti — 12

Parliamone, senza impegno.

Trenta minuti di chiamata, gratuiti, per capire insieme se ha senso lavorare insieme. Vi raccontiamo come affronteremmo il vostro caso d'uso, con quali tecnologie, in che tempi e a quali costi.

Prenota la discovery call Vedi l'architettura →
Co-founder · Strategia & Architettura
Riccardo Baldacci

Laureato in Ingegneria Meccanica nel 2023. Sviluppa applicativi in C# e Python da 3 anni e lavora con Google Cloud Platform e AI generativa da 3 anni.

Per discovery call, valutazioni del vostro caso d'uso e architecture review.
Co-founder · Engineering & Cloud
Luca Baldacci

Trent'anni di esperienza nel settore IT, dirigente IT presso Irplast (Empoli). Lavora con Google Cloud Platform e AI generativa da 3 anni, specializzato in C# e database relazionali (PostgreSQL, AlloyDB).

Per approfondimenti tecnici, integrazioni e progetti di architettura cloud su misura.