Studio · Applicativi AI su Google Cloud · Italia

Tra il vostro telefono
e l'intelligenza artificiale,
un interprete simultaneo.
Lo costruiamo noi.

Costruiamo assistenti vocali AI, automazioni documentali e integrazioni su misura su Google Cloud. Software che risponde al telefono, consulta CRM e calendari, legge documenti e trasforma conversazioni e file in dati utilizzabili.

SipAiGateway, il ponte tra rete telefonica e modelli AI di Google, è il caso più visibile. La stessa logica si applica a knowledge base, workflow interni e processi aziendali.

Prenota una call Vedi cosa costruiamo →

Studio · Anno2026

Stack coreGCP

Latenza voce target<900ms

Residenza datiUE

DEMO · Assistente Sanitario · esempio

00:42

Chiamante Buongiorno, avrei bisogno di prenotare una visita cardiologica, magari questa settimana…

Agente AI Certo, vedo subito. È un primo accesso o un controllo?

Chiamante È un controllo. Anzi, scusi: preferirei giovedì pomeriggio.

Agente AI Nessun problema, adatto subito la ricerca. Sto verificando le disponibilità di giovedì pomeriggio per cardiologia di controllo…verifica calendario

IntentPrenotazione

Sentiment● Positivo

AzioneCalendario

Manifesto — 00

Due professionisti, applicativi AI su misura.

Sviluppiamo software che porta l'AI di Google Cloud dentro i processi delle aziende: assistenti vocali che prenotano e rispondono, analisi documentale automatizzata, integrazioni con CRM, calendari, ticketing e knowledge base.

Real-Time Audio

Conversazioni naturali, in tempo reale.

Niente IVR a menu, niente silenzi tra un turno e l'altro, niente voci robotiche. Il sistema ascolta, elabora e risponde con tempi da conversazione naturale — e sa anche quando tacere.

Latenza conversazionale

Risposte vocali intorno ai 900ms quando non servono tool esterni; se deve consultare sistemi, l'AI gestisce l'attesa.

Ascolto attivo e interruzioni

Se l'utente interviene, l'AI si ferma, riadatta il contesto e riparte senza perdere il filo.

Modulazione del tono

Tono e ritmo si adattano allo stato del chiamante.

Turno di dialogo · 01:24 ● LIVE

AI

              Perfetto. Le sto riassumendo la policy di rimborso: entro 14 giorni ha diritto a…
              Turno AI · interrotto
U

              Scusi, ma la fattura è intestata a mia moglie.
              Interruzione rilevata a 0.4s
AI

              Capito, nessun problema. Allora il rimborso può essere richiesto direttamente da lei, a suo nome. Posso avere il codice fiscale della titolare?
              Contesto riadattato state.update
U

              Aspetti un attimo, non la trovo… ah eccola.
              Pausa naturale 1.9s affective: paziente
AI

              Con calma. Sono qui quando ce l'ha.
              Risposta empatica generata

Un cervello · Più scenari

Modulare per design. Multi-canale, multi-tenant.

Non un software pacchettizzato per un settore. Un motore configurabile — omnicanale, multi-tenant, personalizzabile per ogni cliente.

Omnicanalità

Telefono, WhatsApp, SMS, Email — il contesto del cliente segue ogni canale senza strappi.

Multi-tenancy

Ogni brand con la propria voce, le proprie regole, una sola console.

App native

App native per Android e Windows — operatori e clienti vedono stato e dati in tempo reale.

Configurazione tenant · demo-clinic-01 4 canali attivi

Voce · SIP

142 attive

87 chat

Email + SMS

31 ticket

Core · Orchestratore intelligente SHARED

Un unico cervello. Quattro personalità. Stesso stato condiviso.

Aria · Concierge

Dott. Vox · Triage

Noa · Sales

Max · Support

Integrazioni · Azioni reali

AI che esegue azioni, non solo conversa.

Mentre conversa, l'assistente recupera la scheda cliente, verifica ordini o slot disponibili, consulta la knowledge base e prepara la conferma. La complessità tecnica resta dietro l'interfaccia.

Schede e ordini mentre parla

Durante la chiamata recupera storico cliente, stato ordine e dati di contatto dai sistemi aziendali.

Risposte da documenti aziendali

Quando una domanda richiede manuali, policy o ticket storici, consulta la knowledge base privata e restituisce una risposta contestualizzata.

Gestione dell'attesa

Intermezzi vocali naturali mentre il sistema lavora. Niente silenzi imbarazzanti.

Trace · turn #14 ● ~6s total

crm.lookup_customer()

Recupero profilo cliente e storico ordini

args: {phone:"+39…"}0.4s

rag.search_kb()

Ricerca semantica su 1.274 documenti tecnici

query: "errore firmware v2.3"5.6s

calendar.check_availability()

Verifica slot liberi del tecnico specializzato

range: giovedì · 14–18in corso…

sms.send_confirmation()

Conferma con link e modulo pre-compilato

in attesa

Intermezzo vocale generato

"Mi dia solo un attimo, sto verificando a sistema…"

Dati · Conoscenza continua

Le conversazioni diventano dati.

La chiamata non finisce quando si chiude. Il dialogo viene compreso, strutturato, indicizzato — e diventa il dataset proprietario dell'azienda.

Tracciabilità

Ogni dialogo trascritto, indicizzato, esplorabile. Trend e opportunità emergono dai dati.

Struttura + vettori

L'AI estrae entità in SQL relazionale e indicizza embedding per ricerca semantica.

Fondamenta per il ML

Dataset proprietari ad alta qualità per modelli predittivi su misura.

Pipeline · conversations → warehouse +148 oggi

Input · trascritto

"…vorrei prenotare una manutenzione per la caldaia, è da circa due settimane che fa un rumore strano quando si accende…"

Output · entità estratte

intentservice_request

productcaldaia

issuerumore_anomalo

duration2_settimane

sentimentpreoccupato

Trend · intent per ora (ultime 24h)

Architettura — 05

Costruita su Google Cloud.

Progettiamo l'infrastruttura su Google Cloud Platform: Vertex AI per i modelli, GKE per l'orchestrazione, AlloyDB per i dati, Secret Manager per le chiavi. Residenza dati in Europa, progettazione secondo principi GDPR.

Come funziona davvero

L'interprete simultaneo SIP ↔ Vertex.

AI Gateway

L'applicativo Bintware che fa da interprete in tempo reale tra la rete telefonica e Vertex AI di Google Cloud. Backend di servizio e app desktop, Android e iOS per la gestione operativa.

Quando una persona alza la cornetta e parla con un'AI di Google, da una parte c'è il formato della rete telefonica — un protocollo vecchio di decenni, pensato per i telefoni — dall'altra un cervello digitale che ragiona in tempo reale. Sono due lingue diverse. In mezzo, il nostro software fa l'interprete.

Diagramma del flusso bidirezionale tra telefono e Vertex AI: voce in entrata via RTP 8 kHz convertita a PCM 16 kHz su WebSocket verso Vertex; risposta in PCM 24 kHz dal cloud riconvertita a RTP 8 kHz verso la cornetta. Il gateway Bintware sta al centro. — Due flussi paralleli e indipendenti tra telefono e Vertex AI · Bintware AI Gateway

SIP → Vertex

La voce del chiamante viene ripulita e riconfezionata in pacchetti che l'AI di Google sa leggere, inviati pezzo dopo pezzo, senza aspettare la fine della frase.

Vertex → SIP

La voce sintetica generata dall'AI viene riadattata al formato della telefonia tradizionale e rispedita alla cornetta in tempo reale.

I due flussi corrono in parallelo, contemporaneamente. Una persona può anche interrompere l'altra — proprio come in una conversazione vera. È questa simultaneità la parte difficile da far funzionare bene.

Canali di contatto 01 — INGRESS

Telefonia SIP WhatsApp Business API SMS gateway Email (SMTP/IMAP) App Android / Windows

02 · Cognitive

Vertex AI

Modelli Gemini multimodali, audio real-time, ragionamento avanzato.

Gemini 2.x Audio RT Affective

03 · Orchestration

GKE Cluster

Google Kubernetes Engine — scaling automatico, multi-region.

Autoscale Multi-tenant HPA

04 · Realtime

Compute Engine · VM

VM ad alte prestazioni per media pipeline e inference low-latency.

Low-lat GPU pool

05 · Relational

AlloyDB · PostgreSQL

Database relazionale gestito per entità strutturate e transazioni.

SQL ACID Managed

06 · Vector / RAG

Vertex Vector Search

Indicizzazione semantica della knowledge base aziendale.

Embeddings kNN Semantic

07 · Integrations

Function Calling Hub

Connettori verso CRM, ERP, calendari, ticketing, wiki aziendali.

REST Webhook OAuth2

Sicurezza · Privacy · Compliance 08 — FOUNDATION

Secret Manager VPC privata · zero trust IAM granulare Residenza dati EU GDPR-by-design Audit log completo

Scenari — 06

Quattro settori, uno schema comune.

Prendiamo qualcosa che vi porta via ore — una conversazione, un audio, una visita — e lo trasformiamo in dati pronti all'uso.

Illustrazione: silhouette di un operatore che parla in un microfono mentre un report strutturato con bullet point e checkbox si materializza dall'altra parte; un piccolo orologio in alto richiama il tempo risparmiato.

Scenario · 01 · Scuola / Supporto sociale

Report giornalieri parlati, non scritti.

Gli operatori che seguono studenti con difficoltà passano ogni giorno mezz'ora o più a redigere report. Con un'AI con cui parlare per 6–7 minuti in forma anonima sui ragazzi, restituiamo un report strutturato e i parametri pronti per essere analizzati nel tempo.

→ ~10 min con AI · contro ≥30 min manuali, ogni giorno per operatore

ScuolaSupporto socialeReport automatici

Illustrazione: a sinistra una colonna disordinata di messaggi vocali con icone play e onde audio; al centro frecce arancioni che indicano la trasformazione; a destra una lista pulita e ordinata di voci con etichette di priorità High, Normal, Low.

Scenario · 02 · Voicemail intelligente

Segreterie telefoniche che si leggono in 10 secondi.

Decine di messaggi vocali al giorno, nessuno ha tempo di riascoltarli uno a uno. L'AI trasforma ogni messaggio in testo, ne estrae motivo, urgenza e contatti, e lo consegna al team in formato leggibile e ricercabile.

→ Nessuna chiamata persa · contatti gestiti per priorità

VoicemailSpeech-to-textLead intake

Scopri la soluzione Voicemail →

Illustrazione: due silhouettes sedute a un tavolo durante una conversazione clinica, con sopra una sottile onda di ascolto che rappresenta l'AI in osservazione, e a fianco un pannello con appunti strutturati e segni di verifica.

Scenario · 03 · Sanità / Studi medici privati

Un secondo paio di orecchie dentro la visita.

L'AI ascolta la visita e svolge due compiti distinti — supporto organizzativo (struttura gli appunti, prepara il referto) e supporto cognitivo (suggerisce valutazioni, segnala possibili sviste). Mai sostitutivo del giudizio clinico: sempre integrativo. I dati strutturati nel tempo abilitano analisi longitudinali sui pazienti che ritornano.

→ Visite più ordinate · secondo punto di vista in tempo reale

SanitàAffectiveSupporto cognitivo

Scopri il secondo paio di orecchie →

Illustrazione: a sinistra una pila caotica di documenti e onde audio; al centro un flusso di frecce arancioni che attraversa una clessidra; a destra una scheda strutturata con una griglia di caselle quasi tutte compilate.

Scenario · 04 · Studi legali / Compliance e analisi documentale

Da 3 ore di registrazione a 200 campi compilati in 25 minuti.

Per attività di compliance e analisi documentale — audit, due diligence, valutazioni normative — gli avvocati ascoltano ore di meeting e compilano a mano schede con centinaia di campi. L'AI trascrive 3 ore in ~15 min e popola automaticamente la scheda con i 200 campi richiesti.

→ ~25 minuti totali · contro giorni di lavoro manuale per pratica

LegaleComplianceDocument AI

Il vostro settore non è qui? La logica è sempre la stessa: voce, audio o documenti da capire e trasformare in informazioni utilizzabili. Si può applicare ovunque.

Parliamone →

Come lavoriamo — 07

Quattro modi di iniziare. Trasparenti.

Ogni progetto è diverso, ma il percorso è chiaro. Si parte sempre con una conversazione gratuita, si scala solo quando ha senso. I costi dettagliati di setup, infrastruttura cloud e utilizzo AI sono nel listino dedicato.

Discovery Call

30 minuti Gratuita

Capiamo se ha senso. Ti raccontiamo come affronteremmo il tuo caso d'uso, quali tecnologie useremmo, quali rischi vediamo. Senza impegno.

Prenota →

Architecture Review

2 – 3 giorni Vedi listino →

Analizziamo il tuo caso d'uso e produciamo un documento di architettura GCP completo: stack, costi mensili stimati, timeline, rischi. Tu lo possiedi.

Richiedi →

Prototipo · Pilot

4 – 6 settimane Vedi listino →

Costruiamo un MVP funzionante con i tuoi dati. Operativo su un perimetro definito — un canale, un caso d'uso, un team. Misurabile.

Parliamone →

Production Build

3 – 6 mesi Su misura

Implementazione completa: integrazione coi sistemi esistenti, training del team, documentazione, SLA. Engagement continuativo opzionale.

Parliamone →

Listino — 08

Quanto costa, esattamente.

Modello di pricing logico e progressivo: setup una tantum, infrastruttura cloud mensile, utilizzo AI a consumo. Niente preventivi sorpresa.

Setup iniziale

Configurazione di tutti i dati e attribuzione della corretta struttura cloud per avviare il progetto alle migliori condizioni.

Una tantum € 1.500

Infrastruttura Cloud · GCP

Ecosistema Google Cloud per garantire continuità, sicurezza e performance.

Totale mensile € 250 /mese

Inclusa nel base € 250 / mese

Risorse cloud (database e applicativo) condivise con altri clienti, con dati separati per garantire sicurezza. Soluzione performante per la maggioranza delle aziende che storicizzano interazioni senza farsi carico di macchine ad uso esclusivo.

Opzioni di potenziamento

Requisito di attivazione: opzioni esclusive (VM o DB dedicati) attivabili solo se il progetto prevede almeno 3 servizi AI distinti — applicativi diversi che usano prompt, function call, post-analisi o operazioni differenziate.

Modalità di utilizzo · scegli il piano

Setup (01) e canone (02) sono identici nei due piani. Cambia cosa fa il sistema quando il telefono squilla. In entrambi i casi il servizio non si interrompe per superamento di soglie: avvisi, mai blocchi automatici.

Piano A · Punto di ingresso

Voicemail analisi

Il chiamante lascia un messaggio come a una segreteria normale. L'AI lavora in background: trascrive, struttura, recapita un ticket pronto da gestire al referente giusto.

Trascrizione e analisi semantica del messaggio vocale
Estrazione automatica dei dati (nome, numero, motivo, urgenza)
Recapito al referente giusto · email, dashboard, integrazione CRM
Reportistica direzionale: SLA di richiamo, performance commerciali

Costo aggiuntivo incluso nel canone

Fair-use 1.000 messaggi voicemail elaborati/mese inclusi. Oltre soglia: avvisi al 70% e 90%, ricalibrazione consensuale del canone — il servizio non si interrompe.

Piano B · Evoluzione tecnologica

Voicemail realtime · IA conversazionale

L'AI risponde dal primo squillo, dialoga col chiamante, conferma appuntamenti, prequalifica le richieste. Tutto il backend del Piano A — ma in tempo reale.

Risposta dal primo squillo · niente attesa, niente "bip" della segreteria
Conversazione bidirezionale · domande di chiarimento, conferme dirette
Pre-qualificazione del lead durante la chiamata stessa
Tutto il backend del Piano A incluso: trascrizione, estrazione dati, ticket, reportistica

Costo aggiuntivo · sui minuti di conversazione effettiva

Interazione standard € 0,15 /min

Conversazione realtime con AI
Report post-conversazione: sola trascrizione

Consigliato

Interazione + post-analisi € 0,20 /min

Conversazione realtime con AI
Trascrizione completa inclusa
Report analitico: l'LLM genera un'analisi strutturata post-conversazione, definita in fase di setup

Enterprise & Custom

Per architetture non standard ed esigenze di sviluppo estreme. In caso di necessità complesse — GKE, comportamenti DB non standard, function call avanzate, workflow di post-analisi articolati — i costi standard non sono applicabili. Si stila un progetto dedicato con preventivo basato sulle tariffe consulenziali per giornata.

Tariffe per diem

Principal Enterprise Architect € 900 – 1.200 / giorno

Junior AI Solutions Engineer € 400 – 600 / giorno

Standard incluso · Custom a progetto

Una logica unica per tutti i servizi del catalogo

Il listino sopra vale trasversalmente per tutti i servizi Bintware — voicemail aziendale, supporto al medico durante la visita, analisi documentale, agenti vocali. Il report standard di ogni servizio è incluso nel costo a consumo: niente sovrapprezzi sul singolo report, niente sorprese in fattura.

Per pipeline su misura — flussi non standard, integrazioni con software gestionali specifici, modelli costruiti sui dati del cliente, analisi longitudinali con dataset proprietari — il costo si concorda a progetto secondo il listino enterprise (voce 04). È la differenza tra "compri un servizio dal catalogo" e "ci progetti insieme un sistema dedicato".

In nessun caso il servizio si interrompe per superamento di soglie di consumo. Avvisi al 70% e al 90%, conversazione esplicita, mai blocchi automatici.

I prezzi sono indicativi e soggetti a variazioni in base alle modifiche dei listini di Google Cloud Platform e dei provider di modelli LLM.

Accesso ai dati — 09

I tuoi dati, sempre con te.

Trascrizioni, ticket strutturati, report e analisi non restano in una console isolata. Sono accessibili in ogni momento da tre interfacce diverse sullo stesso database — pensate per momenti d'uso diversi, ma con le stesse regole di sicurezza e conformità.

Console web Bintware

Interfaccia primaria di gestione, accessibile da qualunque browser senza installazione. Pensata per l'uso operativo durante la giornata di lavoro: revisione di trascrizioni, controllo dei ticket aperti, lettura dei report.

App desktop · Windows e macOS

Applicativo nativo per uso intensivo: trascrizione live in studio o in azienda, ricerca veloce sull'archivio, esportazioni. Per chi lavora ogni giorno con flussi strutturati e vuole un'esperienza più reattiva del browser.

App mobile · Android e iOS

Per consultazioni in mobilità. Rivedere una visita prima di un consulto, controllare lo storico di un cliente fuori sede, condividere rapidamente un report con un collega. I dati ti seguono, sempre nel perimetro GDPR.

Tutti i canali rispettano le stesse regole di accesso — autenticazione, profili autorizzativi distinti per ruolo, log degli accessi conservati per le esigenze di audit GDPR. I dati restano su Google Cloud europe-west8 (Milano), niente trasferimenti extra-UE.

Come operiamo — 10

Tre principi che teniamo fermi.

In che cosa siamo diversi da una grande consulenza, da un freelance singolo o da una SaaS pacchettizzata.

Founder-led

Ogni progetto è seguito personalmente da un architetto. Niente junior, niente delega, niente sorprese in produzione. Parli sempre con chi costruisce.

Architecture-first

Prima del codice scriviamo un documento di architettura. Tu sai cosa stiamo costruendo, perché, e quanto costa — prima che parta una sola riga.

Senza lock-in

Il sistema costruito appartiene all'azienda. Documentato, gestibile e portabile — può essere mantenuto e fatto evolvere anche senza di noi.

Blog — 11

Appunti dallo studio.

Idee, esperimenti, casi d'uso e scelte tecniche dal nostro lavoro quotidiano con l'AI generativa su Google Cloud.

Architettura 15 aprile 2026

Come abbiamo costruito un interprete simultaneo tra SIP e Vertex AI.

Le scelte tecniche dietro il nostro voice gateway.

Leggi: il gateway SIP ↔ Vertex AI →

Caso d'uso In arrivo

10 minuti di AI valgono mezz'ora di scrittura.

Quando un report parlato vale più di uno scritto.

Prossimamente

Tecnologia In arrivo

AlloyDB e ricerca vettoriale: quando ne vale la pena?

AlloyDB, embedding o vector store: quando usare cosa.

Prossimamente

Contatti — 12

Parliamone, senza impegno.

Trenta minuti di chiamata, gratuiti, per capire insieme se ha senso lavorare insieme. Vi raccontiamo come affronteremmo il vostro caso d'uso, con quali tecnologie, in che tempi e a quali costi.

Prenota la discovery call Vedi l'architettura →

Co-founder · Strategia & Architettura

Riccardo Baldacci

Laureato in Ingegneria Meccanica nel 2023. Sviluppa applicativi in C# e Python da 3 anni e lavora con Google Cloud Platform e AI generativa da 3 anni.

Per discovery call, valutazioni del vostro caso d'uso e architecture review.

r.baldacci@bintware.com → LinkedIn →

Co-founder · Engineering & Cloud

Luca Baldacci

Trent'anni di esperienza nel settore IT, dirigente IT presso Irplast (Empoli). Lavora con Google Cloud Platform e AI generativa da 3 anni, specializzato in C# e database relazionali (PostgreSQL, AlloyDB).

Per approfondimenti tecnici, integrazioni e progetti di architettura cloud su misura.

l.baldacci@bintware.com → LinkedIn →