Todos los artículos

¡Prueba y error en la nube no es buena idea!

GCP Search Chatbot: pay as you go o reservar recursos

¡Prueba y error en la nube no es buena idea!
En este artículo

Resumen

En la nube no se puede suponer nada, cada opción que actives o utilices puede reflejarse en tu próxima factura, así que no se puede utilizar el método mundialmente famoso “prueba y error” a menos que tengas dinero de sobra.

Probar todo lo nuevo puede ser una debilidad

Me sumé nuevamente a una de las modas en la época de la IA “los chatbots potenciados con IA”. Escogí Google Cloud Platform (GCP) para construir mi chatbot a escala empresarial. Y como el requerimiento del cliente era un chatbot RAG, GCP es el indicado.

RAG es una tecnología la cual permite al chatbot responder preguntas de una fuente de datos establecida lo que evita que nuestro chatbot invente información.

📌 RAG = Retrieval Augmented Generation. El chatbot busca primero en tus documentos y luego genera la respuesta basada en esa información real, no en suposiciones.

Opciones de aplicaciones que se pueden crear con IA en Google Cloud Console
Figura 1: Opciones de aplicaciones que se pueden crear con IA en Google Cloud Console.

Este tipo de chatbots se factura por interacción y dependiendo de la “inteligencia” que tenga, el precio varía. Comparto el link de la documentación oficial: https://cloud.google.com/generative-ai-app-builder/pricing

No me voy a detener colocando los precios, pero vamos a topar un tema importante: al momento de crear un Data Store para mi chatbot (donde está la información con la cual responde el chatbot), hay que escoger el precio y había dos opciones, una de pago por uso (en la consola aparece como General Pricing) y otra de precios configurables (en la consola aparece como Configurable Pricing).

Al leer esta opción precios configurables yo pensé que podía escoger un máximo o límite de consumo para este elemento, así que también pensé “probemos, a la final ¿qué puede pasar?”. Pues hay que entender algo, cada nube tiene su forma de cobrar el consumo de sus recursos. Me guie solo en las etiquetas, y escogí la nueva opción.

Para darle contexto, activé una cuenta de prueba de $300 dólares y estaba confiado.

Saldo de $300 dólares bien utilizados es oro

Como tip puedo decir que cuando uno activa una cuenta de prueba es mejor no activar el acceso ilimitado a recursos como se ve en la imagen, ya que esto permite utilizar todas las herramientas de GCP pero el consumo en el caso de pasarse los 300$ de prueba ya se descuentan de la tarjeta asociada. Así que para aprender a utilizar GCP basta con no activar esta opción.

📌 Tip: Mantén la cuenta de prueba en modo restringido. El acceso ilimitado conecta tu tarjeta de crédito y los cobros van directo ahí, incluso durante el período de prueba.

Pantalla de activación de acceso ilimitado en GCP
Figura 2: Pantalla de activación de acceso ilimitado a recursos en GCP.

Bueno, sigamos. Escogí la opción de precios configurables.

Pantalla de selección de modelo de precios - Configurable seleccionado
Figura 3: Pantalla de selección de modelo de precios — Configurable seleccionado.

Y al pensar que estoy limitando el consumo, escogí reservar el espacio para 1,000 queries por minuto que va a soportar mi chatbot y reservar un espacio de 50 gigas para que se guarden estos datos. ¿Y qué pasó?

No suponer: la mejor protección contra cobros no esperados

¿Qué pasó exactamente?

Al aplicar esto estaba reservando recursos, lo cual conlleva a que se me cobre por la totalidad de los recursos reservados. Aunque parece obvio, no lo es cuando leí la palabra “threshold” que en el ámbito dev significa un tope. Así que puede llevarnos a equivocarnos.

📌 Por lo pronto ya se cambió esa etiqueta y ahora menciona “MINIMUM” en lugar de “THRESHOLD” Google reconoció que la palabra anterior generaba confusión.

¿Qué es un Data Store y por qué cobra?

El Data Store es la biblioteca de conocimiento de tu chatbot, el lugar donde guardas todos los documentos desde los cuales responde. Cuando lo creas, GCP no solo guarda tus archivos originales: los procesa, los vectoriza y los indexa en su propio espacio optimizado para búsqueda con IA.

Por eso te pide reservar GB (espacio para esa copia indexada) y QPM (capacidad para responder consultas). Es como arrendar una bodega: pagas el espacio aunque no metas nada dentro.

Pay as you go (General Pricing) vs Configurable Pricing: ¿cuál elegir?

Situación Pay as you go (General Pricing) Configurable Pricing
Desarrollo / pruebas / aprendizaje ✅ Ideal ❌ Pagas el mínimo mensual aunque uses 0 queries
Producción con tráfico bajo o medio ✅ Pagas solo lo que se usa ❌ El mínimo puede superar tu consumo real
Producción con +15M queries/mes constantes ⚠️ Puede salir más caro ✅ El costo fijo puede ser menor que pay-per-query

A la final se me terminó todo el saldo promocional sin utilizar nada. Perdí todo el saldo que tenía en esa cuenta free para mi laboratorio.

Bueno, como no utilicé esos recursos…

Al ser una cuenta para estudio, levanté un ticket (caso de soporte) a Google para que puedan analizar el caso. Me hicieron un pequeño ajuste a la cuenta pero al final el saldo era muy pequeño.

Saldo en $0 en la cuenta de GCP
Figura 4: Saldo en $0 en la cuenta de GCP.

Checklist: antes de activar cualquier servicio nuevo en GCP

  • Lee la página de precios oficial del servicio antes de hacer clic en “Create”.
  • Identifica si el cobro es por uso (pay as you go) o por reserva (suscripción mínima).
  • Activa alertas de billing desde el primer día: GCP Console → Billing → Budgets & alerts.
  • En entornos de prueba, usa siempre General pricing / pay as you go.
  • No actives el acceso ilimitado en la cuenta de prueba de $300.
  • Si ves la palabra “Minimum” en un campo de configuración, eso es lo que vas a pagar aunque uses cero.

Después de la tormenta viene la calma

Como moraleja: en la nube no sirve el método de prueba y error. Esta vez al ser una cuenta de prueba me confié probando nuevas opciones. Google Cloud siempre está modernizando sus productos, esto es bueno, pero nos obliga a estar al día y saber las características de cada servicio. Así que cuando nos consuma la curiosidad, nos piquen las manos y probemos algo nuevo es mejor estar seguro y como siempre leer la documentación oficial, o tener una cuenta de prueba sin activar el uso ilimitado de recursos de GCP.

Bueno, un aprendizaje más y a seguir implementando mi chatbot.

Chatbot funcionando correctamente
Figura 5: Me aprobaron un saldo a favor pequeño pero algo es algo.
Santino Suntaxi
Santino Suntaxi

Cloud & AI Engineer. Escribo sobre Cloud, IA, herramientas de Google y tecnología. Founder de DakyLabs.

Comentarios

¿Preferés no usar GitHub? Únete al Discord y comenta ahí.