Vertex AI Exclusivo, Resiliencia y la Última Milla: Paginación

17 de febrero de 2026 · 9 min de lectura

API · Cloud Run · Cold Start · Exponential Backoff · RAG · Retry · Vertex AI

Este artículo describe la migración de un motor RAG desde una arquitectura multi-proveedor (SBERT, Ollama y Vertex AI) a una solución exclusiva con Vertex AI, explicando las razones detrás de esta decisión y el refactor resultante. Además, aborda un problema intermitente de carga de datos en la página de inicio debido a cold starts de Cloud Run. La solución implementada involucra un mecanismo de retry con exponential backoff en el cliente API (JavaScript/Axios). Aprenderás sobre las ventajas de simplificar la arquitectura, el manejo de cold starts y la implementación de retries.

← Volver al blog