
Ubo Pod se presenta como una alternativa abierta y controlable a los altavoces inteligentes de siempre. En lugar de una “caja negra” dependiente de servicios propietarios, propone un asistente de voz y visión con base Raspberry Pi 4 o 5, pensado para quienes desean entender y decidir qué corre por dentro, con privacidad real y un ecosistema listo para trastear o, si prefieres, para usar sin tocar ni una línea de código.
En un contexto en el que Alexa, Google Home o Siri son ya parte del salón, la comodidad ha ido de la mano de dudas sobre vigilancia y tratamiento de datos. La idea detrás de Ubo Pod es clara: que el usuario decida si su IA se ejecuta en la nube o en local, con un hardware modular y reparable, una app abierta en GitHub y un enfoque que combina practicidad, hackeabilidad y opciones de ampliación sin ataduras.
Qué es Ubo Pod y qué pretende
Ubo Pod Developer Edition (DE) es la base de la plataforma: un “smart speaker” de hardware abierto que aloja una Raspberry Pi 4 o 5 y ejecuta software libre. El objetivo es sustituir dispositivos cerrados tipo Amazon Echo o Google Nest por un sistema auditable que habilite reconocimiento de voz (STT), síntesis (TTS), modelos de lenguaje y visión (LLMs/VLMs), llamadas a herramientas y varios mecanismos de activación.
La gracia del proyecto es que admite IA en la nube y también IA totalmente local y privada. Si así lo eliges, audio e imagen nunca abandonan tu red. Además, incorpora una interfaz gráfica embebida en la pequeña pantalla y una WebUI para configurarlo sin escribir código: eliges proveedores, ajustas parámetros y activas funciones desde el propio dispositivo o desde el navegador.
El enfoque abierto no es solo un slogan. El software y el hardware son open source, con repositorios públicos que incluyen la app Ubo (Python), los PCB a medida y los archivos mecánicos. Es posible auditar, modificar, reparar, ampliar o contribuir, algo inusual en gadgets de consumo que suelen esconder su diseño.
Para desarrolladores, la API gRPC permite sumar capacidades con pocas líneas: desde extensiones orientadas a voz o visión, hasta integraciones con sensores, flujos conversacionales con tool calling y disparadores múltiples para “despertar” al asistente según contexto.
Diseño y hardware: compacto, modular y reparable
El chasis apuesta por la longevidad y la reparabilidad. Mide 130 × 99 × 52 mm y pesa alrededor de 340 g, con una disposición interna optimizada para Raspberry Pi 4 o 5 y gestión térmica activa que mantiene el rendimiento en cargas sostenidas. La carcasa modular facilita sustituir piezas, ampliar y arreglar sin dramas.
En el frontal encontramos una pantalla IPS a color de 1,54 pulgadas con 240 × 240 píxeles. Aunque pequeña, es suficiente para menús rápidos, estado del sistema y una GUI embebida. La cámara integrada ofrece 5 MP, y la compatibilidad se amplía según modelo: Ubo Pro 4 soporta las cámaras oficiales Raspberry Pi V1 y V2, mientras que Ubo Pro 5 también admite la Camera Module 3 para escenarios de visión más exigentes.
En sonido, viene listo para conversaciones naturales. Integra dos micrófonos estéreo con captura de hasta 48 KHz y altavoces estéreo capaces de reproducir hasta 48 KHz con una distorsión muy contenida (<0,1% THD). En documentación y fichas aparecen dos formulaciones: 1 W por canal en un caso y 2 W por altavoz en otro; en cualquier caso, está orientado a voz clara y uso de escritorio o salón.
Para flexibilidad, incluye salida de línea con códec WM8960: 40 mW a 16 Ω a 3,3 VDC, THD de -75 dB a 20 mW, SNR de 90 dB con carga de 16 Ω y detección de inserción de jack. Si necesitas más volumen o una escena sonora distinta, puedes tirar de altavoces externos y listo.
La interacción física es directa: un teclado de siete botones “soft-touch” y un botón dedicado de encendido, más un anillo LED con 27 diodos RGB direccionables SK6812 compatible con NeoPixel para estados, respuestas visuales o efectos. En conectividad hereda lo mejor de la Pi: Gigabit Ethernet, WiFi 5, Bluetooth 5.0, dos USB 3.0 y dos USB 2.0 para accesorios, almacenamiento o aceleradores externos.
Uno de los rasgos diferenciales en casa es el control por infrarrojos integrado. Lleva un receptor IR (TSOP75238) con alcance de hasta 5 m y cuatro emisores de 940 nm (VSMB10940) de alta potencia y velocidad con patrón omnidireccional. Con esto puedes “enseñarle” comandos de tu mando preferido o pedirle por voz que envíe señales a la tele, el aire acondicionado u otros equipos IR.
En sensores, también viene completo. Trae un PCT2075 para temperatura (±1 °C entre -25 °C y +100 °C) y un VEML7700 para luz ambiental capaz de medir de 0 a 120 kilolux con resolución fina de 0,0036 lx/ct. Estos datos pueden condicionar respuestas o automatizaciones contextuales (por ejemplo, ajustar luminosidad de pantalla o patrones de LED).
De serie, el sistema se entrega con tarjeta microSD de 32 GB preinstalada con el sistema operativo. En el Ubo Pro 5 se añade una ranura M.2 PCIe para SSD NVMe o para montar un acelerador de IA, ideal si planeas ejecutar modelos locales pesados o guardar memorias y datos a lo grande.
Privacidad real: interruptores físicos y opciones locales
Más allá de promesas, la privacidad se materializa en hardware. La cámara dispone de una cortina física de privacidad que la tapa por completo cuando no la quieras en marcha. Y los micrófonos pueden desconectarse por hardware con un interruptor, sin depender de software ni de buenas intenciones.
En el plano del software, la arquitectura permite trabajar en la nube o de forma 100% local. Si priorizas que ningún dato salga de tu red, lo configuras así y listo. Si te interesa potencia o modelos concretos de terceros, puedes tirar de proveedores cloud y ajustar el equilibrio entre comodidad y control.
Experiencia de uso y configuración: sin código si no quieres
El sistema corre sobre Raspberry Pi OS y la Ubo App escrita en Python, publicada en GitHub. No necesitas el aparato para probar: puedes instalar la app en una Raspberry Pi 4 o 5 “pelada” y experimentar con la experiencia antes de decidirte por el hardware completo.
La WebUI guía la configuración sin necesidad de programar: selección de proveedores de IA (voz, texto, visión, memoria), ajustes de uso y activación de funciones. Además, la pequeña pantalla embebida ofrece una GUI para toques rápidos. Si no te apetece “picar” código, basta con esta capa.
Para quienes sí quieran abrir el capó, la arquitectura es modular y orientada a eventos, con un sistema centralizado de estado. Se soporta la instalación de aplicaciones de terceros empacadas en Docker, y hay una API gRPC de bajo código pensada para añadir funcionalidades con pocas líneas y desde distintos lenguajes.
La interacción conversacional va más allá de respuestas de texto. Ubo Pod soporta llamadas a herramientas (tool calling) y varios mecanismos de activación, y puede leer sensores, ejecutar acciones, mostrar datos en la pantalla o responder con el anillo LED. Es un flujo rico que te permite construir experiencias verdaderamente interactivas.
Modelos de IA y proveedores: nube, local u on-premise
Una de las bazas de la plataforma es su amplitud de compatibilidad. Soporta más de 50 servicios para STT, TTS, memoria, visión y LLMs. Desde opciones cloud hasta soluciones locales/on-premise, y todo seleccionable desde la pantalla integrada o la interfaz web.
Si prefieres elegir tú los modelos, puedes apuntar a direcciones de API de servicios populares como Gemini, ChatGPT o Claude, o bien utilizar Ollama para correr LLMs directamente en tu hardware. Para reconocimiento y síntesis de voz en local, hay alternativas como VOSK (STT) o Piper (TTS), útiles cuando buscas latencia baja y datos que no salen de casa.
Esta libertad te deja mezclar estrategias: procesado local para privacidad y nube para tareas puntuales exigentes. Así adaptas rendimiento, coste y protección de datos a tus prioridades sin cerrarte puertas.
Visión por computador e infrarrojos: el hogar bajo control
La cámara integrada y la compatibilidad con módulos oficiales convierten a Ubo Pod en un equipo con “ojos”. Es capaz de reconocer códigos, caracteres, gestos u objetos, abriendo un abanico de usos como leer un código en pantalla, detectar un gesto de confirmación o describir una escena con ayuda de modelos de visión-lenguaje.
El control por infrarrojos es especialmente práctico en el salón. Puedes enseñarle comandos de tu mando favorito para que los reproduzca o pedir por voz que envíe señales a otros aparatos: cambiar de canal, subir volumen, apagar la tele o ajustar el aire, siempre que acepten órdenes IR. Es de esas funciones que aportan utilidad inmediata.
Casos prácticos y demos que ya funcionan
Más allá del papel, hay ejemplos listos para usar. Memo, el asistente de notas por voz, mantiene memoria y contexto en la conversación, ideal para capturar ideas sin perder el hilo y recuperar información a demanda.
En el terreno visual, puedes generar imágenes a partir de una orden de voz y obtener descripciones de fotos con VLMs. La precisión dependerá de los modelos y proveedores seleccionados, pero la infraestructura está resuelta para experimentar sin bloqueos.
En el salón, el IR integrado brilla con luz propia. Decirle que cambie de canal, ajuste el volumen o apague la tele es perfectamente viable, siempre que el equipo reciba órdenes por infrarrojos. Combinado con los sensores de temperatura y luz, puedes crear comportamientos contextuales sencillos sin salirte del dispositivo.
Comparativa de modelos: Ubo Pro 4 y Ubo Pro 5
La familia gira en torno a la Raspberry Pi que elijas. Ubo Pro 4 y Ubo Pro 5 comparten la base: pantalla IPS de 1,54” (240×240), cámara de 5 MP, doble micro y doble altavoz, IR integrado (receptor + cuatro emisores), sensores de temperatura y luz, anillo LED de 27 RGB, teclado de 7 botones y conectividad de la SBC (Ethernet Gigabit, WiFi 5, Bluetooth 5.0, 2× USB 3.0 y 2× USB 2.0). Ambos incluyen microSD de 32 GB con el sistema preinstalado.
La diferencia está en la visión y la expansión. Ubo Pro 4 admite las cámaras Raspberry Pi V1 y V2, mientras que Ubo Pro 5 también soporta la Camera Module 3. Además, el Pro 5 suma una ranura M.2 PCIe para SSD NVMe o aceleradores de IA, ideal para almacenar más o descargar cómputo cuando ejecutes modelos locales pesados.
Precio, campaña y disponibilidad: lo que debes saber
El proyecto aterriza en la comunidad a través de Kickstarter con un objetivo de financiación de 25.000 dólares. Las recompensas parten de 109 dólares para Ubo Pro 4 y 129 dólares para Ubo Pro 5. Ojo: ninguna incluye la Raspberry Pi en la caja, tendrás que aportar tu propia SBC; y los gastos de envío tampoco están incluidos.
Como en todo micromecenazgo, conviene recordar que “apoyar” no equivale a “comprar”. Respaldar una campaña no garantiza la entrega: sé prudente, revisa la información y valora bien el riesgo antes de poner tu dinero. La página oficial de la campaña es https://www.kickstarter.com/projects/ubopod/ubo-pod-hackable-personal-ai-assistant.
El creador ha compartido que, a los dos días del lanzamiento, ya rozaban el 40% del objetivo. Pide un empujón para cruzar la meta y agradece la difusión, especialmente entre perfiles técnicos a los que les entusiasme el concepto. Como detalle poco común, se fabricó un lote pequeño por adelantado y hay algo de inventario listo para enviar a los primeros patrocinadores.
El mensaje del impulsor es directo: dar poder a desarrolladores para crear experiencias con voz, visión y sensores con facilidad. También expresa su hartazgo con dispositivos cerrados y ligados a servicios, y ha decidido priorizar comunidad y boca a boca frente a agencias de marketing de pago.
Cómo se configura (sin convertirlo en tutorial)
La WebUI te guía paso a paso. Seleccionas proveedores de voz, texto, visión y memoria, ajustas las opciones y listo. La GUI en pantalla permite cambios rápidos sin abrir el navegador. Si quieres evaluar antes de invertir en el hardware, instala la Ubo App en una Raspberry Pi 4/5 y comprueba compatibilidades y rendimiento.
Si lo tuyo es la privacidad estricta, puedes optar por ejecución local u on-premise para evitar que audio o imágenes salgan de tu red. Si, por el contrario, buscas modelos de terceros muy concretos, también puedes apuntar a APIs como Gemini, ChatGPT o Claude y equilibrar latencia, precio y precisión.
Contexto: asistentes “mainstream” y el precio de la comodidad
Los asistentes de gran consumo han popularizado la voz en casa. Millones de personas los usan para música, recordatorios o luces. Pero esa facilidad se apoya a menudo en procesado en la nube: cada consulta viaja a servidores de grandes tecnológicas, lo que enciende alarmas sobre escucha constante, vigilancia o usos secundarios de los datos.
La propuesta de Ubo Pod encaja como respuesta a esas inquietudes. Permite auditar el software, elegir dónde se procesan los datos y cambiar piezas a tu antojo. No es solo poder personalizar; es la posibilidad de entender, controlar y, si quieres, contribuir al proyecto.
Inspiraciones y guiños a la comunidad “open”
Para los nostálgicos, es inevitable pensar en proyectos como Mycroft. Aquel asistente abierto marcó camino y demostró el interés por alternativas libres, a pesar de los tropiezos que sufrió. Ubo Pod recoge ese testigo con un enfoque más integral en hardware, visión, IR y una app con WebUI que lo hace más fácil de adoptar.
¿Con qué placa funciona y qué alternativas hay?
Ubo Pod está diseñado alrededor de Raspberry Pi 4 o 5, pero quien se mueva en el mundo maker conoce otras SBC potentes. Como referencia de lo que hay ahí fuera, la Orange Pi 4 Pro es una placa reciente que ilustra bien el nivel actual: saca vídeo 4K a 60 Hz por HDMI 2.0, monta un SoC Allwinner A733 con dos núcleos Cortex-A76 y seis Cortex-A55, y puede integrar hasta 16 GB de LPDDR5.
En almacenamiento, la Orange Pi 4 Pro ofrece eMMC de 16/32/64/128 GB, ranura microSD y opción de SSD M.2 vía PCIe 3.0. Para periféricos, mantiene un encabezado de pines codificado por colores, cámaras por MIPI CSI y pantalla por MIPI DSI. Incorpora además una NPU de 3 TOPS, suficiente para tareas de visión asequibles (p. ej., analizar imágenes o un feed en directo con un modelo ligero).
En redes, incluye Gigabit Ethernet, WiFi 6 y Bluetooth 5.4, y en puertos ofrece un USB 3.0 y tres USB 2.0, todo en 3,5 × 2,2 pulgadas. Aunque no es la placa para todo el mundo, demuestra cómo evoluciona el ecosistema de SBCs y qué alternativas existen cuando buscas potencia o disponibilidad.
Más detalles prácticos del día a día
La interfaz no se queda en sliders. El anillo LED de 27 RGB permite feedback visual atractivo y configurable: estados de escucha, respuestas animadas, alertas o efectos a juego con tu entorno. Si sumas los sensores de luz y temperatura, puedes adaptar brillo, colores y comportamientos a la situación.
El conjunto de puertos de la Pi integrada te deja margen de maniobra. Entre Gigabit Ethernet, WiFi 5, Bluetooth 5.0 y cuatro USB (dos 3.0 + dos 2.0), tienes suficiente para añadir teclados, cámaras adicionales, almacenamiento, dongles o aceleradores, y equilibrar latencia/red según tus necesidades.
Si te preocupa el ruido o la estabilidad térmica, la gestión activa de temperatura ayuda a mantener el tipo bajo carga, lo que se agradece con modelos locales que se estiran. Y si la ambición crece, el Pro 5 con M.2 PCIe abre la puerta a SSD NVMe y a aceleradores dedicados de IA.
Quién debería fijarse en Ubo Pod
Si valoras la privacidad y odias depender de una nube que no controlas, este formato híbrido (local/nube) te viene como anillo al dedo. Si te apetece meter mano, tienes planos y código; si no, la WebUI te salva del código. Para perfiles técnicos, es un terreno de juego; para quien solo quiere un asistente que funcione, también cubre la papeleta.
Para experimentar con voz, visión y control por IR en un mismo aparato, es difícil encontrar algo tan integrado y abierto. Y que el hardware sea modular y reparable con piezas estándar evita que se convierta en un pisapapeles a la primera avería.
Cómo se posiciona frente a los altavoces cerrados
Los dispositivos de grandes marcas destacan por la experiencia pulida, pero su coste oculto es el control y la flexibilidad. Ubo Pod, en cambio, deja que elijas proveedores, inspecciones el código y decidas dónde se procesan tus datos. Para muchos usuarios, esa diferencia es esencial.
Además, el hecho de montar una Raspberry Pi dentro implica actualizaciones, reparaciones y reutilización de componentes sin casarte con un fabricante. En tiempos de obsolescencia acelerada, esto tiene un valor práctico y económico enorme.
Quien necesite convencer a su yo más prudente puede empezar probando la app en una Pi independiente. Probar antes de comprar reduce la incertidumbre, y si el flujo te encaja, el salto al hardware completo será cuestión de atornillar y configurar.
Queda claro que Ubo Pod se ha propuesto ser la alternativa abierta que faltaba: un asistente con voz y visión, control IR, sensores, WebUI sin código y compatibilidad con más de 50 proveedores de IA, con cortina de privacidad para la cámara y corte de micrófonos por hardware. Entre su chasis modular, la compatibilidad con Raspberry Pi 4/5 y la posibilidad de optar por computación local o en la nube, es un proyecto que da el poder al usuario, desde el perfil maker hasta quien solo quiere un asistente que respete su casa y sus datos. Si te atrae la idea, la campaña en Kickstarter —con precios base de 109 $ para Pro 4 y 129 $ para Pro 5, sin Pi ni envío— es el punto de partida, con la ventaja de que existe un pequeño lote inicial ya fabricado para los primeros en apoyarlo. Por si se te olvida, en la página puedes activar la opción de “avísame en el lanzamiento”, aunque recuerda siempre que comprometer un apoyo no garantiza la entrega.

