Metodología y aprendizajes

Esta página explica, sin adornos, cómo la fábrica convierte una idea cruda en un MVP que mide demanda real. El recorrido no es lineal ni indulgente: la mayoría de los problemas mueren por el camino, y eso es exactamente lo que debe pasar. Aquí está el proceso completo, las dos líneas de exploración, cómo puntuamos, cómo validamos y qué hemos aprendido al repetirlo decenas de veces.

El proceso, en cinco fases

Fase 1 — Generación masiva

El embudo arranca con cantidad bruta. Lanzamos funnels masivos que producen 553 problemas reales, almacenados en data/problems.json: 205 vienen del funnel B2B, 300 de aplicar la lente de Y Combinator a lo largo de 30 rondas, y 48 de la base histórica. En esta fase no se filtra por calidad ni por gusto; el objetivo es volumen y cobertura de sectores. La selección viene después.

Fase 2 — Estudio YC top-100

De los 553 problemas seleccionamos los 100 de mayor potencial y los sometemos a un estudio en dos olas:

De 100 problemas estudiados a fondo, 9 pasan el corte. Esa tasa de mortalidad es deliberada.

Fase 3 — Harmonización

Tras dos olas con criterios distintos, portfolio y problemas no eran comparables entre sí. Así que re-puntuamos todo bajo una misma lente demand-first. El detalle del scoring está en la sección siguiente. Lo importante de esta fase: corregimos un sesgo que teníamos. Antes, el founder-fit inflaba ideas de nicho hasta el puesto #1 aunque la demanda fuera tibia. Ahora el founder-fit cuenta, pero no manda.

Fase 4 — Programa CEO (autónomo)

Cada problema de alto potencial entra en un pipeline completo antes de tocar una sola línea de landing: validación, TAM/SAM/SOM, cliente específico (ICP), mapa de competidores, modelo de negocio, unit economics y rentabilidad, spec técnica y gate de decisión. Solo los problemas que superan ese pipeline pasan a la siguiente puerta: un MVP smoke-test en un subdominio propio. Ese MVP es una landing que capta waitlist e intención de pago, persistida en D1 — sin Stripe, sin cobro real todavía. La meta operativa son 50 MVPs vivos midiendo señal.

Fase 5 — gstack

Instalamos el toolkit open-source de Garry Tan para operar la fábrica como un equipo, siendo un solo founder. Lo detallamos más abajo.

Las dos líneas

El Programa CEO corre en paralelo por dos carriles, y eso es intencional:

Mantener los dos carriles separados evita engañarnos: si una idea solo aparece en Track B, sabemos que su atractivo depende de la ventaja del founder, no del mercado.

El scoring

Una sola fórmula, comparable en todo el portfolio:

Score = demanda (0–100) + founder-bonus (+0 a +8)

Esta corrección nació de un error real: con el esquema anterior, el founder-fit empujaba ideas de nicho al #1 por encima de problemas con mucha más demanda. La harmonización demand-first lo arregló.

Validación y gates

El modelo de validación tiene capas, y cada una significa algo distinto:

El principio operativo: pipeline completo antes de lanzar. No construimos MVPs porque sí; construimos solo lo que ya superó la validación de escritorio.

gstack: qué es y cómo lo usamos

gstack es el toolkit open-source (MIT) de Garry Tan, CEO de Y Combinator. Su tesis: una sola persona con las herramientas correctas envía como un equipo de veinte. La barrera de ingeniería ha desaparecido; lo que queda es criterio, gusto y la disciplina de hacer la cosa completa. El "último 10% de completitud" que los equipos solían saltarse ahora cuesta segundos — y por eso se hace siempre.

En la práctica, gstack convierte a Claude Code en un equipo de ingeniería virtual con roles especialistas: un CEO que repiensa el producto, un eng manager que fija la arquitectura, un diseñador que caza el "AI slop", un revisor que encuentra bugs de producción, un QA que abre un navegador real, un oficial de seguridad (OWASP + STRIDE) y un release engineer que envía el PR. Las skills que usamos en la fábrica:

gstack enmarca y envía; para construir el MVP con un equipo de ingeniería —el roster de agentes especialistas, el pipeline con compuertas y el método con el que un solo desarrollador ganó el hackathon de Anthropic— ver la pestaña 🤖 Agentes.

Aprendizajes meta

Lo que la repetición nos ha enseñado, destilado:

Y un metaaprendizaje sobre el propio proceso: el score de la primera fase es señal ruidosa. El research profundo cambia entre un 15% y un 25% del ranking, casi siempre a la baja, al aparecer aplazamientos regulatorios, competidores recién financiados o incumbentes que integran más rápido de lo previsto. Por eso ninguna idea recibe recursos por puntaje alto sin haber pasado el pipeline completo.

Referencias del cockpit

🏰 Moat en la era IA — por qué el B2B con forcing regulatorio + dato atrapado es defendible cuando el código es commodity.
📖 Principios diarios — el ritual de decisión.
🔀 Pipeline — el embudo y el tablero por fases en vivo.
📊 Cockpit — vista operador detallada (stages E1-E6, SLAs, sectores).
🗂 Ranking top-100 — el estudio YC completo, idea a idea.
📚 Glosario — los términos del método.