• datos estructurados schema markup para buscadores y agentes IA

    Los datos estructurados son marcado en formato JSON-LD que se inserta en el código de cada página para comunicar a buscadores y agentes de IA qué entidades contiene tu web y cómo se relacionan entre sí. Schema.org es el vocabulario estándar que define esos tipos de entidades: Organization, Service, Product, Article, FAQ, entre otros.

    Sin datos estructurados, Google y los agentes de IA interpretan tu web como texto plano. Con datos estructurados, la interpretan como información verificable con entidades, atributos y relaciones. Esta diferencia determina si tu proyecto web aparece con resultados enriquecidos (rich results) en Google y si los buscadores generativos citan tu contenido con mayor precisión.

    En esta guía explicamos qué son los datos estructurados, qué tipos de schema necesita una web de empresa, por qué implementarlos desde la arquitectura es diferente a añadirlos como parche, y cómo facilitan la comprensión por parte de agentes de IA.

    Qué son los datos estructurados y cómo funcionan

    Los datos estructurados son fragmentos de código en formato JSON-LD que describen las entidades de cada página según el vocabulario de Schema.org. JSON-LD se inserta en el <head> o el <body> de la página y es invisible para el usuario. Los buscadores y los agentes de IA lo leen y lo usan para comprender qué contiene cada página.

    Un ejemplo simplificado de schema Organization:

    {
      "@context": "https://schema.org",
      "@type": "Organization",
      "name": "thecookies.agency",
      "url": "https://thecookies.agency",
      "description": "Agencia de desarrollo web a medida",
      "areaServed": "ES",
      "sameAs": ["https://linkedin.com/company/thecookies"]
    }
    

    Este marcado indica a Google, Gemini, ChatGPT y cualquier crawler que la página pertenece a una organización concreta, con nombre, URL, descripción y mercado. Sin este marcado, el buscador tiene que inferir esa información del texto, con mayor margen de error.

    El funcionamiento es directo: el crawler lee el JSON-LD, identifica las entidades y sus propiedades, y almacena esa información de forma estructurada. Cuando un usuario busca "agencia desarrollo web a medida" o un buscador generativo necesita citar una fuente, las páginas con datos estructurados tienen ventaja porque su contenido ya está clasificado.

    Qué tipos de schema son más importantes para una web de empresa

    Los 7 tipos de schema que más impacto tienen en una web de empresa son:

    • Organization. Define la empresa: nombre, URL, logo, redes sociales, área de servicio. Es la base que conecta todas las demás entidades del sitio.
    • LocalBusiness. Extensión de Organization para negocios con presencia física: dirección, teléfono, horarios, coordenadas. Imprescindible para SEO local.
    • Service. Describe cada servicio que ofrece la empresa: tipo, proveedor, área geográfica, descripción. Permite que Google muestre información de servicios en resultados enriquecidos.
    • Product. Para ecommerce: nombre, precio, disponibilidad, valoraciones. Activa rich results de producto en Google Shopping y en la búsqueda estándar.
    • Article. Para contenido de blog: autor, fecha de publicación, imagen destacada, descripción. Facilita la indexación y la aparición en Google News y Discover.
    • FAQ. Preguntas frecuentes con respuesta. Genera resultados enriquecidos con desplegables directamente en la SERP de Google.
    • BreadcrumbList. Define la ruta de navegación de cada página (Home → Servicios → Desarrollo web). Mejora la comprensión de la jerarquía del sitio por parte de buscadores.

    No todos los tipos aplican a todas las webs. Una web corporativa necesita Organization, Service y Article como mínimo. Un ecommerce añade Product. Un negocio local añade LocalBusiness. La selección depende del tipo de proyecto web y de las entidades que contiene.

    Schema desde la arquitectura vs schema como parche

    La diferencia entre implementar schema desde la arquitectura del proyecto web y añadirlo como parche determina la profundidad, la consistencia y el coste de mantenimiento del marcado.

    Schema como parche (plugins en WordPress). Plugins como Yoast o Rank Math generan schema básico (Article, Organization) de forma automática. El resultado es funcional pero limitado: los tipos son genéricos, las relaciones entre entidades no se definen y cada personalización requiere configuración manual. Si el plugin se actualiza de forma incompatible, el schema se rompe.

    Schema desde la arquitectura (integrado en el desarrollo). El marcado se genera dinámicamente desde las plantillas del proyecto web. Cada tipo de contenido (servicio, artículo, producto) tiene su schema definido en el código, con todos los atributos relevantes y las relaciones entre entidades. El schema se mantiene automáticamente cuando se crea contenido nuevo.

    La diferencia práctica: un plugin genera Article con título, fecha y autor. Una implementación nativa genera Article con título, fecha, autor, organización, categoría, imagen con dimensiones, breadcrumb y relación con la entidad Service correspondiente. La profundidad del marcado determina cuánto entienden los buscadores y los agentes sobre tu contenido.

    Implementar schema desde la arquitectura es uno de los 5 elementos de una web preparada para inteligencia artificial. Si quieres entender el conjunto completo, lo explicamos en el artículo sobre webs preparadas para inteligencia artificial.

    Cómo los datos estructurados ayudan a los agentes de IA

    Los agentes de IA y los buscadores generativos usan los datos estructurados para verificar, clasificar y citar contenido con mayor precisión. La diferencia es significativa: las webs con schema markup tienen entre un 30% y un 40% más de probabilidad de ser citadas por buscadores generativos, según análisis de citaciones en 2025.

    Un agente de IA que rastrea una web con schema Service sabe que la página describe un servicio concreto, ofrecido por una organización específica, en un mercado determinado. No tiene que inferirlo del texto: la información ya está clasificada. Cuando un usuario pregunta "qué agencias de desarrollo web trabajan con CMS headless en España", el modelo prioriza las fuentes donde esa información está marcada de forma explícita.

    Los datos estructurados también facilitan la integración con protocolos emergentes como MCP y con ficheros como LLMs.txt. Una web con schema profundo, contenido dual y señales de comprensión semántica es más fácil de procesar para cualquier sistema de IA, presente o futuro.

    Si quieres entender cómo esta disciplina encaja en la estrategia de visibilidad generativa, lo explicamos en el artículo sobre visibilidad en buscadores generativos.

    Cómo implementar datos estructurados en tu web

    La implementación de datos estructurados sigue 4 pasos, independientemente de la tecnología del proyecto web:

    1. Auditar el estado actual. Usa Google Rich Results Test o Schema Markup Validator para verificar qué schema tiene (o no tiene) cada página principal. Documenta qué tipos existen, qué falta y qué está mal implementado.
    2. Elegir los tipos de schema relevantes. Según el tipo de web: Organization y Service para corporativas, Product para ecommerce, Article para blogs, LocalBusiness para negocios con presencia física. No implementar todos los tipos disponibles: solo los que corresponden a las entidades reales del sitio.
    3. Implementar el marcado. En un proyecto web a medida o con CMS headless, el schema se integra en las plantillas de generación de cada tipo de contenido. En WordPress, se configura mediante plugins (con las limitaciones descritas) o mediante código personalizado en el tema.
    4. Validar y monitorizar. Verificar con Google Rich Results Test que el marcado es válido y genera resultados enriquecidos. Monitorizar en Search Console el informe de "Mejoras" para detectar errores de schema a lo largo del tiempo.

    ¿Se pueden añadir datos estructurados a una web en WordPress?

    Sí, con plugins o con código personalizado. Los plugins (Yoast, Rank Math, Schema Pro) generan schema básico sin necesidad de tocar código. Para schema más profundo (relaciones entre entidades, tipos personalizados, datos dinámicos), se necesita desarrollo en el tema de WordPress.

    Las limitaciones: los plugins generan marcado genérico que no refleja la estructura real del negocio. Personalizar el schema en WordPress requiere conocimientos técnicos que anulan la ventaja de usar un CMS con plugins. Y cada actualización del plugin puede modificar el marcado generado.

    Los datos estructurados son el idioma que hablan las máquinas

    Los buscadores y los agentes de IA no ven una web como la ve un usuario. Ven código, texto y, si existe, datos estructurados que les indican qué significa cada pieza de contenido. Implementar schema markup en tu proyecto web es darle a esas máquinas un mapa claro de lo que tu empresa ofrece, de lo que cada página contiene y de cómo se relacionan las partes entre sí. Las máquinas que entienden tu web son las que la muestran, la citan y la recomiendan.


    Guillermo Gascón

    Guillermo Gascón

    (Especialista SEO)

    Soy cofundador de THECOOKIES Agency, empresa de desarrollo web especializada en proyectos de captación de leads, donde doy servicios de consultoría SEO, optimización Web y optimización para motores de búsqueda, liderando el equipo de este área.

    Gestionando clientes desde 2015, me declaro un apasionado del marketing digital y vivo con entusiasmo los proyectos en los que trabajamos.

    Autor de uno de los primeros podcast sobre SEO "Hola SEO" y creador de contenido en diferentes canales como YouTube o Twitter.

    thecookies@terminal: ~
                                
                        

    000 THECOOKIES Terminal v1.0

    Escribe tu email para iniciar una conversación con nuestro asistente de IA.

    ────────────────────────────────────────────────────────

    Protección de datos personales. Utilizaremos sus datos para responder consultas, enviar comunicaciones comerciales y realizar análisis estadísticos. Para más información sobre el tratamiento y sus derechos, consulte la política de privacidad.