Con el uso cada vez mayor de contenido web por parte de los sistemas de inteligencia artificial, ha surgido la necesidad de directrices claras y legibles por máquina. Mientras que los motores de búsqueda clásicos indexan principalmente el contenido, los sistemas modernos de inteligencia artificial también utilizan el contenido con fines de formación, para crear contexto o generar respuestas.
Los mecanismos existentes como
Code: Select all
robots.txt== Estructura ==
Dado que llms.txt es una propuesta sin estandarización formal, no existe un esquema vinculante. En la práctica, las implementaciones suelen basarse en una estructura simple basada en texto que se basa en la sintaxis de robots.txt.
Los componentes típicos son:
* Información sobre el alcance
* Reglas de acceso al contenido (por ejemplo, Permitir/No permitir)
* Notas sobre el uso para el entrenamiento de IA
* Reglas para citar contenido
* Información sobre el uso del contexto
* Información de contacto
Un ejemplo:
Agente de usuario: *
Permitir: /público/
No permitir: /interno/
Entrenamiento de IA: no permitir
Citación de IA: permitir
Contexto de IA: permitir
Contacto: https://example.com/contact
== Diferenciación de robots.txt ==
El llms.txt es fundamentalmente diferente del robots.txt:
* El
Code: Select all
robots.txt* El llms.txt es un enfoque no estándar para describir las pautas de uso de los sistemas de IA.
Si bien robots.txt puede tener un impacto directo en el rastreo y la indexación, llms.txt actualmente sirve principalmente como una política declarativa sin garantía de cumplimiento.
== Estado de estandarización ==
Actualmente, llms.txt no es un formato oficialmente estandarizado. No existen especificaciones vinculantes de organizaciones como el World Wide Web Consortium (W3C) o el Internet Engineering Task Force (IETF).
El uso es experimental y se basa en sugerencias de la comunidad de desarrolladores, así como en implementaciones individuales. Al mismo tiempo, varios proveedores están desarrollando sus propios mecanismos para controlar el uso del contenido web a través de sistemas de IA.
La consideración real de un llms.txt por parte de los sistemas de inteligencia artificial no está regulada de manera uniforme y puede variar según el proveedor.
== Significado ==
El archivo llms.txt se considera un posible componente básico para el futuro manejo de contenidos web en el contexto de la IA. Permite a los operadores de sitios web comunicar de forma transparente sus condiciones de uso.
Sin embargo, debido a la falta de estándares y la implementación voluntaria por parte de los sistemas de IA, su impacto práctico es actualmente limitado.
== Críticas y límites ==
* sin especificación uniforme o vinculante
* no hay evaluación garantizada por parte de los sistemas de IA
* sin aplicación técnica en el sentido de restricción de acceso
* posibles implementaciones e interpretaciones inconsistentes
== Ver también ==
* Estándar de exclusión de robots
* Rastreador web
* Modelo de lenguaje grande
|url=https://www.rfc-editor.org/rfc/rfc9309
|title=Protocolo de exclusión de robots
|werk=RFC 9309
|recuperación=2026-04-24
|url=https://ceis-it.de/anleitungen/llms-txt-erstellen
|title=Crear LLMs.txt – instrucciones y estructura
|werk=CEIS-IT
|recuperación=2026-04-24
* [https://ceis-it.de/anleitungen/llms-txt-erstellen Instrucciones para crear un LLMs.txt]
More details: https://de.wikipedia.org/wiki/Llma.txt