Seguridad para la Era de los Agentes
Trusteed está construido desde cero para operar de forma segura en entornos multi-agente. Esta página documenta nuestro modelo de amenazas, defensas y el proceso de divulgación responsable.
Modelo de Amenazas
Seis categorías de amenazas que defendemos activamente en el ecosistema MCP.
Prompt Injection
Instrucciones maliciosas embebidas en el contenido de productos, descripciones o datos de terceros que intentan secuestrar el comportamiento del agente.
INTEGRITY NOTICE en llms.txt; todas las entradas de herramientas validadas con Zod; sin HTML crudo en respuestas orientadas a agentes.
Tool Poisoning
Una herramienta MCP devuelve un payload diseñado para alterar las acciones posteriores del agente o exfiltrar contexto.
Respuestas de herramientas firmadas; validación estricta de esquema de salida; la salida de herramientas nunca se interpola en prompts de sistema.
Abuso de Checkout
Un agente —o atacante haciéndose pasar por uno— crea carritos y checkouts en alto volumen para agotar inventario o activar controles de fraude.
Rate limiting aplicado: create_cart 20 req/min, complete_checkout 10 req/min por identidad de agente.
Agentes Fraudulentos
Un agente malicioso se presenta como comprador legítimo para eludir controles de fraude o acceder a operaciones restringidas.
Autenticación OAuth 2.0 M2M requerida; el motor KYAI aplica reglas definidas por el merchant por identidad de agente.
Impersonación de Merchant
Una plataforma falsa imita a un merchant legítimo para interceptar transacciones de agentes o capturar credenciales de pago.
Trust score >= 0.70 requerido para merchants elegibles para checkout; timestamps QTSP en todos los registros de confianza firmados.
Exfiltración de Datos
Un agente intenta extraer PII de clientes, historial de pedidos o datos de pago más allá de su scope autorizado.
API keys con scope limitado por operación; sin PII en respuestas orientadas a agentes; agent_events registra todos los accesos a datos.
Scopes de API Keys
Todo acceso de agentes está restringido a los scopes declarados. Solicitar datos fuera del scope devuelve un 403.
read:productsBuscar y leer catálogo de productosread:merchantVer perfil de merchant y trust scorewrite:cartCrear y modificar carritowrite:checkoutIniciar flujo de checkoutadmin:merchantGestión de tienda — solo merchantsModelo de Auditoría y Confirmación
security-logger.ts registra cada evento de seguridad: fallos de autenticación, límites de tasa alcanzados, violaciones de scope y patrones anómalos.
Los merchants configuran reglas de confirmación humana a través del motor KYAI — por ejemplo, requerir aprobación para pedidos superiores a un umbral.
Los logs de eventos de agentes están disponibles en el dashboard de merchant (tabla agent_events), filtrables por identidad de agente y tipo de acción.
Divulgación Responsable
Tomamos los reportes de seguridad en serio y respondemos rápidamente a las vulnerabilidades críticas.
- Email de seguridad
security@trusteed.xyz - SLA de respuesta
< 72 horas para vulnerabilidades críticas - Apelación de confianza
POST /api/v1/trust/appeal