Cómo proteger clústeres de Kubernetes con Cloud Penetration Testing

Kubernetes se ha convertido básicamente en el sistema operativo de la nube. Si estás ejecutando contenedores a escala, es casi seguro que estás usando K8s. Es potente, flexible y gestiona la orquestación como un sueño. Pero aquí está la cuestión: esa misma potencia conlleva una enorme complejidad. Cuando pasas de una configuración tradicional basada en máquinas virtuales a una capa de orquestación de contenedores, tu superficie de ataque no solo cambia, sino que se expande en direcciones que quizás ni siquiera estés mirando.

La mayoría de los equipos comienzan su viaje en Kubernetes siguiendo algunos tutoriales básicos, levantando un clúster en EKS, GKE o AKS, e implementando sus aplicaciones. Todo funciona. Luego, añaden algunos namespaces, algunos ingress controllers y tal vez algún control de acceso basado en roles (RBAC) básico. Se siente seguro. Pero "funciona" y "es seguro" son dos cosas muy diferentes en el mundo de la infraestructura nativa de la nube. Un solo archivo YAML mal configurado o una ServiceAccount con privilegios excesivos puede ser la diferencia entre un entorno de producción seguro y una toma de control total del clúster.

Aquí es donde entra en juego el cloud pentesting. No puedes simplemente ejecutar un escáner de red estándar contra un clúster de Kubernetes y darlo por terminado. K8s tiene su propia red interna, su propio API server y su propio conjunto de peculiaridades de gestión de identidades. Para asegurar realmente un clúster, tienes que pensar como un atacante. Tienes que preguntar: "Si comprometo un pod, ¿puedo llegar al API server? ¿Puedo robar un token del sistema de archivos? ¿Puedo moverme lateralmente a otro namespace?"

En esta guía, vamos a profundizar en la realidad de la seguridad de Kubernetes. Dejaremos atrás el consejo genérico de "usar contraseñas seguras" y analizaremos los vectores de ataque reales que mantienen despiertos a los ingenieros de seguridad por la noche. Lo más importante es que exploraremos cómo un enfoque nativo de la nube para el Penetration Testing, como el que hemos creado en Penetrify, te permite encontrar estos agujeros antes de que lo haga otra persona.

Comprendiendo la superficie de ataque de Kubernetes

Antes de hablar de cómo probar el clúster, necesitamos entender qué estamos probando realmente. Kubernetes no es una sola cosa; es una colección de componentes que tienen que comunicarse entre sí. Si alguno de esos canales de comunicación está abierto o no está autenticado correctamente, todo el castillo de naipes puede derrumbarse.

El plano de control: el cerebro del clúster

El plano de control es el principal objetivo de cualquier atacante serio. ¿Por qué? Porque si controlas el API server, lo controlas todo. El kube-apiserver es la puerta de entrada para todas las tareas administrativas. Si está expuesto a la internet pública sin una autenticación estricta, o si hay una vulnerabilidad en la versión que estás ejecutando, un atacante puede esencialmente emitir comandos a tu clúster como si fuera el administrador.

Luego tienes etcd. Esta es la base de datos del clúster. Almacena todo: secretos, mapas de configuración y el estado de cada pod. Si un atacante tiene acceso a etcd, ni siquiera necesita hablar con el API server; puede simplemente leer tus secretos directamente del disco.

Los nodos de trabajo y el Kubelet

Los nodos de trabajo son donde se ejecuta tu código real. El kubelet es el agente que se ejecuta en cada nodo y se comunica con el plano de control. Un error común es dejar la API de Kubelet abierta o permitir el acceso no autenticado. Si puedo hablar con un Kubelet, podría ser capaz de ejecutar comandos dentro de un pod o incluso extraer información sensible sobre el entorno del nodo.

Los Pods y Contenedores

Este es el punto de entrada más común. La mayoría de los ataques comienzan con una vulnerabilidad en el código de la aplicación, tal vez un RCE al estilo Log4j o un simple SQL Injection. Una vez que el atacante está dentro de un contenedor, comienza a "escapar del pod". Buscan formas de salir del contenedor y llegar al nodo host subyacente. Desde allí, buscan el token de ServiceAccount que normalmente se monta en /var/run/secrets/kubernetes.io/serviceaccount/token.

La capa de red (CNI)

La red de Kubernetes es a menudo una red "plana" por defecto. Esto significa que, por defecto, cualquier pod en el clúster puede hablar con cualquier otro pod, independientemente del namespace. Si tu servidor web frontend está comprometido, puede potencialmente enviar peticiones a tu API interna de procesamiento de pagos o a tu base de datos sin ningún firewall intermedio.

Configuraciones erróneas comunes de Kubernetes que conducen a brechas

Cuando hacemos Penetration Testing en Penetrify, rara vez encontramos vulnerabilidades de "Zero Day" en el código central de Kubernetes. En cambio, encontramos errores de "Zero Day" en la forma en que se configuró el clúster. Estas son las frutas bajas que los atacantes aman.

Roles RBAC con privilegios excesivos

El control de acceso basado en roles (RBAC) es la parte más incomprendida de la seguridad de K8s. Es muy fácil frustrarse con los errores de "Permiso denegado" durante la implementación y simplemente dar a una ServiceAccount el rol de cluster-admin.

Imagina un simple pod de monitorización que solo necesita listar los pods para comprobar su estado. Si a ese pod se le dan permisos de cluster-admin y la aplicación dentro de él se ve comprometida, el atacante ahora tiene control total sobre todo el clúster. Pueden eliminar namespaces, robar secretos e implementar sus propios pods maliciosos (como mineros de criptomonedas).

La trampa del contenedor "Privilegiado"

Ejecutar un contenedor como privileged: true básicamente le dice a Kubernetes que desactive la mayoría de los límites de seguridad entre el contenedor y el host. Un contenedor privilegiado tiene casi el mismo acceso al kernel del host que un proceso que se ejecuta directamente en el nodo. Para un pentester, un contenedor privilegiado es un billete de oro. Hace que escapar al host sea trivial, permitiéndoles acceder al socket de Docker o a la API de Kubelet.

Dashboard y API Server expuestos

El panel de Kubernetes es excelente para la visibilidad, pero es una pesadilla si no está asegurado. Hemos visto clústeres donde el panel estaba expuesto a Internet con una cuenta de servicio predeterminada que tenía privilegios administrativos. Es esencialmente una GUI basada en web para destruir tu propia infraestructura. De manera similar, dejar el servidor API abierto a 0.0.0.0/0 sin MFA o un estricto whitelisting de IP es una receta para el desastre.

Secretos Desprotegidos

Muchos equipos almacenan "secretos" en objetos Secrets de Kubernetes. Si bien esto suena bien, recuerda que, de forma predeterminada, los secretos de K8s solo están codificados en base64, no encriptados. Cualquiera que tenga acceso a la API o a la base de datos etcd puede decodificarlos en segundos. Si no estás utilizando un KMS (Key Management Service) dedicado o una herramienta como HashiCorp Vault, tus secretos no son realmente secretos.

El Flujo de Trabajo de Cloud Penetration Testing para Kubernetes

El Penetration Testing tradicional es a menudo un evento "puntual": un consultor viene durante dos semanas, escribe un informe y se va. Pero los entornos de Kubernetes cambian cada vez que ejecutas kubectl apply. Necesitas un enfoque más continuo y nativo de la nube para las pruebas.

Fase 1: Reconocimiento y Mapeo Externo

El primer paso en un cloud pentest es ver lo que el mundo ve. Comenzamos escaneando los endpoints expuestos.

¿Es accesible el servidor API?
¿Hay un puerto Kubelet (10250) abierto?
¿Hay algún panel expuesto o páginas de métricas de Prometheus?
¿Qué reglas de ingreso permiten el tráfico al clúster?

Fase 2: Acceso Inicial (La "Huella")

Una vez que encontramos un punto de entrada, digamos, una aplicación web vulnerable, establecemos un punto de apoyo. Esto generalmente implica obtener una reverse shell. Pero una vez que estamos dentro, el objetivo cambia de "atacar la aplicación" a "atacar el clúster".

Lo primero que hace un pentester es verificar el token de ServiceAccount: cat /var/run/secrets/kubernetes.io/serviceaccount/token

Si ese token existe, podemos usarlo para autenticarnos en el servidor API desde dentro del pod.

Fase 3: Enumeración Interna y Escalada de Privilegios

Ahora preguntamos: "¿Qué puedo hacer realmente con este token?" Utilizamos herramientas como kubectl auth can-i --list para ver nuestros permisos.

Si tenemos permisos para create pods, podemos lanzar un pod "malicioso" que monte el sistema de archivos raíz del host. Si tenemos permisos para get secrets, podemos volcar cada contraseña y clave API en el namespace. Aquí es donde ocurre el "juego de ajedrez" de la seguridad de Kubernetes: pasar de un pod con pocos privilegios a un nodo con muchos privilegios.

Fase 4: Movimiento Lateral

Si el clúster no tiene Network Policies (la versión K8s de un firewall), podemos movernos lateralmente. Escaneamos la red interna del pod para encontrar otros servicios. Podríamos encontrar una caché de Redis no autenticada o una base de datos interna que confíe en cualquier conexión proveniente del clúster.

Fase 5: Exfiltración y Persistencia

La etapa final es ver si podemos robar datos o mantener el acceso. ¿Podemos crear un Deployment de "puerta trasera" que se reinicie si se elimina? ¿Podemos robar los metadatos de IAM del proveedor de la nube del nodo (por ejemplo, acceder a 169.254.169.254 en AWS) para pasar del clúster de Kubernetes a la cuenta de AWS más amplia?

Pasos Prácticos para Reforzar tu Clúster

Si has leído hasta aquí y estás pensando: "Mi clúster podría ser vulnerable", no entres en pánico. La seguridad es un proceso de mejora continua. Aquí hay una lista de verificación práctica para mover tu clúster de "estándar" a "reforzado".

1. Implementa Network Policies Estrictas

Deja de asumir que la red interna es segura. De forma predeterminada, implementa una política de "denegar todo" tanto para el tráfico de ingreso como de salida dentro de tus namespaces. Luego, permite explícitamente solo las conexiones que sean necesarias.

El Pod A solo debería hablar con el Pod B en el puerto 8080.
El Pod B solo debería hablar con la base de datos en el puerto 5432.
Bloquea que todos los pods hablen con la API de metadatos de la nube a menos que lo necesiten absolutamente.

2. Limpia tu RBAC

Audita tus roles. Deja de usar cluster-admin para todo.

Usa Namespaced Roles en lugar de ClusterRoles siempre que sea posible.
Sigue el Principio del Mínimo Privilegio (PoLP). Si un pod solo necesita leer un ConfigMap, no le des la capacidad de actualizarlo.
Audita regularmente quién tiene acceso al clúster utilizando herramientas como rbac-lookup.

3. Usa Pod Security Admissions (PSA)

Deja de permitir contenedores con privilegios. Kubernetes tiene Pod Security Admissions integrados que te permiten aplicar diferentes niveles de seguridad:

Privileged: Sin restricciones (básicamente "haz lo que quieras"). Evita esto en producción.
Baseline: Evita escaladas de privilegios conocidas.
Restricted: Aplica un estándar de seguridad muy alto (sin usuarios root, sin acceso a la red del host).

Apunta al perfil restricted para todas tus cargas de trabajo de aplicaciones.

4. Asegura tus Secretos

Aléjate de los secretos K8s codificados en base64.

Habilita el Encryption at Rest para tu base de datos etcd.
Utiliza un administrador de secretos nativo de la nube. Por ejemplo, utiliza AWS Secrets Manager o Azure Key Vault e intégralos con tus pods utilizando el Secret Store CSI Driver. Esto asegura que los secretos se inyecten en el pod en tiempo de ejecución y nunca se almacenen como texto plano en la API de K8s.

5. Mantén tus Componentes Actualizados

Esto suena básico, pero es donde ocurren muchas brechas. Las vulnerabilidades en el kube-apiserver o kubelet se parchean rápidamente, pero si estás ejecutando una versión de hace dos años, eres un objetivo fácil. Automatiza las actualizaciones de tu clúster para mantenerte al día con los últimos parches de seguridad.

Una Comparación: Penetration Testing Manual vs. Escaneo Automatizado vs. Plataformas Nativas de la Nube

Mucha gente pregunta: "¿No puedo simplemente ejecutar un escáner de vulnerabilidades?" La respuesta es sí, pero un escáner no es un Penetration Test. Aquí está la diferencia.

Característica	Escáner de Vulnerabilidades Automatizado	Penetration Test Manual Tradicional	Plataforma Nativa de la Nube (Penetrify)
Alcance	Encuentra CVEs conocidos en los paquetes.	Inmersión profunda en la lógica y la configuración.	Combina el escaneo de CVEs con el análisis de configuración.
Contexto	No entiende RBAC o el flujo de la red.	Entiende el contexto pero es lento.	Mapea la superficie de ataque en tiempo real.
Frecuencia	Puede ejecutarse diariamente.	Una o dos veces al año.	Continuo y bajo demanda.
Capacidad de Acción	Da una larga lista de errores "potenciales".	Da un informe detallado.	Proporciona rutas de remediación y se integra con SIEM.
Costo	Bajo a Moderado.	Alto (honorarios del consultor).	Suscripción escalable.

Los escáneres son geniales para encontrar una versión de Nginx que tiene un error. Pero un escáner no le dirá que su política RBAC permite que el pod de un desarrollador borre su base de datos de producción. Un pentester manual encontrará eso, pero son caros y no pueden estar en todas partes a la vez.

Una plataforma como Penetrify cierra esta brecha. Utiliza la arquitectura nativa de la nube para simular estos ataques de forma automática y consistente, dándole la profundidad de un pentest con la velocidad de un escáner.

Escenario Avanzado: El Escape "Pod-to-Cloud"

Para entender realmente por qué el pentesting en la nube es diferente, veamos un escenario de ataque realista. Este es un camino común que encontramos durante las evaluaciones.

Paso 1: La Entrada Un atacante encuentra una vulnerabilidad de Server-Side Request Forgery (SSRF) en una aplicación Django pública que se ejecuta en un pod de Kubernetes.

Paso 2: El Impacto de los Metadatos El atacante utiliza el SSRF para acceder al punto final de metadatos del proveedor de la nube: http://169.254.169.254/latest/meta-data/iam/security-credentials/. Debido a que el rol IAM del nodo tiene demasiados privilegios, el atacante recupera una clave de acceso temporal de AWS.

Paso 3: Escaneo de la Cuenta Usando esas claves, el atacante se da cuenta de que tiene permisos S3:ListBucket y S3:GetObject para toda la cuenta de AWS. Encuentran un bucket que contiene copias de seguridad de la base de datos de producción.

Paso 4: La Toma de Control del Clúster Mientras investigan el bucket S3, encuentran una copia de seguridad de un archivo kubeconfig que se subió accidentalmente. Este archivo contiene un certificado para un usuario cluster-admin.

Paso 5: Control Total El atacante utiliza el kubeconfig para conectarse al servidor API desde su propio portátil. Ahora tienen poder absoluto sobre el clúster. Despliegan un túnel encriptado (como Ngrok) dentro del clúster para mantener una puerta trasera permanente, evitando todos los firewalls perimetrales.

¿La Lección? La vulnerabilidad no estaba sólo en la aplicación Django. Era una cadena: SSRF $\rightarrow$ IAM del Nodo con Exceso de Privilegios $\rightarrow$ Secreto Filtrado en S3 $\rightarrow$ Kubeconfig de Administrador. Un simple escáner de pods sólo habría encontrado la vulnerabilidad de Django; no le habría mostrado que toda su cuenta de AWS estaba en riesgo.

Integración de la Seguridad en el Pipeline CI/CD (DevSecOps)

No se puede simplemente "hacer" seguridad al final. Para cuando un pentester encuentra un agujero en su clúster de producción, el daño (o el costo de arreglarlo) ya es alto. Tiene que mover la seguridad "a la izquierda".

Pruebas Shift-Left

Integre las comprobaciones de seguridad en sus pipelines de GitLab o GitHub.

Análisis Estático (SAST): Escanee sus Dockerfiles para "USER root" y sus archivos YAML para privileged: true.
Escaneo de Imágenes: Utilice herramientas para asegurarse de que sus imágenes base no tengan CVEs conocidos antes de que lleguen al registro.
Política como Código: Utilice OPA (Open Policy Agent) o Kyverno. Estas herramientas actúan como controladores de admisión. Si un desarrollador intenta desplegar un pod que no tiene límites de recursos o que se está ejecutando como root, el clúster simplemente rechaza el despliegue.

El Bucle de Retroalimentación

La verdadera magia ocurre cuando conecta los resultados de su Penetration Testing de nuevo a su ciclo de desarrollo. Cuando una plataforma como Penetrify identifica una configuración errónea en su clúster de desarrollo, esa información debería crear automáticamente un ticket en Jira para que el equipo lo solucione.

La seguridad no debería ser una "puerta" que detiene el despliegue; debería ser una "barandilla" que guía el despliegue. Cuando los desarrolladores saben exactamente por qué una determinada configuración es peligrosa (porque un Penetration Test simuló un ataque y lo demostró), es mucho más probable que escriban código seguro desde el principio.

Errores Comunes al Asegurar Kubernetes

Incluso los equipos experimentados tropiezan con estos. Si está gestionando un clúster, compruebe si está haciendo alguna de estas cosas.

Error 1: Confiar en la Etiqueta "Gestionado en la Nube"

Mucha gente asume que, como utilizan EKS o GKE, Google o Amazon se encargan de la seguridad. Si bien el proveedor de la nube asegura el plano de control (los nodos maestros), usted sigue siendo responsable del plano de datos (sus nodos de trabajo, sus pods y sus políticas de red). El "Modelo de Responsabilidad Compartida" es real. Si deja su servidor API abierto, AWS no va a impedir que un atacante entre.

Error 2: Ignorar el Namespace "Predeterminado"

El espacio de nombres default a menudo es un vertedero para pruebas y pods aleatorios. Muchos equipos olvidan aplicar las mismas políticas estrictas de RBAC y de red al espacio de nombres default que aplican a production. Un atacante que entra en un pod de "prueba" en el espacio de nombres predeterminado a menudo puede usarlo como punto de partida para atacar otras partes del clúster.

Error 3: Confiar demasiado en el escaneo de imágenes

Escanear una imagen en busca de CVE es importante, pero no es suficiente. Una imagen puede tener cero vulnerabilidades conocidas, pero aún así estar configurada para ejecutarse como root con acceso completo al espacio de nombres PID del host. Tienes que asegurar la configuración de tiempo de ejecución, no solo el binario.

Error 4: No registrar ni monitorear

No puedes detener un ataque que no puedes ver. Muchos equipos olvidan habilitar los registros de auditoría de Kubernetes. Los registros de auditoría te dicen quién hizo qué, cuándo y cómo. Sin ellos, si un atacante roba un token y crea una puerta trasera, no tendrás ningún registro de cómo sucedió.

Preguntas frecuentes: Protección de Kubernetes con Cloud Pentesting

P: ¿Con qué frecuencia debo realizar un Penetration Test en mi clúster de Kubernetes? R: Depende de la frecuencia con la que realices cambios. Si envías código diariamente, un Penetration Test una vez al año es inútil. Debes tener un escaneo automatizado diariamente y un Penetration Testing en profundidad cada trimestre o después de cada cambio arquitectónico importante. Las plataformas nativas de la nube permiten el "pentesting continuo", que es el estándar de oro.

P: ¿Necesito instalar agentes en mis nodos para el cloud pentesting? R: No necesariamente. Muchas plataformas modernas, incluyendo Penetrify, utilizan una combinación de escaneo basado en API y "pods de atacante" controlados para simular amenazas sin necesidad de instalar agentes invasivos en cada nodo. Esto reduce la sobrecarga de rendimiento y el riesgo de seguridad de la propia herramienta de prueba.

P: ¿Puede el pentesting romper mi clúster de producción? R: Siempre existe un riesgo con cualquier prueba activa. Esta es la razón por la que recomendamos realizar pruebas en un entorno de pruebas que refleje la producción. Sin embargo, las herramientas profesionales de cloud pentesting están diseñadas para no ser destructivas. Buscan acceso de "prueba de concepto" (como leer un archivo) en lugar de realizar ataques de "denegación de servicio".

P: ¿Cuál es la diferencia entre un escaneo de vulnerabilidades y un pentest? R: Un escaneo es como un sistema de seguridad para el hogar que verifica si las puertas están cerradas. Un pentest es como contratar a alguien para que realmente intente entrar en tu casa. El escáner te dice que la puerta podría estar abierta; el pentester realmente cruza la puerta y te dice que puede alcanzar tu joyero en el dormitorio.

P: ¿Es RBAC suficiente para asegurar un clúster? R: No. RBAC es solo una capa. También necesitas Network Policies (para detener el movimiento lateral), Pod Security Admissions (para detener los escapes) y Secret Management (para proteger los datos confidenciales). Piénsalo como "defensa en profundidad".

Conclusiones finales y próximos pasos

Asegurar Kubernetes no se trata de marcar una sola casilla; se trata de reducir el "radio de explosión". Debes asumir que, en algún momento, un pod se verá comprometido. El objetivo es asegurarse de que, cuando eso suceda, el atacante se encuentre en una habitación cerrada con llave, sin llaves y sin forma de comunicarse con el resto de la casa.

Si te sientes abrumado, comienza con estas tres acciones inmediatas:

Audita tu RBAC: Encuentra cada ServiceAccount con cluster-admin y averigua si realmente lo necesita. (Pista: probablemente no).
Habilita Network Policies: Comienza bloqueando todo el tráfico de salida de tus pods a la API de metadatos de la nube (169.254.169.254).
Ejecuta una prueba real: Deja de adivinar si estás seguro. Utiliza una herramienta o un servicio para simular realmente un ataque.

La complejidad de Kubernetes es su mayor fortaleza, pero también su mayor debilidad. La única forma de conocer verdaderamente tu postura es probarla en condiciones del mundo real.

Si quieres dejar de adivinar y empezar a saber, Penetrify puede ayudarte. Proporcionamos la infraestructura nativa de la nube para ejecutar evaluaciones de seguridad de nivel profesional sin la enorme sobrecarga de la consultoría tradicional. Te ayudamos a encontrar las brechas en tu RBAC, los agujeros en tus Network Policies y los caminos hacia la escalada de privilegios antes de que lo haga un actor malicioso.

No esperes a una brecha para descubrir que tu clúster "seguro" tenía una puerta abierta de par en par. Visita Penetrify.cloud hoy mismo y obtén una visión clara y práctica de tu postura de seguridad.