DeepSeek presenta DSpark, un sistema que acelera hasta 85% la generación de su modelo V4

27 de junio de 2026 franklin

DeepSeek liberó DSpark, un marco de trabajo de decodificación especulativa (una técnica que adelanta varios tokens antes de verificarlos) diseñado para acelerar la generación de texto de su modelo DeepSeek-V4 sin sacrificar calidad. Según la compañía, en producción el sistema agiliza la generación por usuario entre un 57% y un 85% frente a su referencia anterior, conocida como MTP-1, y lo hace de forma sin pérdidas, es decir, sin alterar el resultado final del modelo.

La decodificación especulativa funciona usando un modelo «borrador» más liviano que propone varios tokens de una vez, los cuales luego son validados por el modelo principal. Cuando las propuestas son correctas, el sistema avanza más rápido porque evita generar palabra por palabra. La novedad de DSpark es que su módulo de borrador se conecta directamente a los pesos ya existentes de DeepSeek-V4, sin necesidad de reentrenar el modelo base.

Cómo logra la aceleración

De acuerdo con la documentación técnica publicada por DeepSeek, DSpark combina varios componentes. Por un lado, un backbone de borrador paralelo que genera propuestas, acompañado de una cabeza de Markov ligera pensada para reducir la «degradación del sufijo», un problema habitual en el que la precisión de las predicciones cae a medida que se proyectan más tokens hacia adelante.

El segundo elemento clave es una verificación programada por confianza: en lugar de revisar siempre la misma cantidad de tokens, el sistema ajusta cuántos se comprueban según la carga real de la GPU en cada momento. Esto le permite adaptarse a las condiciones de operación y aprovechar mejor el hardware cuando hay margen disponible.

En pruebas fuera de línea, DeepSeek afirma que la longitud aceptada de tokens —cuántas propuestas del borrador resultan válidas— aumenta entre un 16% y un 31% frente a otros métodos del sector como DFlash y Eagle3. Esa mejora se traduce en la ganancia de velocidad observada en entornos de producción.

Disponible como código abierto

DeepSeek publicó el repositorio de entrenamiento, llamado DeepSpec, bajo licencia MIT, una de las más permisivas, lo que permite su uso comercial y su modificación. El código está disponible en GitHub, junto con el documento técnico que describe el método. La compañía también liberó una versión del modelo, DeepSeek-V4-Pro-DSpark, en la plataforma Hugging Face.

La apuesta por el código abierto es una constante en la estrategia de DeepSeek, la empresa china que ganó notoriedad global a comienzos de 2025 por ofrecer modelos competitivos a un costo de cómputo considerablemente menor que el de sus rivales estadounidenses. Herramientas como DSpark refuerzan ese posicionamiento, ya que atacan directamente uno de los mayores cuellos de botella de la industria: el costo y la latencia de la inferencia, es decir, el proceso de generar respuestas una vez que el modelo ya está entrenado.

Para las empresas que despliegan modelos de lenguaje a gran escala, las mejoras en velocidad de generación tienen un impacto directo en costos operativos y en la experiencia del usuario. Si las cifras presentadas por DeepSeek se sostienen en distintos escenarios reales, DSpark podría convertirse en una referencia para optimizar la inferencia, especialmente al estar disponible sin restricciones de licencia.

Cómo logra la aceleración

Disponible como código abierto

Deja una respuesta