CasaNoticiasCuello de botella en la interconexión 448G: el verdadero límite de la IA no es la potencia informática, sino el ancho de banda del sistema

Cuello de botella en la interconexión 448G: el verdadero límite de la IA no es la potencia informática, sino el ancho de banda del sistema

Cuello de botella en la interconexión 448G: el verdadero límite de la IA no es la potencia informática, sino el ancho de banda





Durante los últimos dos años, casi toda la atención se ha centrado en las GPU, la potencia informática y los nodos de procesos avanzados.A medida que el rendimiento de una sola tarjeta se dispara y los grupos de IA se expanden a decenas de miles de aceleradores, ha surgido silenciosamente una contradicción fundamental: Los datos ya no pueden fluir eficientemente por todo el sistema.

Se puede entender con una simple metáfora urbana: Los nodos informáticos son como rascacielos: cada año se vuelven más altos y poderosos.Sin embargo, las carreteras que conectan estos edificios nunca se han actualizado al mismo tiempo.El resultado es claro: hay hardware potente listo, pero el tráfico de datos se congestiona gravemente.

La visión más sugerente de este informe es sorprendente: En la era 448G, los chips e incluso los módulos ópticos están básicamente completamente maduros y listos para su implementación masiva. El verdadero cuello de botella reside en el hardware descuidado durante mucho tiempo: conectores, enlaces físicos y todo el ecosistema de interconexión eléctrica.

Cuando el desafío central pasa de potencia de cálculo insuficiente a ancho de banda del sistema insuficiente, y el cuello de botella se mueve desde el interior del chip hasta entre los chips y las rejillas, La lógica competitiva de la infraestructura de IA se está reescribiendo por completo.

Tema central del informe

La demanda explosiva de IA está empujando a los centros de datos a la era de la interconexión de alta velocidad 448G.El desafío de la industria ya no es la viabilidad tecnológica, sino si el sistema de interconexión completo (incluidos SerDes, conectores y enlaces ópticos) puede seguir el ritmo del crecimiento exponencial de la IA.

Esencia del problema: la expansión de la IA equivale a una demanda de conexión explosiva

El informe presenta una conclusión fundamental: los clústeres de IA a gran escala están impulsando un crecimiento explosivo y exponencial en el ancho de banda de los centros de datos.Tres caminos principales de escalamiento definen el futuro desarrollo de la interconexión:

  • Ampliación (intraservidor): SerDes de 448G/carril de mayor velocidad y densidad de embalaje mejorada
  • Ampliación horizontal (rack a rack): Canales ópticos ampliados con transmisión de alta densidad de 8/16/32 carriles
  • Scale-Across (centro de datos cruzado): Redes ópticas a gran escala para programación de recursos a larga distancia

Conclusión principal: el mayor problema de la IA ya no es la informática insuficiente, sino capacidad de interconexión inadecuada.

Tendencia general: toda la industria avanza hacia la interconexión 448G

El informe se centra en el estándar central: 448G por carril.

La razón por la que 448G se vuelve inevitable: Admite requisitos de ancho de banda de clústeres de IA ultragrandes y crea capacidad de conmutación a nivel de PB.

Ya existen bases técnicas maduras: El proceso CMOS de 3 nm proporciona un ancho de banda de alta frecuencia de más de 100 GHz, DAC/ADC de alta velocidad 224GS/s, y arquitectura SerDes de alto rendimiento de próxima generación.

En resumen: el hardware del lado del chip está completamente preparado para la actualización 448G.

El verdadero cuello de botella: no los chips, sino las limitaciones de los enlaces físicos

Esta es la idea más crítica del informe.

1. Límites físicos severos de SerDes
Exige un ancho de banda operativo de 112 GHz, fluctuación por debajo de 100 fs y requisitos de SNR ultra altos, lo que lleva los SerDes eléctricos de alta velocidad cerca de los límites físicos.

2. Los conectores se convierten en la placa más corta
Las estructuras OSFP existentes apenas pueden soportar la modulación PAM6. Los conectores tradicionales no pueden adaptarse a PAM4 en escenarios de alta velocidad. Una conclusión clara: las futuras aplicaciones 448G no pueden depender de las soluciones de conectores heredadas actuales.

3. Riesgos graves para la integridad de la señal
La pérdida de alta frecuencia, la interferencia cruzada y los cuellos de botella en la transición BGA restringen la transmisión estable. Las soluciones de la industria se centran en interconexión flexible y arquitecturas de conexión 2D de alta densidad.

Competencia de esquemas de modulación: PAM4 vs PAM6 vs PAM8

El informe realiza una comparación en profundidad de tres formatos de modulación convencionales:

  • PAM4: Alta demanda de ancho de banda, pero el más maduro, estable y rentable
  • PAM6: Umbral SNR más alto, mayor dificultad de diseño
  • PAM8 : Mayor densidad teórica con beneficios prácticos limitados y complejidad excesiva

Conclusión clave: los beneficios adicionales de la modulación de orden superior no pueden compensar los crecientes costos y riesgos técnicos. Incluso para 2028, PAM4 seguirá siendo la única solución confiable y convencional para una implementación a gran escala.

Interconexión óptica: completamente madura para hacerse cargo de futuras actualizaciones

La tecnología óptica se ha convertido en el avance más fiable:

  • La transmisión óptica de un solo carril 448G ha sido completamente verificada
  • Admite transmisión de larga distancia de 2 km y sistema de conmutación a gran escala de 3,2 Tbps
  • La tecnología TFLN sin controlador y los moduladores EML avanzados reducen aún más el consumo de energía

Los módulos ópticos no son el cuello de botella: son el avance fundamental para la interconexión de IA de próxima generación.

Sentencia fundamental final

  1. Impulsado por la IA, el ancho de banda de los centros de datos globales está entrando de lleno en la era 448G.
  2. Los chips y módulos ópticos están técnicamente listos, mientras que los enlaces eléctricos, los conectores y la infraestructura heredada están muy rezagados.
  3. En el futuro, la competencia por la potencia informática de la IA ya no se centrará en el rendimiento de un solo chip. La competitividad central estará definida por capacidad de interconexión a nivel de sistema.

Resumen

La IA ha roto el equilibrio original entre informática y transmisión. En la nueva era 448G, la interconexión está reemplazando a la potencia informática como limitación principal. Quien domine los enlaces de alta velocidad, los conectores y la interconexión óptica ocupará una posición dominante en la próxima ola de competencia en infraestructura de IA.