
À medida que os tamanhos dos modelos de ia continuam a crescer, a demanda por largura de banda e capacidade de memória aumenta exponencialmente, colocando as arquiteturas co‑empacotadas existentes de gpu–hbm à beira das limitações físicas. para superar esse gargalo, a indústria está acelerando a exploração de um novo paradigma de integração heterogênea — desacoplar as gpus do hbm em pacotes separados e reconfigurar os caminhos de dados com interconexões ópticas.
segundo a trendforce, citando insights de especialistas técnicos dos fabricantes de dram, a arquitetura de próxima geração abandona a tradicional abordagem de empacotamento 2.5d, na qual o hbm é estruturado de forma compacta ao lado da gpu, optando, em vez disso, por um design desagregado: gpus e hbm são implementados como chiplets independentes, interligados por links ópticos integrados no próprio chip. essa solução não apenas alivia significativamente a densidade de fiação no nível da placa-mãe e os desafios de gerenciamento térmico, mas, mais importante, supera as restrições de espaço físico, permitindo que uma única gpu suporte muito mais módulos de hbm do que os padrões atuais — alcançando, assim, uma escalabilidade flexível tanto da largura de banda quanto da capacidade.
a atual trajetória de escalabilidade predominante — empilhar camadas adicionais de dram (por exemplo, passar de 12 ou 16 camadas para 20 ou mais) — enfrenta múltiplos obstáculos, incluindo a queda acentuada nos rendimentos de fabricação, o aumento vertiginoso dos custos e o estresse térmico descontrolado. ao mesmo tempo, o incremento no número de chips de hbm ao redor da gpu também já atingiu os limites das capacidades de i/o do substrato e de fornecimento de energia sob o empacotamento 2.5d. diante desse cenário, o desacoplamento físico tornou-se uma escolha inevitável. no entanto, interconexões mais longas inevitavelmente introduzem latência de sinal; as interconexões ópticas, com suas vantagens de baixa latência, alta largura de banda, forte imunidade a interferências e baixo consumo de energia, emergem como suportes ideais para compensar as perdas de desempenho em transmissões de longa distância.
atualmente, a indústria avalia sistematicamente diversas configurações de implantação, como posicionar os módulos de hbm sob a placa‑suporte da gpu, nas suas laterais ou em placas‑filhas independentes, a fim de maximizar a utilização dos recursos espaciais tridimensionais. essa mudança não apenas remodelará o roteiro das tecnologias avançadas de empacotamento, como também impulsionará a integração da fotônica rumo à miniaturização em escala de chip — como alcançar interconexões ópticas eficientes, estáveis e econômicas, tanto dentro do chip quanto entre chips, em espaços de empacotamento da ordem de milímetros, tornou-se um importante obstáculo tecnológico que ainda dificulta a produção em massa e a implementação prática.