Sítio do Piropo

B. Piropo

< Jornal Estado de Minas >
Volte
16/02/2006

< Os chips de núcleo duplo da AMD >


Ano passado foi o ano dos processadores de núcleos múltiplos. Tanto a Intel quanto a AMD lançaram seus novos chips de núcleo duplo que representaram um significativo avanço em relação a seus antecessores, uma mudança que pode ser considerada a transição para uma nova geração. Há algumas semanas falamos aqui sobre os da Intel. Hoje, vamos ver como a AMD vem enfrentando essa batalha tecnológica com seus microprocessadores Opteron e Athlon, ambos de núcleo duplo, aos quais se junta agora o novo Turion 64, também de núcleo duplo porém otimizado para dispositivos moveis.
A AMD ainda fabrica seus microprocessadores em camadas de silício de espessura de 90nm (nanômetros, ou milionésimos de milímetro) enquanto, desde o ano passado a Intel já adota a tecnologia de 65 nm com menor dissipação de calor, o que permite alcançar freqüências de operação efetivas mais elevadas e, em teoria, produzir chips mais rápidos e com melhor desempenho. Como, então, a AMD vem conseguindo fazer face à nítida superioridade da Intel no que diz respeito à tecnologia de fabricação conseguindo com seus microprocessadores um desempenho semelhante – e em alguns casos, superior – aos chips de mesma categoria da rival? A resposta é simples: adotando melhorias na arquitetura interna de seus microprocessadores.
Essas melhorias consistem basicamente no aperfeiçoamento dos caches internos, na adoção da “Direct Connect”, uma conexão entre núcleos e entre eles e o mundo exterior de baixíssima latência (curtos tempos de espera para troca de dados) e no emprego do HyperTransport, um barramento que atinge taxas de transferência de até 24 GB/s.

Figura 1

A tecnologia de núcleo duplo consiste na inclusão de um núcleo de processamento adicional no mesmo circuito integrado (“chip”) do microprocessador, que passa a funcionar como duas unidades semi-independentes e já vem sendo usada com grande alarde pela Intel em seus novos chips. Mas pouca gente sabe que a AMD se prepara para ela desde os anos noventa, desenvolvendo e integrando em seus chips de núcleo simples uma arquitetura interna voltada para a multiplicidade de núcleos. Tanto é assim que, enquanto os novos chips de núcleo duplo da Intel exigem um novo “chipset” (conjunto de circuitos auxiliares que interconectam e controlam os demais componentes da chamada “placa-mãe”) mesmo para quem tinha em sua máquina um microprocessador de geração imediatamente anterior, tudo que é necessário para substituir um chip moderno da AMD por seu sucessor de núcleo duplo é uma atualização do BIOS (Basic Input/Output System, ou sistema básico de entrada e saída, que vem gravado em um circuito de memória Flash integrado à placa-mãe). E para isto basta obter o novo código do BIOS e rodar o programa de atualização. Nenhuma alteração de hardware é necessária: tanto os Opteron quanto os Athlon de núcleo duplo podem ser encaixados nos mesmos soquetes (de 940 e 939 pinos, respectivamente) de seus antecessores imediatos de núcleo simples.
Os aperfeiçoamentos na estrutura do cache interno dos chips AMD, tanto no nível L1 (dois caches por núcleo, ambos de 64K, um apenas para dados outro somente para instruções) quanto L2 (uma unidade de cache de 1 MB por núcleo) propiciaram um ganho de 5% a 10% no desempenho. Isso porque, ao contrário da usada pela Intel, a tecnologia de leitura/escrita no cache adotada pela AMD permite que dados sejam alterados diretamente no cache sem exigir que esta alteração seja transposta imediatamente para a memória principal. Agora, com a adoção da tecnologia ccHT (“cache coerency HyperTransport”) as conexões entre o sistema e a(s) UCP(s) ficaram ainda mais rápidas.
A tecnologia Direct Connect permite uma conexão direta entre o núcleo do processador e o controlador da memória. Para conseguir uma integração tão coesa a AMD transferiu o controlador da memória (que classicamente faz parte de um dos barramentos externos da UCP, o chamado FSB, de “Front Side Bus” ou barramento frontal) para o interior do circuito integrado do próprio microprocessador, eliminando o “gargalo” causado pelo barramento. Na prática isso corresponde a eliminar o próprio barramento frontal, já que os periféricos ligados aos demais barramentos externos passam a se ligar ao Direct Connect. E é justamente o barramento frontal usado pela Intel desde o Pentium Pro o responsável pelo mais estreito gargalo enfrentado pelos microprocessadores da empresa: enquanto a tecnologia Direct Connect da AMD permite que controlador de memória e processador operem na mesma freqüência (que, hoje, varia de 1,8 GHz a 2,8 GHz), as transferências de dados através do barramento frontal da Intel ficam sujeitas à freqüência de operação deste barramento, atualmente limitada a 1.066 MHz (em um barramento que na verdade opera em 266 MHz mas é capaz de efetuar quatro transferências de dados por ciclo usando a tecnologia denominada DDR2). E ainda assim com limitações adicionais: como implica o próprio nome, a tecnologia DDR (Double Data Rate, ou taxa dupla de dados) só vale para dados. Os endereços e sinais de controle continuam trafegando na taxa nativa do barramento, de 266 MHz.
A tecnologia denominada HyperTransport fornece uma ligação direta seja entre mais de um processador na mesma placa-mãe (em placas que adotam o chamado “processamento paralelo” que usam mais de um microprocessador que, por sua vez, pode ser de núcleo simples ou múltiplo) seja entre o barramento interno do processador (“crossbar”) e os dispositivos de entrada e saída. O HyperTransport é constituído por até três canais (ou “links”) cada um capaz de transportar até 8 GB/s de dados, o que permite alcançar uma taxa de transferência conjunta de 24 GB/s entre diferentes componentes na mesma placa-mãe. Na tecnologia baseada no barramento frontal da Intel, os processadores compartilham o mesmo controlador de memória externo. Este controlador se comunica tanto com a memória quanto com os dispositivos de entrada/saída através de seus respectivos barramentos (PCI, AGP, PCI Express). Em virtude disso todas as interconexões, mesmo entre diferentes processadores, ficam limitadas à taxa de transferência do barramento frontal. Além disso, os canais do HyperTransport permitem que os dados fluam simultaneamente nos dois sentidos (tecnicamente: é “full duplex”) enquanto o FSB só permite o fluxo em um sentido de cada vez (ou seja, é “half duplex”).
Assim, implementando aperfeiçoamentos na arquitetura de seus microprocessadores que garantem um aumento de desempenho, a AMD vem enfrentando a poderosa Intel. Aperfeiçoamentos, aliás, que não se resumem aos descritos acima: além deles a AMD vem alterando certos componentes internos de seus microprocessadores. Foram melhorados a unidade de ponto flutuante, a tecnologia SIMD (Single Instruction Multiple Data, instruções capazes de afetar simultaneamente a todo um conjunto de dados, usadas principalmente em aplicativos “multimídia”) e o “previsor de ramo” (uma tecnologia usada em processadores capazes de executarem mais de uma instrução ao mesmo tempo, cada uma em uma diferente região interna do processador, que usa um algoritmo bastante sofisticado para prever os resultados de operações pendentes e assim acelerar o processamento).
Mas, evidentemente, a Intel não está dormindo. A forma mais eficiente de contornar as limitações do barramento frontal é aumentar o cache interno. E por isso as unidades da família “Conroe”, a nova série de chips da Intel, ostentarão caches L2 com capacidade variando de 2 MB a 4 MB por núcleo (ou seja: em um único microprocessador de, digamos, núcleo duplo, pode haver 8 MB de cache interno, o que faria corar de vergonha meu primeiro PC com seus míseros 640 KB de memória RAM). E as melhorias não se resumirão à capacidade: o desempenho de ambos os níveis de cache (L1 e L2) do Conroe será significativamente melhorado. E, nas plataformas multiprocessadas, a Intel pretende adotar dois FSB independentes ligando os processadores o que, se não alcançará o desempenho do HyperTransport, chegará perto. Além disso, a Intel caminha celeremente para reduzir ainda mais a espessura da camada de silício de seus chips: dentro de um par de anos ou menos estaremos usando microprocessadores com camadas de silício de incríveis 45 nm de espessura. Um prodígio tecnológico.
E quais são os planos da AMD para o futuro?
Bem, nesse caso há que se fazer um exercício de adivinhação. Porque, ao contrário da Intel que põe à disposição da imprensa especializada uma imensa quantidade de informações técnicas e promove regularmente fóruns e eventos para discutir os rumos da empresa, a AMD trata suas informações com extraordinária parcimônia e quando se solicita detalhes tudo o que se recebe dela são folhas de especificações de microprocessadores (o que, incidentalmente, pode justificar alguma eventual imprecisão neste artigo, que não foi baseado em informações oficiais da AMD). Mesmo em seu sítio quase não se encontram documentos com detalhes técnicos. Mas a Internet está aí para isso mesmo e garimpando aqui e ali sempre se consegue alguma coisa.

Figura 2

Nos próximos meses a AMD deverá continuar aperfeiçoando sua tecnologia HyperTransport (fala-se na HT 3.0) que adotará a freqüência de 333 MHz em lugar dos 200 MHz atuais. Isso, combinado com a tecnologia DDR2, corresponderá a um barramento com freqüência de transporte de dados de 1.333 MHz. Além disso, os futuros Opteron deverão adotar o novo “socket F” de 1207 pinos, o que provavelmente significará um aumento da “largura” das conexões para transporte de dados entre os componentes da placa-mãe.
Espera-se ainda que nos próximos meses a AMD passe a adotar, embora com algum atraso, a tecnologia de fabricação de 65 nm. Quando isso ocorrer, provavelmente teremos uma nova arquitetura interna e, quem sabe, processadores capazes de operar em uma freqüência efetiva da ordem de 3,4 GHz. Que, por sua vez, adotarão uma conexão direta também incrementada, a Direct Connect 2.0. E, no próximo ano, é provável que surjam os primeiros chips AMD de núcleo quádruplo com um cache L3 compartilhado. Mas, é bom que fique claro, tudo isso são especulações.
Ao fim e ao cabo, considerando os fatos expostos, de quem você acha que serão as maiores vantagens?
Se sua resposta foi Intel ou AMD, enganou-se. Porque a maior vantagem de dispor de duas grandes fabricantes de microprocessadores, ambas lutando pela liderança tecnológica e comercial e concebendo chips com desempenho cada vez melhor e custo cada vez menor, sem nenhuma dúvida é nossa, do consumidor.
Que, para variar, afinal levará alguma vantagem...

B. Piropo