
Специально для тех, кто в танке: компания AMD буквально только что презентовала новое поколение десктопных процессоров и материнских плат. Как, вас это совсем не удивило? Странно. Вероятно, вы очень осведомленный человек. В сем остальным, чтобы осознать всю значимость и одновременно предопределенность этого события, стоит поворошить прошлое Advanced Micro Devices и вспомнить, как развивались события. А я помогу.
Процы AMD семейства Athlon ведут свою историю с 1999 года: тогда начался выпуск x86-процессоров K7 с ядрами Pluto, Orion (которые мало кто помнит, да и вставлялись они в античный разъем Slot A), а в 2000 году, уже с переходом на значительно более популярный впоследствии Socket A (462), появились известные ядра Thunderbird. Плеяда замечательных Athlon и Athlon XP: Duron, Palomino, Thoroughbred, Barton, Thorton, которые и наш журнал восторженно описывал в те далекие годы, это все продукты развития микроархитектуры К7. Греет душу и тот факт, что первыми частоту 1 ГГц преодолели именно топовые «Атлоны», – тот рекордсмен, 1116-мегагерцевый Athlon стоил $1300 в оптовых партиях.
Не останавливаясь на достигнутом, следующий правильный шаг AMD сделала в 2003 году. Компания начала выпуск серверных процессоров Opteron с другим внутренним устройством, которое получило имя К8. Помимо вполне понятной «работы над ошибками», которые имелись в процах K7, революционных нововведений появилось ну очень много. Самое главное – интегрированная в CPU часть северного моста, контроллер подсистемы памяти. Впервые для того, чтобы загнать данные из CPU в ОЗУ и переместить накопленное обратно, больше не нужно было перемещать их по шинам матплаты.
Работа инженеров AMD напомнила мне изыскания алхимиков в Средние века. Смешивая известные вещества, они искали «философский камень».
В контексте сегодняшней статьи это очень важный факт. Запомните: первые удачные реализации идеи размещения компонентов на едином кристалле начались с подачи именно AMD еще восемь лет назад. Фактически AMD поставила на выигрыш за счет выполнения как можно большего количества инструкций за такт (в К8 – три) и короткого вычислительного конвейера процев K8, что позволило получить паритет с CPU главного конкурента при меньших тактовых частотах. Давайте взглянем, что предлагала нам Intel в 2003 году (в «верхнем» десктопном сегменте). Это был расцвет микроархитектуры P68 (NetBurst), или, если совсем упрощенно, «четвертого пня» с кодовыми названиями ядер Willamette и Northwood. Для сравнения: ядро K8 проводило вычисления в 12 стадий, NetBurst – в 20, а появившийся в 2004 году знаменитый «отопительный прибор» Prescott и вовсе имел 31-шаговый конвейер.
И именно разница в подходах к решению одной и той же задачи значительно повлияла (и продолжает влиять!) на ход событий. Если вы помните, для дальнейшего ускорения процессоров Intel встала на путь экстенсивного увеличения частот и, спустя годы, количества ядер, а аэмдэшные процы в силу технологических причин изначально не позволяли сильно задирать такт. Prescott в процессе эволюции достиг 3,8 ГГц, AMD Athlon 64 довольствовались частотами 2,0-2,8 ГГц. И если отметка в 2 ГГц была пройдена обоими процессорными гигантами без помпы (во всех смыслах этого слова (хитрый смайл) и относительно без затруднений, то 3 ГГц, не считая оверклокеров, первыми увидели приверженцы платформ Intel.
По прошествии лет на основе К8 было сделано огромное количество процессоров семейства Athlon, одно- и двухъядерных, и это было очень славное время для компании. AMD вновь напомнила о себе осенью 2007 года: новый 65-нанометровый техпроцесс, новый «серверный» Opteron на ядре Barselona, новая микроархитектура K10 Stars – и новое имя Phenom в перспективе для всех. Причем, как всегда, за недорого. В ожидании релизов казалось, что AMD закрепит былые успехи и чем-нибудь удивит. И ведь правда, удивлению не было предела: впервые за много лет AMD явно начала «буксовать». Появившиеся буквально из ниоткуда в 2006 году, процессоры Intel Core 2 Duo оказались очень сильным противником.
Сделанные на основе 45-нанометрового техпроцесса, они функционировали на очень высокой частоте (в разгоне – до 4 ГГц «на воздухе» и больше 6 ГГц под более серьезным «холодильником»), а били они всех благодаря весьма эффективному короткому конвейеру, емкому и быстрому L2-кэшу, общему для всех ядер, и 65-ваттному TDP. Примечательно, что для такого технологического прорыва интеловцам пришлось забыть многие прошлые наработки по NetBurst и вернуться к позапрошлым, взяв за основу Pentium M и Pentium II, фактически придумав новый суперкамень с нуля.
AMD, переходя с К8 на К10, была настроена не столь радикально. Но инженерам и программистам все равно пришлось проделать очень серьезную работу: усовершенствовать механизм предсказания переходов, ввести новые инструкции, модернизировать блок, ответственный за вычисления с плавающей точкой, а помимо увеличения пропускной способности личного для каждого из ядер кэша второго уровня ввести общий L3-кэш. Был улучшен и встроенный контроллер памяти: теперь он поддерживал память DDR2. Некоторые недостатки мудреной системы кэширования можно было бы легко скомпенсировать мегагерцами, но их как раз очень не хватало: все, включая разгонные возможности, упиралось и в тепловыделение, читай – в микроархитектуру, и в 65-нанометровый техпроцесс.
Новейшие четырехъядерные AMD Phenom X4 и их «обрезки» с тремя ядрами, а также «Атлоны» и «Семпроны», едва вызвав интерес у знающих людей, начали интенсивно терять очки. Ситуация немного улучшилась с появлением в 2009 году процессоров Phenom II с ядрами Deneb, Heka и Callisto – благодаря 45-нанометровому техпроцессу частоты перешагнули наконец через порог 3 ГГц и достигли 3,6 ГГц. И все бы ничего, но Intel им противопоставила мощные «квадкоры» и «гексакоры» Core i5 и i7 микроархитектуры Nehalem, и основное преимущество AMD на этом этапе эволюции виделось лишь в неприлично низкой цене камней. Да и не ровня Stars и Nehalem: 32-нанометровый Core i3 с двумя ядрами может нахально потягаться с AMD Phenom II X4 и в некоторых дисциплинах уйти вперед с приличным отрывом.
Сейчас на K10.5 – это последняя версия микроархитектуры Stars – основаны актуальные шестиядерники AMD с ядрами Thuban и их четырехъядерными братьями Zosma и Deneb. Они при низкой стоимости имеют высокую производительность, но и их век подходит к своему концу.
2011 год. Новый удар и новые повороты
Из всего вышенаписанного становится очевидно, кто из двух соперников с каким арсеналом пришел в лето 2011 года. Как разворачивались события в 2011 году, знают, наверное, даже те, кто компьютерами особо не увлекается: Intel на Новый год «выкатила» CPU семейства Sandy Bridge – отличный подарок любителям апгрейда. Причем с «аксессуарами» в комплекте – новым набором логики и новым сокетом. Поспешное освоение тонкого техпроцесса при проектировании чипсета привело к фатальной аппаратной ошибке, из-за чего продуманная до мелочей схема экспансии новых процев дала сбой, но на общий ход событий это почти не повлияло.
Итак, сейчас у Intel – три действующих процессорных разъема: LGA 1155, LGA 1366 и в какой-то степени LGA 1156. Несколько новых чипсетов P67, H67, Z68, «корпоративные» наборы логики B65, Q65, не считая «старых» (образца 2009 / 2010 годов) X58 и P55, а также прошлые комплекты – H55, H57, Q57. И не меньшее изобилие процессоров под все перечисленное, на любой вкус и кошелек. У AMD – Socket AM3, некоторое количество топовых процев с шестью ядрами, а также всех прочих с четырьмя и двумя, бюджетный Sempron до кучи и целые две линейки чипсетов AMD серий 7хх и 8хх. Разница есть, не правда ли? Не велите казнить: я сознательно умолчал об AMD Brazos. Во-первых, это совсем даже не CPU, а APU, во-вторых, это все же не десктопный сегмент, хотя за «неимением горничных» материнские платы на его основе встречаются и в настольных мини-ПК.
Расскажем о терминах, или «речки-кошечки-собачки»
В последнее время наблюдается явная запутанность, которую внесла AMD, именуя кодовыми словами свои новые продукты и технологии. Вот AMD Llano, который сегодня «виновник торжества» и до которого мы никак не доберемся, это что? Это – название процессора с видеоядром, собственно камня. По аналогии AMD Zacate или серия E – тоже APU с интегрированной графикой, но «играющий» в мобильном сегменте.
AMD Llano имеет микроархитектуру с названием Husky («собачка-лайка»?), а AMD Zacate – Bobcat («красная рысь»). Когда AMD выпускает тот или иной новый процессор, она заранее готовит для него платформу: в случае с AMD Zacate это Brazos (запомнить можно – это речка в США, берега которой воспеты в тюремных песнях), для AMD Llano уготована Lynx – просто «рысь». Есть и третий вариант компоновки, мобильная платформа Sabine (женское имя), которая нацелена на лэптопный сектор, но, в отличие от Brazos, ориентирована на более мощный, чем AMD Zacate, процессор Llano, однако сегодня она в рамки материала никак не вписывается. Весь конструктор относится к концепции Fusion, разработке, которая берет начало с момента слияния AMD и ATI.
Итак, Lynx – это композиция из APU Llano и материнской платы, в основе которой лежит FCH – Fusion Controller Hub. Как мы не раз говорили и еще скажем, после переезда всех компонентов северного моста под теплораспределительную крышку FCH стал неким дистрибуторским центром, который под управлением APU командует всей периферией, начиная с USB-портов и заканчивая выходами HD Audio и каким-нибудь кардридером, который, кстати, не шутка, а теперь вполне самостоятельная функция «чипсета». В Lynx на сегодняшний день входят два варианта платформ – A75 FCH и A55 FCH. Отличий в них немного: A75 – старшая модель, нативно поддерживает четыре порта USB 3.0 и имеет хитрый дисковый контроллер, позволяющий к одному SATA-порту подключать несколько накопителей по технологии FIS Based Switching.
Llano: cтавки на Fusion сделаны
Что увидит IT-журналист или простой пользователь, которому в руки попадет новый AMD Llano? Правильно, процессор. То есть все тот же квадрат из композита с металлической крышкой сверху и множеством позолоченных ножек на брюшке. Конструкция процессорного разъема, если сравнивать Socket FM1 для Llano и Socket AM3 для Athlon / Phenom, принципиально не изменилась: это все тот же PGA-ZIF-разъем («с лапкой»), но количество контактов в нем теперь 905 против 941 у Socket AM3. Та тщательно выстроенная цепочка AM2 – AM2+ – AM3, (которой не раз попрекали Intel, меняющую сокеты чуть ли не раз в год) нарушилась, и уже точно можно говорить об отсутствии совместимости AM3 и FM1, и прямой, и обратной.

При этом Socket AM3+ (который, скорее всего, станет переходным) будет еще какое-то время поддерживать на плаву старые процессоры, но и его достаточно быстро сменят. И еще, несмотря на решительный отказ от старых разъемов, совместимость креплений кулера сохранилась, и старый охладитель для AM2 / AM3, который вам так дорог, отлично поработает и на FM1. Внешне, если не вчитываться в маркировки, отличий с камнями Socket AM3 нет. Гораздо интереснее становится, если снять теплораспределитель и посмотреть на начинку, желательно под сильным микроскопом.
В структуре процессора (если брать старшую модель A8) отчетливо видны следующие блоки: четыре вычислительных ядра с личным 1 Мбайт L2-кэша для каждого, двухканальный контроллер памяти DDR3 с приткнувшимися к нему северным мостом и модулем UVD-декодирования, а также контроллер 24 линий PCI Express 2.0 в выделенной зоне интерфейсного блока внизу. 16 линий предназначаются видеокарте, причем в зависимости от количества видюх они могут использоваться по схемам 1 х 16 или 2 х 8, то есть поддержка CrossFire X реализована на уровне APU. Еще четыре уходят на периферию, для общения CPU и FCH по UMI-шине, производительность которой не хуже, чем у аналога от Intel.
Все перечисленное – только «левая половина» ядра, примерно столько же места занимает GPU. Вы только представьте: на графический контроллер и его «обвязку» отведено столько же площади чипа, сколько и на четыре вычислительных ядра с кэшем, – да, это заставляет задуматься. Ну а теперь по порядку. Техпроцесс нового чипа – 32 нм. Ныне это не самая мелкая микросхема – Intel сейчас откатывает нормы 22 нм, которым, согласно ожиданиям, будут соответствовать будущие процы Ivy Bridge, которые должны выйти к концу этого года. В AMD прекрасно осознают технологическое отставание и (вспомните 2003 год!) уповают на обновленную микроархитектуру, увеличение количества инструкций за такт, улучшение сообщения по шинам между компонентами процессора (29,8 Гбайт/с по связке «видеоядро-системная память»). Но главная ставка делается на встроенный GPU.

Вычислительные ядра – вы не поверите – все те же Stars. Когда я впервые услышал это, я минуту не мог говорить. Новый процессор, весь из себя новаторский, «растет» из 2007 года! Но помимо перехода с 45-нанометрового техпроцесса на нормы 32 нм его порядком усовершенствовали. Так, заметна реорганизация контроллера памяти: теперь официально поддерживаются модули до 64 Гбайт с тактовой частотой до 1866 МГц. Доработан аппаратный блок предсказания ветвлений, увеличен кэш L2, а L3 отрезан совсем.

Здесь хорошо видны преимущества APU Llano перед Intel HD Grafics и Intel Sandy Brige
Кроме того, в камне применена технология Turbo Core второго поколения, динамически изменяющая частоту каждого из ядер в зависимости от нагрузки. Датчики тока, встроенные в кристалл, цифровые, что увеличивает точность регулирования. Вообще же, реализации технологий энергосбережения отведено немало внимания, поскольку несколько горячих кристаллов под одной крышкой – это не шутка, а повторения истории Prescott не хочет никто. Старшие десктопные модели «втиснуты» в 100-ваттные нормы TDP (динамический разгон Turbo Core в них отключен), младшие довольствуются 65-ваттным пакетом и могут ускоряться на несколько сотен мегагерц.
Главный козырь
Если окинуть взглядом все новшества в Sandy Bridge и так же пристально взглянуть на APU Llano, сразу станет видно, что Intel основные ставки сделала на вычислительную часть и выполнила ее просто блестяще. Настолько, что AMD пока даже не приблизилась к чему-то подобному. Чтобы сократить отставание, нужно было найти слабое место, ахиллесову пяту конкурента. Не считая слаборазвитой периферии у интеловских платформ (вспомните, для примера, про порты USB 3.0, которые в LGA 1155-платформах подключены через дискретные контроллеры матплаты, или целых два «чипсетных» порта SATA 6 Gb/s там же и сравните с функциями A75 FCH), таким местом стала графика. И основной «удар» AMD стратегически верно решила нанести в эту область.
Графическое ядро AMD Llano A8 – гордость инженеров компании.

Структура младшего FCH от AMD. Как видно, список обслуживаемой им периферии очень длинен, и этим он мало отличается от старшего A75
Название его красноречиво, Sumo, а в основе лежит кристалл Redwood. Это доработанная пятитысячная линейка Radeon, а именно Radeon HD 5600 – самое мощное интегрированное решение сегодняшнего дня. Посудите сами: 400 потоковых процессоров, функционирующих на частоте 600 МГц с полной аппаратной поддержкой DirectX 11, DirectCompute и OpenCL, также имеются: двойная 2 х 64-битная шина с возможностью отправки данных непосредственно в память, 5 блоков SIMD, 20 текстурных процессоров, 8 блоков ROP, «пятые шейдеры» (Shader Model 5.0). Нативно поддерживаются 24х-мультисэмплинг и 16х-анизотропия. Плюс есть возможность объединения усилий по обработке графики с дискретной видеокартой – режим Dual Grafics. Блок видеодекодера UVD, упоминаемый выше, понимает все распространенные форматы файлов. К тому же все модули, входящие в графическую подсистему, динамически отключаемы, что экономит энергию и снижает температуру кристалла.

Того, что обеспечивает AMD A75, вполне достаточно для построения хорошего мультимедийного ПК. Есть даже кардридер!
Узкие места
Если внимательно изучать структуру нового процессора, узких мест даже невооруженным глазом и даже без подробного тестирования видится несколько. И первое из них напрямую касается графического блока. Беда в том, что разогнанная даже до 1866 МГц «десктопная» память DDR3 не так быстра, как GDDR5, которая применяется в видеокартах, а в контексте AMD Llano она используется не только для нужд GPU, но и для CPU.
Да, как я уже говорил, GPU имеет приоритет, но при высокой нагрузке и он не поможет, и снижение скорости графических вычислений – вполне реальная угроза. Но в AMD предусмотрели и такой вариант развития событий – в будущих реализациях платформы Lynx должен появиться чип или чипы быстрого банка Side Memory. Второе «бутылочное горлышко» – инфраструктура и коммуникации модулей. Intel уделила максимум внимания этому аспекту, применив в процессорах Sandy Bridge кольцевую шину, по которой все компоненты могут обмениваться данными между собой. AMD такой разработки не имела, зато задействовала Fusion Compute Link. Это первая реализация технологии связи GPU и северного моста, минуя линии PCI Express.
Третье узкое место – подсистема памяти. С учетом нагрузки со стороны CPU и GPU даже 1866 МГц – это мало. Intel со своими 1333 МГц (но 2133 МГц в разгоне!) выглядит хуже.
Четвертое – снова малая тактовая частота вычислительного блока. Поскольку мы видим очередную инкарнацию K10, этот недостаток опять дает о себе знать. Даже «верхний» камень A8-3850 работает на 2,9 ГГц (по вычислительным ядрам), младший же довольствуется 2,1 ГГц. Ну а топовый четырехъядерный AMD Llano соответствует по частоте младшему четырехъядерному Intel Core i5. Дорогу оверклокерам!
Только не спешите делать выводы
Новые процессоры AMD стоит рассматривать не как попытку «свалить» Intel, а как пробный шар, который AMD пустила на дорожку, чтобы «пристреляться» и сбить нескольких стратегических кеглей. Целей несколько. Первая – напомнить о себе, встряхнуть покупателей, застолбить участок – называйте как угодно. Ведь за чередой релизов процессоров и чипсетов Intel Sandy Bridge про AMD как-то подзабыли, несмотря на удачный старт платформы Brazos в ноутбуках.
Вторая – начать практическую реализацию мощных десктопных решений проекта Fusion, и с этой точки зрения AMD Llano – просто концепт, в котором, как в конструкторе, могут быть заменены основные составные части – вычислительные и графические ядра – и, соответственно положение и цена готовых изделий на рынке. Не исключено, что запуск данных процев вызовет переход некоторых пользователей с платформы AM3 на платформу FM1, а также даст временную отсрочку на случай задержки выпуска Bulldozer, который, по всем имеющимся сведениям, будет технологически совершеннее. Ни в коем случае нельзя воспринимать Socket FM1 и камни Llano A8 как законченное топовое решение. Скорее всего, это основа недорогого мультимедийного ПК для рядового пользователя «на каждый день». С мощной графикой, экономичного и функционального. UP
Будущая аудитория и оверклокеры
Многие потенциальные покупатели очень расстроились, узнав, что AMD Llano не будет поддерживаться со стороны «старых» материнских плат. С этой точки зрения ситуация не выглядит радужной, поскольку владельцы AM3-процессоров вряд ли побегут наперегонки за новым CPU, который по вычислительной мощности заведомо слабее их «Фенома». Зато возрадовались оверклокеры, которые, увидев волшебные слова «новый 32-нанометровый техпроцесс», принялись радостно потирать ладони.
Спешу немного охладить пыл поклонников «поджарки камней»: в AMD Llano не только применен тонкий техпроцесс, но и значительно усложнена внутренняя структура камня, что на разгоне сказывается крайне негативно. Нельзя забывать и о том, что CPU более поздних степпингов разгону поддаются намного лучше – сказывается последовательная оптимизация внутренней структуры.
Но о том, как разгоняется AMD Llano, уже есть первые сведения. Итоговая частота процессора по привычной схеме складывается из частоты базовой шины (100 МГц) и множителя. Понятно, что так жестко блокировать оверклокинг, как Intel, AMD не стала – фанаты просто не поймут. На радость всем, шина поднимается точно, множитель – нет. Но есть непроверенная информация о том, что скриншоты CPU-Z с 3,8 МГц на ядре – фейк, поскольку из-за ошибки первых BIOS выставленный выше 29x множитель просто игнорируется, но фиксируется оптимистичными программами мониторинга. При этом видимого увеличения производительности нет. Тестовые лаборатории уже предупреждены о странном явлении, а проверить, так ли это, лично я смогу уже на следующей неделе.



Смотрю на таблицу номер 1 и не могу понять, толи там ошибка в строках TDP и GPU, толи мне обратно в школу пора =)