富岳とM1の共通点 [CPU]
昨日公表されたニュースによると、富士通の開発したスーパーコンピュータ“富岳”は、スーパーコンピュータの性能ランキングにおいて二期連続で4冠※を達成したという。
※「TOP500、HPCG、HPL-AI、Graph500」の4つで世界一位。
一方で先日Appleから発表された、Apple初の独自設計SoC“M1”はこれまでIntel MACに採用されたどのIntel製CPUよりも速く、しかも私の調べた限り既存のパソコン用CPUの中ではZen3を含めて最も消費電力当たりの性能が高いCPUである。
この二つ、“これまでに無かった圧倒的な高性能”という点で共通するが、この結果に対し大きな貢献を果たしている“ある仕様”も共通する。
それは“DRAMをCPUの直近に直付けしている”という点だ。
左が“富岳”のCPU「A64FX」、右はAppleのM1。
現在の一般的なパソコンやサーバーは、メインメモリを“モジュール”という部品として供給されていて、メイン基板にハンダ付けされた“カードエッジコネクタ”に差し込まれている。
メモリモジュール。写真はDDR4 SDRAMの物になる。
一般にメモリスロットと呼ばれるカードエッジコネクタ。写真はDDR SDARMの物。
この場合メモリはCPUから一定以上離れた場所に接続される。
その結果メインメモリへのアクセスには大きな遅延が生じて、アクセス速度を上げる事は容易ではない。
一方富岳は32GBの超大容量キャッシュメモリとしてHBMが、M1の場合はメインメモリとして8GB又は16GBのLPDDRメモリが、CPU直近に搭載されている。
このようにCPUとメモリチップが近いと信号の到達時間も短いし、HBMやDDR-SDRAMはパラレルバスなので各配線で信号の到達する時間を合わせる事が容易になる上、距離が短いという事は配線の抵抗も少なくなるためより細い配線を高密度に配置する事も可能となり、一般にメモリモジュールを使うDRAMは64bitバスであるのに対して富岳のA64FXの場合HBMのバス幅512bit、M1はメインメモリ周りの仕様は不明(バス幅は32bitx4?)ながらCPUダイ直近のパッケージ上にLPDDRを搭載するために相当なアクセス速度と低レイテンシを実現していると思われる。
こうしたメモリ周りの仕様に合わせてCPUコアの設計と動作させるソフトウェアの最適化も当然に行われていると思われ、これによって今までのシステムに無い高い性能を実現している。
ちなみに同様の共通点はPS5にもあり、同じZen2コアを持つRyzen 3700Xなどと比べると処理速度はかなり違うと考えられる。
PS5のSoCとM1と比べた場合、その差が気になる所だが。
スペックはPS5の方が上なので、PS5の方が速いとは思う。
それにしてもHBMを搭載したAMDのAPUはまだなのか!
もう5年以上待っているのだが。
当時のAMDによると構想はあるらしいが、Appleに先を越されている場合ではないと思う。
HBMの生産はMicronも始めた事だし、調達やコストの問題も改善されているはずなのだがなぁ。
参考:
スーパーコンピュータ「富岳」TOP500、HPCG、HPL-AIにおいて2期連続の世界第1位を獲得
https://www.riken.jp/pr/news/2020/20201117_2/index.html
富岳は、主要なスパコンベンチのすべてで1位を獲得することが重要
https://pc.watch.impress.co.jp/docs/news/1289662.html
同じZen2 APUでもまったくの別物
https://17inch.blog.ss-blog.jp/2020-03-20
AMDの“Zen”と、HBM
https://17inch.blog.ss-blog.jp/2015-05-08
スーパーコンピューター「富岳」が世界一位になったらしい
https://17inch.blog.ss-blog.jp/2020-06-23-1
※「TOP500、HPCG、HPL-AI、Graph500」の4つで世界一位。
一方で先日Appleから発表された、Apple初の独自設計SoC“M1”はこれまでIntel MACに採用されたどのIntel製CPUよりも速く、しかも私の調べた限り既存のパソコン用CPUの中ではZen3を含めて最も消費電力当たりの性能が高いCPUである。
この二つ、“これまでに無かった圧倒的な高性能”という点で共通するが、この結果に対し大きな貢献を果たしている“ある仕様”も共通する。
それは“DRAMをCPUの直近に直付けしている”という点だ。
左が“富岳”のCPU「A64FX」、右はAppleのM1。
現在の一般的なパソコンやサーバーは、メインメモリを“モジュール”という部品として供給されていて、メイン基板にハンダ付けされた“カードエッジコネクタ”に差し込まれている。
メモリモジュール。写真はDDR4 SDRAMの物になる。
一般にメモリスロットと呼ばれるカードエッジコネクタ。写真はDDR SDARMの物。
この場合メモリはCPUから一定以上離れた場所に接続される。
その結果メインメモリへのアクセスには大きな遅延が生じて、アクセス速度を上げる事は容易ではない。
一方富岳は32GBの超大容量キャッシュメモリとしてHBMが、M1の場合はメインメモリとして8GB又は16GBのLPDDRメモリが、CPU直近に搭載されている。
このようにCPUとメモリチップが近いと信号の到達時間も短いし、HBMやDDR-SDRAMはパラレルバスなので各配線で信号の到達する時間を合わせる事が容易になる上、距離が短いという事は配線の抵抗も少なくなるためより細い配線を高密度に配置する事も可能となり、一般にメモリモジュールを使うDRAMは64bitバスであるのに対して富岳のA64FXの場合HBMのバス幅512bit、M1はメインメモリ周りの仕様は不明(バス幅は32bitx4?)ながらCPUダイ直近のパッケージ上にLPDDRを搭載するために相当なアクセス速度と低レイテンシを実現していると思われる。
こうしたメモリ周りの仕様に合わせてCPUコアの設計と動作させるソフトウェアの最適化も当然に行われていると思われ、これによって今までのシステムに無い高い性能を実現している。
ちなみに同様の共通点はPS5にもあり、同じZen2コアを持つRyzen 3700Xなどと比べると処理速度はかなり違うと考えられる。
PS5のSoCとM1と比べた場合、その差が気になる所だが。
スペックはPS5の方が上なので、PS5の方が速いとは思う。
それにしてもHBMを搭載したAMDのAPUはまだなのか!
もう5年以上待っているのだが。
当時のAMDによると構想はあるらしいが、Appleに先を越されている場合ではないと思う。
HBMの生産はMicronも始めた事だし、調達やコストの問題も改善されているはずなのだがなぁ。
参考:
スーパーコンピュータ「富岳」TOP500、HPCG、HPL-AIにおいて2期連続の世界第1位を獲得
https://www.riken.jp/pr/news/2020/20201117_2/index.html
富岳は、主要なスパコンベンチのすべてで1位を獲得することが重要
https://pc.watch.impress.co.jp/docs/news/1289662.html
同じZen2 APUでもまったくの別物
https://17inch.blog.ss-blog.jp/2020-03-20
AMDの“Zen”と、HBM
https://17inch.blog.ss-blog.jp/2015-05-08
スーパーコンピューター「富岳」が世界一位になったらしい
https://17inch.blog.ss-blog.jp/2020-06-23-1
コメント 0