言語

Huaweiが世界最速のAIトレーニングクラスターアトラス900を発表
Yicai Global
期間:  2019年 9月 19日
/ 出所:  yicai
Huaweiが世界最速のAIトレーニングクラスターアトラス900を発表 Huaweiが世界最速のAIトレーニングクラスターアトラス900を発表

(Yicai Global) 9月19日-Huawei Technologiesは、アーキテクチャの革新、全シナリオプロセッサへの投資、明確なビジネス境界、オープンエコシステムの構築に焦点を当てた最初のコンピューティング戦略を発表しました。Huaweiはまた、上海で開催された同社の第4回年次顧客会議であるHuawei Connect 2019で、世界最速の人工知能トレーニングクラスターであるAtlas 900を発表しました。このスーパーコンピューターは、AIを科学研究やビジネス革新のさまざまな分野でより簡単に利用できるようにするのに役立ちます。

Huaweiが最初のコンピューティング戦略をリリース

コンピューティングは、人間が世界を知るためのモデルです。メインフレームコンピューターからパーソナルコンピューター、スマートフォンからウェアラブルデバイスまでの開発は、計算能力がますます人間の能力の拡張になりつつあることを示しています。コンピューティングに対する業界のアプローチは進化しており、統計コンピューティングが主流になります。今後5年間で、Huaweiは、AIコンピューティングが社会の総計算能力の80% 以上を占めると推定しています。コンピューティングは知性の新しい時代に入っています。

「コンピューティングの未来は、USD2兆を超える価値のある巨大な市場です。私たちの戦略は、4つの主要分野に投資し続けることです。アーキテクチャの限界を押し広げ、すべてのシナリオのプロセッサに投資し、明確なビジネス境界を維持し、オープンエコシステムを構築します。」

まず、アーキテクチャの革新。Huaweiは引き続き基礎研究に投資し、手頃な価格のコンピューティングパワーを安定した豊富な供給を提供するように設計された革新的なプロセッサアーキテクチャであるDa Vinciアーキテクチャをすでに開発しています。

第二に、全シナリオプロセッサへの投資。Huaweiには、汎用コンピューティング用のKunpeng、AI用のAscend、スマートデバイス用のKirin、スマートスクリーン用のHonghuなどのプロセッサがフルラインナップされています。

第三に、明確なビジネス境界。Huaweiは、プロセッサを消費者に直接販売することはありません。代わりに、クラウドサービスの形でそれらを提供します。統合ソリューションのサポートを優先し、ビジネスパートナーにコンポーネントを提供します。

第四に、オープンなエコシステムの構築。今後5年間で、Huaweiは開発者イネーブルメントプログラムにさらに15億米ドルを投資する予定です。目的は、プログラムを拡大して500万人の開発者をサポートし、Huaweiの世界的なパートナーが次世代のインテリジェントアプリケーションとソリューションを開発できるようにすることです。

アトラス900が新世界記録を樹立

HuaweiはAtlas 900の開発に10年を費やしました。大規模なクラスターコンピューター機能を測定するためのゴールドスタンダードであるResNet-50をトレーニングするのに、アトラス900はわずか59.8秒しかかかりません。これは以前の世界記録よりも10秒速いです。

Atlas 900は、大規模なデータセットのニューラルネットワークのトレーニングに並外れた計算能力を提供し、科学研究やビジネスイノベーションで広く使用されます。これにより、研究者は画像、ビデオ、サウンドを使用してより高速なAIモデルトレーニングを実行できます。それは、宇宙、天気予報、石油探査のより効率的な研究を可能にし、自動運転の商品化をスピードアップします。

Atlas 900はクラウドサービスも提供し、アクセス可能で手頃な価格で実用的な高効率で完全に包括的なAIプラットフォームに基づいて、豊富で経済的なコンピューティングリソースを提供します。Huaweiは、クラスターサービスとしてAtlas 900をHuawei Cloudに導入し、さまざまな業界の顧客が並外れたコンピューティングパワーにアクセスできるようにしました。Huaweiはこれらのサービスを世界中の大学や科学研究機関に大きな割引価格で提供しています。

中国工学アカデミーのメンバーであり、Peng Cheng LabのディレクターであるGao Wenは、イベントでPeng Cheng Labの使命とビジョンを共有しました。彼は、ラボがHuaweiと協力して、エクスカールコンピューティングをサポートする中国初の進化するAIスーパーコンピューティングシステムを構築する方法を説明しました。両社は、AI基礎研究とイノベーションのための新世代のプラットフォームを確立するために協力します。HuaweiのCloud BUの社長であるZheng Yelaiは、さまざまなシナリオでAIをどのように適用できるかについて話しました。10を超える業界にわたる500を超えるプロジェクトでのHuaweiの経験に基づいて、Zhengは、AI業界が商業的な溝を越え、企業がデジタル化する方法を再形成するための重要な推進力になっていると指摘しました。

「これは探検の新時代です。無限の可能性のある海が待っていますが、1隻だけでは不十分です。今日、私たちは千隻の船を打ち上げます。一緒に働き、この歴史的な機会をつかみ、知性を新たな高みへと前進させましょう。」

Atlas 900はグローバルコンピューティング力のピークを表します

大規模なデータセットでトレーニングされたニューラルネットワークアーキテクチャは、画像認識、自然言語のプロセスをカバーしていますNg、リアルタイムビデオ分析とインテリジェントな推奨システム。これらのニューラルネットワークモデルのトレーニングには、多くの浮動小数点計算能力が必要です。近年、個々のAIプロセッサの計算能力とトレーニング方法が大幅に進歩していますが、1台のマシンのAIトレーニングに必要な時間はまだ非現実的に長いです。したがって、大規模な分散AIクラスターを通じて、ニューラルネットワークトレーニングシステムの浮動小数点計算能力を強化する必要があります。

Atlas 900は、数千のAscend 910 AIプロセッサで構成されています。世界最速のAIトレーニングクラスターであり、世界的なコンピューティングパワーのピークを表しています。Atlas 900は、FP16で256から1,024のPFLOPSを提供します。これは、500,000台のパーソナルコンピュータの合計計算能力に相当します。Atlas 900には次の機能があります。

業界をリードするAIコンピューティングパワー

Atlas 900は、この分野で最大のシングルチップコンピューティング密度を誇るAscend 910 AIプロセッサを使用しています。各Ascend 910 AIプロセッサには、32個のDaVinci AIコアが組み込まれています。各チップは、業界の2倍の計算能力を提供します (FP16で256 TFLOPS)。Atlas 900は、数千のAscend 910 AIプロセッサを相互接続して、業界ナンバーワンのコンピューティングパワークラスターを作成します。

Ascend 910 AIプロセッサは、System-on-a-Chip設計を採用し、AIコンピューティングパワー、一般的なコンピューティングパワー、高速で大帯域幅のI/Oを統合して、ホストCPUのデータ前処理タスクを大幅にアンロードし、トレーニングの効率を向上させます。

最高のクラスターネットワーク

Atlas 900は、HCCS、PCIe 4.0、および100G RoCEの高速インターフェイスを統合し、100テラバイトの完全に相互接続された非ブロッキング、排他的パラメーターの同期ネットワークを使用します。このようにして、勾配同期遅延を10% から70% 減らすことで、ネットワーク遅延を減らすことができます。

サーバー内では、Ascend 910 AIプロセッサがHCCS高速バスを介して相互接続されています。Ascend 910 AIプロセッサは、最新のPCIe 4.0 (レート16ギガバイト/秒) テクノロジーを介してCPUに接続します。そのレートは、より一般的に使用されるPCIe 3.0 (8.0ギガバイト/秒) テクノロジーのレートを2倍にし、より高速で効率的なデータ転送を実現します。クラスターレベルでは、データセンター用のCloudEngine 8800スイッチを使用して、シングルポート100Gbpsスイッチングレートを提供し、クラスター内のすべてのAIサーバーを高速スイッチネットワークに接続します。

オリジナルのiLosslessインテリジェント、ロスレス、スイッチングアルゴリズムは、クラスター内のネットワークトラフィックに関するリアルタイム学習トレーニングを実行して、ネットワーク上でゼロパケット損失とE2E μ s遅延を実現します。

システムレベル最適化

Atlas 900は、Huaweiクラスター通信ライブラリとジョブスケジューリングプラットフォームを介してHCCS、PCIe 4.0、および100G RoCE高速インターフェイスを統合し、Ascend 910チップの強力なパフォーマンスを完全にロック解除します。

Huaweiクラスター通信ライブラリは、トレーニングネットワークに必要な分散並列ライブラリを提供します。通信ライブラリとネットワークトポロジとトレーニングアルゴリズムは、システムレベルの最適化を実行し、クラスターの線形性の80% 以上を実現します。これにより、ジョブスケジューリングの効率が大幅に向上します。

特別な冷却システム

従来のデータセンターでは、空気冷却技術を使用して、AI時代には不十分な機器を冷却しています。CPUやAIチップなどの高電力消費デバイスは、都市のヒートアイランド効果を高め、より効率的な冷却を必要とします。液体冷却技術は、データセンターの電力に対する高い要求、高密度展開、および低電力使用効率を満たすことができます。

Atlas 900は、95% 以上の液冷比をサポートする、業界最強の革新的なキャビネットレベルの閉鎖断熱技術を備えた完全な液冷ソリューションを使用しています。単一のキャビネットは、50キロワットの超高冷却電力消費をサポートし、データセンターで1.1未満のPUEの並外れたエネルギー効率を実現します。

機械室は、8kwの空冷キャビネットと比較して79% 少ないスペースを占めています。並外れた液体冷却技術は、高出力、高密度の機器展開、および低PUEの要件を満たし、顧客の総所有コストを大幅に削減します。

1,024 Ascend 910 AIプロセッサ

Huaweiは、1,024個のAscend 910個のAIプロセッサで構成されるAtlas 900クラスターをHuawei Cloudに導入しました。最も一般的なResNet-50 v1.5モデルとImageNet-1kデータセットに基づいて、Atlas 900はトレーニングを完了するのにわずか59.8秒で、世界第1位にランクされています。

ImageNet-1kデータセットには、75.9% の精度で128万枚の写真が含まれています。他の2つの主流メーカーの精度の結果は70.2秒と76.8秒です。Atlas 900のパフォーマンスは、2つのうちの遅いものよりも15% 高速です。

第一財経グロバルをフォローする
キーワード:   ファーウェイ,アトラス900,AIトレーニングクラスター