} ?>
(Yicai Global) 2月25日-中国の高度なAI研究所である上海人工知能研究所は、AIの巨人であるSenseTimeとともに、一般的なビジョンAIを推進するためのオープンソースコミュニティを本日開始しました。 OpenGVLabと呼ばれるこのプラットフォームは、学界、研究、業界の進歩を促進します。
発売の一環として、プラットフォームは、開発者がさまざまな一般的なビジョンモデルのパフォーマンスを評価し、継続的に最適化するのに役立つ、業界初の一般的なビジョンモデル評価のベンチマークを公開しました。
OpenGVLabは、昨年上海人工知能研究所、SenseTime、香港中文大学、上海交通大学によって開発された一般的なビジョンモデルINTERNに基づいています。
このモデルは、1つのモデルを使用して複数のタスクを完了するという、一般的なビジョン開発の主な障害に対処します。 ただし、INTERNは、さまざまな背景を持つ写真のコンテンツを正確に識別できます。
コスト削減
INTERNの強みに支えられて、OpenGVLabのオープンソースのプレトレーニングモデルは、分類、検出、セグメンテーション、深さ推定という一般的なビジョンの4つのコアミッションをカバーする、非常に高いパフォーマンスを提供できます。
OpenGVLabは、さまざまなパラメーターと計算を含む強力なプレトレーニングモデルを提供することで、開発者が数百のビジュアルタスクとシーンのアルゴリズムモデルを低コストで迅速に構築し、ロングテールの問題に効率的に取り組み、AIの大規模なアプリケーションを促進できるよう支援します。技術。
上海AIラボはまた、その超大規模なデータセットを業界のプレーヤーに提供しています。 数千万のデータセットと数十万のラベル付けシステムをカバーする数百億ビットのデータに基づいて、これらの超大規模なデータセットは、既存のオープンソースデータセットを統合するだけでなく、画像分類、ターゲット検出、画像セグメンテーションなどのタスクも処理します。。 このような大規模なデータ画像注釈により、データの総量は7000万に近づきます。 現在、画像分類データセットはオープンソースになるための第一歩を踏み出しており、ターゲット検出セットなどのより多くのデータセットが将来利用可能になる予定です。
上海AIラボは、100,000種類のメガラベリングシステムも提供しています。 既存のオープンソースデータセットのほぼすべてをカバーするだけでなく、さまざまなタイプとステータスの画像をカバーする、多数のきめの細かいラベルのさらなる拡張も実現します。 このシステムは、イメージングタスクのアプリケーションシナリオを大幅に充実させ、ダウンストリームデータを収集するコストを大幅に削減します。
業界ベンチマーク
OpenGVLabは、分類、検出、セグメンテーション、および深度推定のための最初の一般的な視覚ベンチマークもリリースしました。 既存のベンチマークは、主に単一のタスクまたは単一の視覚的次元向けに設計されており、一般的なビジョンモデルの全体的なパフォーマンスを反映することも、ポイントごとの比較に使用することもできません。
革新的な設計を通じて、OpenGVLabの新しい一般的な視覚ベンチマークは、信頼できる結果を提供するだけでなく、統一された基準の下で公正で正確な評価を促進することができます。 さらに、ベンチマークは、トレーニングデータのわずか10% を使用して、低データ体制下で効果的な評価結果を提供できます。 評価結果に応じて合計スコアが表示され、さまざまなモデル間でポイントごとの比較を行うためのよりユーザーフレンドリーなソリューションが提供されます。
これらのオープンソースプラットフォームは、上海AIラボのすでにリリースされているOpenMMLabおよびOpenDILabとともに、オープンソースシステムであるOpenXLabを形成します。これは、新しくリリースされたOpenGVLabとともにオープンソースAIコミュニティの開発をさらに促進するのに役立ちます。
上海AIラボは、上海に本社を置くAI研究とアプリケーションに焦点を当てた高度な研究所です。 ラボは、大学や業界と協力して、さまざまな技術分野の革新だけでなく、基本的な理論にも根本的に貢献する、独創的で前向きな科学研究を行っています。
一般的なビジョンAIテクノロジーに興味のある人は、OpenGVLabにアクセスすることをお勧めします (Https://opengvlab.shlab.org.cn) そして新しい最先端のプラットフォームを体験してください。
編集者: キム・テイラー