Scene Priorを用いた一般化可能なNeRFによる3D再構成
原題:3D Reconstruction with Generalizable Neural Fields using Scene Priors
近年の神経分野の進歩により、高忠実度の3Dシーン再構築が大幅に進歩している。しかし、既存の手法のほとんどは、個々のシーンごとに別々のネットワークを一から学習している。これはスケーラブルではなく、非効率的であり、限られたビューでは良い結果を得ることができない。学習ベースのマルチビューステレオ手法は、この問題をある程度緩和するが、マルチビュー設定であるため、スケールアップや幅広い応用への柔軟性に欠ける。その代わりに、シーン・プリア(NFP)を組み込んだ学習汎化可能なニューラル・フィールド(Neural Fields)を導入する。NFPネットワークは、任意のシングルビューRGB-D画像を符号付き距離と輝度値にマッピングする。完全なシーンは、フュージョンモジュールなしで、ボリューメトリック空間内の個々のフレームをマージすることによって再構成することができ、より柔軟性を提供する。シーンプリオールは大規模なデータセットで学習することができ、少ないビューで新しいシーンの再構成に素早く適応することができる。NFPは、SOTAシーン再構成の性能と効率を示すだけでなく、ニューラル分野では未開拓である単一画像のノービュー合成もサポートする。プロジェクトページ
ObVi-SLAM:長時間物体-視覚SLAM
原題:ObVi-SLAM: Long-Term Object-Visual SLAM
長い時間スケールのタスクを担うロボットは、幾何学的、視点的、外観的な変化の中で、一貫してスケーラブルに定位できなければならない。既存の視覚的SLAMアプローチは、低レベルの特徴記述子に依存しており、このような環境変化に対してロバストではなく、マップサイズが大きくなり、長期間の配置に対してスケールが悪くなります。対照的に、物体検出は環境変化に対してロバストであり、よりコンパクトな表現につながるが、ほとんどの物体ベースのSLAMシステムは、近い物体を含む短期間の屋内配置を対象としている。本論文では、両方のアプローチの長所を活用することにより、これらの課題を克服するためにObVi-SLAMを紹介します。ObVi-SLAMは、高品質の短期視覚オドメトリのために低レベルの視覚的特徴を使用し、グローバルで長期的な一貫性を確保するために、ObVi-SLAMは、永続的なオブジェクトの不確実性を考慮した長期マップを構築し、すべての展開後にそれを更新します。ObVi-SLAMは、異なる天候や照明条件にまたがる16の展開セッションからのデータで評価することにより、我々は、ObVi-SLAMが、様々な外観条件にもかかわらず、長い時間スケールで一貫性のある正確な定位推定値を生成することを実証的に示す。
SHACIRA: 暗黙的神経表現のためのスケーラブルなハッシュグリッド圧縮
原題:SHACIRA: Scalable HAsh-grid Compression for Implicit Neural Representations
Implicit Neural Representations (INR)またはニューラルフィールドは、画像や輝度場のようなマルチメディア信号を高品質に保持しながら符号化するための一般的なフレームワークとして登場した。近年、Instant-NGPによって提案された学習可能な特徴グリッドは、大規模なニューラルネットワークを特徴ベクトルのマルチ解像度ルックアップテーブルとはるかに小さなニューラルネットワークに置き換えることで、INRのサンプリングだけでなく学習においても大幅な高速化を可能にした。しかし、これらの特徴グリッドは、ストレージやストリーミングアプリケーションにとってボトルネックとなり得る大きなメモリ消費を犠牲にしている。本研究では、SHACIRAを提案する。SHACIRAは、このような特徴グリッドを圧縮するための、シンプルかつ効果的なタスクに依存しないフレームワークであり、追加のポストホックプルーニング/量子化ステージを必要としない。我々は、量子化された潜在重みで特徴グリッドを再パラメータ化し、潜在空間においてエントロピー正則化を適用することで、様々な領域において高レベルの圧縮を実現する。画像、動画、輝度フィールドからなる多様なデータセットにおける定量的・定性的な結果から、我々のアプローチは、大規模なデータセットやドメイン固有のヒューリスティックを必要とすることなく、既存のINRアプローチを凌駕することが示される。プロジェクトページ
EDGAR:自律走行研究プラットフォーム--機能開発から実世界への応用まで
原題: EDGAR: An Autonomous Driving Research Platform -- From Feature Development to Real-World Application
現在の自律走行の研究開発は、主に新機能とアルゴリズムの開発に焦点を当てているが、孤立したソフトウェアコンポーネントからソフトウェアスタック全体への移行については、ほとんど取り上げられていない。その上、自律ソフトウェアスタックと公道交通の複雑さのため、スタック全体の最適な検証は未解決の研究問題である。本論文はこれら2つの側面をターゲットとしている。我々の自律型研究車両EDGARと、その詳細な仮想複製であるデジタル・ツインを紹介する。車両のセットアップは最先端の技術に密接に関連しているが、シミュレーションから実世界テストまでの一貫した検証プロセスにとって重要であるため、その仮想複製は価値ある貢献である。さらに、異なる開発チームが同じモデルを扱うことができるため、ソフトウェア・スタックの統合とテストが非常に容易になり、開発プロセスが大幅に加速する。実車とバーチャル車両は、包括的な開発環境にも組み込まれています。コード