2.1 問題設定と動機
一般可換(GC)集合に対する汎用対角化回路は、$O(n^2)$ の2量子ビットゲートを必要とし、量子ビット接続性が限られたハードウェア(例:線形またはグリッドアーキテクチャ)上では、重いスワップゲートオーバーヘッドを招く。一方、単一量子ビットゲートのみを使用する代替案は、対角化をテンソル積基底(TPB)に制限し、測定可能な集合のサイズを大幅に制限し、必要な測定回路(ショット)の総数を増加させる。
パウリ演算子の対角化は、特に変分量子固有値ソルバー(VQE)におけるハミルトニアンのような観測量の期待値推定において、多くの量子アルゴリズムにおける基本的なサブルーチンである。接続性が限られ、エラーレートの高い近未来量子デバイス上では、リソース効率の良い対角化回路を構築することが極めて重要である。本研究は、ハードウェア特化(HT)フレームワークを導入する。これは、可換なパウリ演算子の集合を対角化するための超低ゲート数回路を体系的に設計し、完全接続の汎用回路と過度に制限的なテンソル積基底(TPB)アプローチの間のギャップを埋めるものである。
この枠組みは、観測量 $O = \sum_{i=1}^{M} c_i P_i$($P_i$ はパウリ演算子)の測定という課題に基づいて構築されている。効率的な測定には、可換なパウリ演算子を同時に対角化可能な集合にグループ化する必要がある。
一般可換(GC)集合に対する汎用対角化回路は、$O(n^2)$ の2量子ビットゲートを必要とし、量子ビット接続性が限られたハードウェア(例:線形またはグリッドアーキテクチャ)上では、重いスワップゲートオーバーヘッドを招く。一方、単一量子ビットゲートのみを使用する代替案は、対角化をテンソル積基底(TPB)に制限し、測定可能な集合のサイズを大幅に制限し、必要な測定回路(ショット)の総数を増加させる。
HT対角化は中間的な道を提供する。これは、制御された数の2量子ビットゲート(CNOTなど)を、デバイスの接続性グラフに従って戦略的に配置することを許容し、TPBよりも大きなパウリ演算子の集合を対角化する一方で、汎用GC回路の完全なオーバーヘッドを回避する。目標は、ハードウェア制約下で測定ラウンドあたりのパウリ演算子の数を最大化することである。
可換なパウリ演算子の集合 $\mathcal{P} = \{P_1, ..., P_k\}$ が、接続性グラフ $G$ を持つデバイス上でHT対角化可能であるとは、単一量子ビットゲートと $G$ のエッジに沿った2量子ビットゲートのみで構成されるクリフォード回路 $C$ が存在し、すべての $i$ に対して $C P_i C^\dagger$ が対角($Z$ と $I$ 演算子の積)になることを意味する。回路 $C$ は、$\mathcal{P}$ の共有固有基底を計算基底に効果的に回転させる。
著者らは、ハミルトニアンのパウリ項を共同HT対角化可能な集合に分割するアルゴリズムを提示する。これは、パウリ演算子間の可換関係とハードウェア接続性の両方を考慮する組み合わせ最適化問題である。このアルゴリズムは、グループの総数を最小化し、それによって必要な異なる量子回路実行の回数を最小化することを目指す。
与えられた可換パウリ演算子のグループとハードウェアグラフに対して、この枠組みは対角化回路 $C$ を構築する体系的な手順を提供する。これには、グループ内の各パウリ演算子を対角形式にマッピングするクリフォード操作(単一量子ビットゲートとハードウェアエッジに沿ったCNOT)のシーケンスを見つけることが含まれる。この手順は非常に柔軟で、回路深度や特定のゲート数を最小化するように調整することができる。
入力: ハミルトニアン $H$、ハードウェア接続性グラフ $G$。
このワークフローは、VQEのようなアルゴリズムにおける支配的な測定オーバーヘッドを直接削減する。
いくつかの分子ハミルトニアンクラス(例:$H_2$、$LiH$、$H_2O$)に対して、HTグループ化法を標準的なTPBグループ化と比較した。主要な指標は、必要な測定グループ(回路)の数である。結果は一貫して、HTグループ化がTPBよりも少ないグループ数を必要とすることを示している。例えば、$H_2$分子をシミュレートする6量子ビット線形チェーントポロジーでは、HTグループ化はTPBと比較してグループ数を約20-30%削減し、固定された推定精度に対して必要な量子ショット数の比例的な削減に直接つながった。
ベンチマーク: $H_2$ ハミルトニアン(4-6量子ビット)
TPBグループ数: ~8-10
HTグループ数(線形ハードウェア): ~6-8
削減率: 測定回路数が約25%減少。
原理実証として、著者らはIBMのクラウドベース量子プロセッサ上でHT回路を実行した。彼らは小さなハミルトニアンインスタンスに対する期待値を測定した。実験は、構築されたHT回路が限られた接続性(例:IBMのFalconプロセッサ)を持つ実ハードウェア上で実行可能であり、誤差範囲内で正しい期待値を生成することに成功したことを確認し、このアプローチの実用的実現可能性を検証した。
チャート説明(概念的): 棒グラフは通常、y軸に「測定回路数」、x軸に様々な小さな分子に対する異なるグループ化法(TPB、GC-Ideal、HT)を示す。HTの棒はTPBの棒よりも著しく短いが、理想的なGCの棒(全結合を仮定)よりも長く、HTの中間的な効率向上を視覚的に示す。
本論文の中核的洞察は、極めて実用的である:物理ハードウェアにマッピングされない理論的な回路最適性は無意味である。 論理的流れは完璧である:1)近未来アルゴリズムのボトルネック(測定オーバーヘッド)を特定する。2)根本原因(抽象的なGC回路と疎なハードウェアグラフのミスマッチ)を診断する。3)ハードウェアグラフを設計プロセスの第一級市民として明示的に組み込む制約付き最適化ソリューション(HT回路)を提案する。これは単なる微調整ではなく、量子コンピュータのための設計からこの特定の量子コンピュータのための設計への根本的な転換である。これは、古典コンピューティングやQiskitのトランスパイラやTKETのような高度な量子コンパイラに見られるハードウェアを意識したコンパイル哲学を反映しているが、それを対角化というアルゴリズムのプリミティブに直接適用する。
長所: この枠組みは体系的で柔軟であり、アドホックなヒューリスティックに対する大きな利点である。ハードウェア制約との直接的な統合により、即座に展開可能である。実証された測定グループ数の削減は、ハードウェアに依存しない具体的な利点である。これはTPBとGCの間を優雅に補間し、回路複雑性に対する調整可能なノブを提供する。
重大な欠点と未解決問題: 明白な問題は回路深度と忠実度である。HTは回路数を削減するが、各回路はTPB回路よりも深く(より多くのCNOT)、なる可能性がある。現在のノイズの多いデバイスでは、より深い回路は忠実度が低くなる可能性があり、ショット削減の利点を無効にする恐れがある。本論文は総リソースコスト:(グループ数)×(グループあたりのショット数 × ショットあたりの分散)のより厳密な分析を必要とする。ショットあたりの分散は回路忠実度に依存する。さらに、大規模で複雑な分子(例:50量子ビット以上の触媒)へのグループ化アルゴリズムのスケーラビリティと、古典側での計算複雑性は、まだ完全には探求されていない。計算負荷の高い前処理ステップになるリスクがある。
量子アルゴリズム開発者やIBM、Pasqal、Quantinuumのような企業にとって、この研究は実用的な青写真を提供する。第一に、これはTPBやGCと並ぶ標準的なグループ化オプションとして量子ソフトウェア開発キット(SDK)に統合されるべきである。第二に、ハードウェア設計者は注意すべきである:この研究は接続性の価値を定量化する。より接続性の高いアーキテクチャ(例:heavy-hex対線形)は、HT回路が理想的なGC性能に近づくことを可能にし、アーキテクチャのトレードオフに対する具体的な指標を提供する。第三に、今日VQEを実行している実務家にとって、即座に得られる教訓は、対象の問題とハードウェア上でHTをTPBと比較してベンチマークすることである。TPBが最善であると仮定してはならない。TPB-HT-GCスペクトル上の最適点は、問題とハードウェアに依存する。この枠組みは、その最適点を見つけるためのツールを提供し、万能の対角化戦略を超えて進む。