2.1 問題陳述與動機
針對一般可交換(GC)集合嘅通用對角化電路需要 $O(n^2)$ 個雙量子位閘,並且喺量子位連接有限(例如線性或網格架構)嘅硬件上會產生沉重嘅交換閘開銷。另一種方法只使用單量子位閘,將對角化限制喺張量積基(TPB),嚴重限制咗可測量集合嘅大小,並增加咗所需測量電路(運行次數)嘅總數。
Pauli算符嘅對角化係好多量子算法中嘅基礎子程序,尤其係用於估算可觀測量(例如變分量子特徵求解器(VQE)中嘅哈密頓量)嘅期望值。喺連接有限、錯誤率較高嘅近期量子設備上,構建資源高效嘅對角化電路至關重要。呢項工作引入咗一個針對硬件特性(HT)嘅框架,系統性地設計超低閘數電路,用於對角化可交換Pauli算符集合,彌合咗完全連接嘅通用電路同過度限制嘅張量積基(TPB)方法之間嘅差距。
呢個框架建基於測量可觀測量 $O = \sum_{i=1}^{M} c_i P_i$ 嘅挑戰,其中 $P_i$ 係Pauli算符。高效測量需要將可交換嘅Pauli算符分組到可以同時對角化嘅集合中。
針對一般可交換(GC)集合嘅通用對角化電路需要 $O(n^2)$ 個雙量子位閘,並且喺量子位連接有限(例如線性或網格架構)嘅硬件上會產生沉重嘅交換閘開銷。另一種方法只使用單量子位閘,將對角化限制喺張量積基(TPB),嚴重限制咗可測量集合嘅大小,並增加咗所需測量電路(運行次數)嘅總數。
HT對角化搵到一個中間落墨點。佢允許使用受控數量嘅雙量子位閘(例如CNOT),根據設備嘅連接圖策略性地放置,從而對角化比TPB更大嘅Pauli集合,同時避免通用GC電路嘅全部開銷。目標係喺硬件限制下,最大化每輪測量中可以處理嘅Pauli算符數量。
如果存在一個Clifford電路 $C$,由單量子位閘同僅沿連接圖 $G$ 邊緣嘅雙量子位閘組成,使得對於所有 $i$,$C P_i C^\dagger$ 都係對角化($Z$ 同 $I$ 算符嘅乘積),咁一個可交換Pauli算符集合 $\mathcal{P} = \{P_1, ..., P_k\}$ 就係喺具有連接圖 $G$ 嘅設備上可HT對角化嘅。電路 $C$ 有效地將 $\mathcal{P}$ 嘅共享特徵基旋轉到計算基。
作者提出咗一種算法,將哈密頓量嘅Pauli項劃分為可聯合HT對角化嘅集合。呢個係一個組合優化問題,同時考慮Pauli算符之間嘅交換關係同硬件連接性。該算法旨在最小化組嘅總數,從而最小化所需嘅不同量子電路執行次數。
對於一組給定嘅可交換Pauli算符同一個硬件連接圖,該框架提供咗一個系統性程序來構建對角化電路 $C$。呢個過程涉及搵到一系列Clifford操作(單量子位閘同沿硬件邊緣嘅CNOT),將組中每個Pauli映射到對角形式。該程序非常靈活,可以根據需要定制以最小化深度或特定閘數。
輸入: 哈密頓量 $H$,硬件連接圖 $G$。
呢個工作流程直接減少咗VQE等算法中嘅主要測量開銷。
對於幾類分子哈密頓量(例如 $H_2$、$LiH$、$H_2O$),將HT分組方法與標準TPB分組進行比較。關鍵指標係所需嘅測量組數(電路數)。結果一致顯示,HT分組所需嘅組數少於TPB。例如,喺模擬 $H_2$ 分子嘅6量子位線性鏈拓撲上,與TPB相比,HT分組將組數減少咗大約20-30%,直接轉化為喺固定估算精度下所需量子運行次數嘅比例減少。
基準測試: $H_2$ 哈密頓量(4-6量子位)
TPB組數: ~8-10
HT組數(線性硬件): ~6-8
減少幅度: 測量電路數減少約25%。
作為原理驗證,作者喺IBM嘅雲端量子處理器上執行咗HT電路。佢哋測量咗小型哈密頓量實例嘅期望值。實驗證實,構建嘅HT電路可以喺連接有限(例如IBM嘅Falcon處理器)嘅真實硬件上執行,並成功喺誤差範圍內產生正確嘅期望值,驗證咗該方法嘅實際可行性。
圖表描述(概念性): 柱狀圖通常會喺y軸顯示「測量電路數量」,x軸顯示針對唔同小分子嘅唔同分組方法(TPB、GC理想情況、HT)。HT柱會明顯短於TPB柱,但高於理想GC柱(假設全連接),直觀展示咗HT嘅中間效率增益。
論文嘅核心洞察極其務實:如果理論上嘅電路最優性無法映射到物理硬件,咁就毫無意義。 邏輯流程無懈可擊:1) 識別近期算法嘅瓶頸(測量開銷)。2) 診斷根本原因(抽象GC電路與稀疏硬件圖之間嘅不匹配)。3) 提出一個約束優化解決方案(HT電路),明確將硬件圖作為設計過程中嘅首要考慮因素。呢唔只係一個小調整;而係一個根本性轉變,從為量子電腦設計轉變為為呢部特定量子電腦設計。佢呼應咗經典計算同高級量子編譯器(如Qiskit嘅transpiler或TKET)中見到嘅硬件感知編譯理念,但直接應用於對角化呢個算法原語。
優勢: 該框架系統且靈活,相比臨時啟發式方法係一個主要優勢。佢與硬件約束嘅直接集成使其可以立即部署。所展示嘅測量組數減少係一個具體、與硬件無關嘅好處。佢優雅地喺TPB同GC之間進行插值,為電路複雜性提供咗一個可調節嘅旋鈕。
關鍵缺陷與開放問題: 房間裡嘅大象係電路深度同保真度。雖然HT減少咗電路數量,但每個電路可能比TPB電路更深(更多CNOT)。喺當今嘈雜嘅設備上,更深嘅電路可能具有更低嘅保真度,有可能抵消運行次數減少帶來嘅好處。論文需要對總資源成本進行更嚴格嘅分析:(組數)*(每組運行次數 * 每次運行嘅方差)。每次運行嘅方差取決於電路保真度。此外,分組算法對於大型複雜分子(例如具有50+量子位嘅催化劑)嘅可擴展性,以及其喺經典端嘅計算複雜性仍有待充分探索。佢有可能成為一個計算量沉重嘅預處理步驟。
對於量子算法開發者同IBM、Pasqal或Quantinuum等公司,呢項工作提供咗一個可行嘅藍圖。首先,應該將其集成到量子軟件開發套件(SDK)中,作為TPB同GC之外嘅標準分組選項。其次,硬件設計師應該注意:呢項研究量化咗連接性嘅價值。連接性更強嘅架構(例如heavy-hex對比線性)將使HT電路更接近理想GC性能,為架構權衡提供具體指標。第三,對於今日運行VQE嘅從業者,直接嘅啟示係喺你嘅目標問題同硬件上,對HT同TPB進行基準測試。 唔好假設TPB係最好嘅。喺TPB-HT-GC光譜上嘅最優點取決於問題同硬件。呢個框架提供咗搵到該最優點嘅工具,超越咗一刀切嘅對角化策略。