古典推定理論で用いられるフィッシャー情報量とクラメール・ラオ不等式から始めて、量子フィッシャー情報量と量子クラメール・ラオ不等式について基本事項をまとめます。
目次
古典推定理論
まず古典推定理論について説明します。フィッシャー情報量とクラメール・ラオ不等式は古典(量子ではない)推定理論における用語です。
パラメータ\(\theta:=(\theta_1, \theta_2, ..., \theta_d)\)で特徴付けられた未知の確率分布\(p(x|\theta)\)が存在するとしたとき、観測結果から\(\theta\)を推定することが古典推定理論における推定の目標です。\(\theta\)は例えば、ガウス分布における期待値と分散に相当します。
極端な推定を議論しても仕方ないので、推定には不偏推定を考えます。不偏推定とは推定値のアンサンブル平均が真のパラメータ値に一致する推定のことです。つまり
\[ \langle\theta^{\text{est}}\rangle_\theta=\theta \]
が成り立ちます。
共分散行列\(C\)の\(i, j\)成分を以下のように定義します。
\[C_{ij}=\sum_xp(x|\theta)(\theta_i^{\text{est}}(x)-\theta_i)(\theta_j^{\text{est}}(x)-\theta_j)\]
共分散行列の\((i, i)\)成分は推定値の分散に一致するため、その値が小さいほど推定値の分散が小さい、良い推定であると言えます。
このとき不偏推定の推定精度を特徴づけるために以下のフィッシャー情報行列\(J\)が定義されます。
\[ J_{ij}:=\sum_x p(x|\theta) \frac{\partial\ln p(x|\theta)}{\partial\theta_i}\frac{\partial\ln p(x|\theta)}{\partial\theta_j} \]
\(\theta\)の推定値を\(\theta^{est}\)とし、\(A:=\sum_ia_i\theta_i\)の推定値を\(A^{\text{est}}=\sum_ia_i\theta^{\text{est}}_i\)とすると, フィッシャー情報量は以下のクラメール・ラオ不等式で意味付けされる.
\[(\Delta A^{\text{est}})^2 \geq \frac{1}{N}\sum_{ij}a_i(J^{-1})_{ij}a_j\]
ここで\(\Delta\)は分散, Nはサンプル数を表します。また一般に行列の不等式は行列の正定値性を表します。証明については参考文献を参照してください。
つまりフィッシャー情報行列の逆行列は不偏推定の精度の上限を与えることが分かります。フィッシャー情報量が大きいほど、同じ推定精度を達成するために必要なサンプル数が少なくて済むと解釈することもできます。
また有名な推定方法である最尤推定はクラメール・ラオ不等式の下限を漸近的に与えることが知られているようです。
量子フィッシャー情報量と量子クラメール・ラオ不等式
次に量子フィッシャー情報量に基づく量子推定理論について説明します。量子推定理論では確率分布ではなく密度演算子がパラメータ\(\theta\)によって与えられている状況を考えます。つまり量子測定により密度演算子を決めるパラメータを決定することが量子推定ということになります。
量子フィッシャー情報量(Quantum Fisher Information, QFI)には無限個の種類が存在することが知られていますが、ここではRLDフィッシャー情報量と呼ばれるQFIについて説明します。
\[ \frac{\partial \rho_\theta}{\partial \theta_i}=\rho_\theta L_{\theta i}\] を満たす\(L_{\theta i}\)に対してRLDフィッシャー情報量\(R_{ij}\)は \[R_{ij}:=\text{Tr}[\rho_\theta L_{\theta i}L_{\theta j}^{†}]\]
ここから分かるように\(R_{ij}\)はエルミート行列です。また
\[ R_{ij}=\text{Tr}[\rho_\theta^{-1} \frac{\partial\rho_\theta}{\partial\theta_i}\frac{\partial\rho_\theta}{\partial\theta_j}] \]
と書くこともできます。
量子クラメール・ラオ不等式は次のようになります。
\[ R \geq J \]
証明は参考文献を見てください。 よって、測定を記述するPOVMを\(\{E_k\}\)、\(p(k|\theta)=\text{Tr}[\rho_\theta E_k]\)とすると
\[(\Delta A^{\text{est}})^2 \geq \frac{1}{N}\sum_{ij}a_i(R^{-1})_{ij}a_j\]
が成立します。
純粋状態における量子フィッシャー情報量
考えている密度演算子が純粋状態\(|{\psi(\theta)}\rangle\)のときは以下のように書くことができます。
\[ R_{ij}=\text{Re}[\langle{\partial_i \psi(\theta)|{\partial_j \psi(\theta)}\rangle}-\langle{\partial_i \psi(\theta)|{\psi(\theta)}}\rangle\langle{\psi(\theta)|\partial_j\psi(\theta)}\rangle] \]
量子状態間の距離などを考えるときにこの考え方が必要になるそうです。詳しくは量子情報幾何などについて調べてみてください。
参考文献
- 沙川貴大, 上田正仁, 量子測定と量子制御[第2版], サイエンス社
- 松枝宏明, 量子系のエンタングルメントと幾何学, 森北出版株式会社
- Bharti, Kishor, Fisher Information: A Crucial Tool for NISQ Research, Quantum Views, https://doi.org/10.22331/qv-2021-10-06-61