Justificando la notación de Dirac en espacios de Hilbert de dimensión finita

Posted on September 11, 2019 by Alicia Henao
Tags: Linear Algebra, Quantum Computing, Quantum Mechanics, Spanish

Para poder empezar a estudiar las bases de la computación cuántica es necesario familiarizarse con la notación propia de la mecánica cuántica, llamada notación de Dirac. Se debé aclarar que estas notas las escribo para repasar estos conceptos, por lo que es posible que no sean fáciles de entender o seguir sin algo de familiaridad con el álgebra lineal. Para un buen aprendizaje de los conceptos básicos se puede consultar [2][3].


+ Producto interno y bases ortonormales


- Definición 1: Sean \(\mathbb{C}\) el campo de los números complejos, \(\mathbb{H}\) un espacio vectorial definido sobre \(\mathbb{C}\), y sea \(\langle-,-\rangle: \mathbb{H} \times \mathbb{H} \to \mathbb{C}\) una función tal que para todo \(v, w, u \in \mathbb{H}\) y para todo \(\alpha \in \mathbb{C}\) cumplen qué:

  1. \(\langle v, w \rangle = \overline{\langle w, v \rangle}\)
  2. \(\langle v, \alpha w + u \rangle = \alpha \langle v, w \rangle + \langle v, u \rangle\)
  3. \(\langle v, v \rangle > 0\) para todo \(v \neq 0\)

A la función \(\langle-, -\rangle\) le decimos un “producto interno” y al espacio vectorial \(\mathbb{H}\) equipado con este producto le diremos un “espacio vectorial con un producto interno”.


Recordemos que la propiedad 3 esta bien definida, pues \(\langle v, v \rangle = \overline{\langle v, v \rangle}\) lo cual implica que \(\langle v, v \rangle \in \mathbb{R}\) y por tanto la relación de la expresión se toma con respecto a la relación de orden típica de los reales.


- Definición 2: Sea \(\mathbb{H}\) un espacio vectorial con un producto interno \(\langle-,-\rangle\). Entonces definimos la norma de \(\mathbb{H}\) como la función \(|| - ||: \mathbb{H} \to \mathbb{R}^{\geq 0}\) definida como \(||x|| = \sqrt{\langle x,x\rangle}\)


No es difícil probar, a partir de las definiciones 1 y 2, que efectivamente esta función es una norma en el sentido mas general. A partir de esta definición podemos definir una métrica y de ahí fijar una topología métrica para ese espacio vectorial. Cuando este espacio es completo (esto es que toda sucesión de Cauchy es convergente) respecto a esa topología decimos que \(\mathbb{H}\) es un espacio de Hilbert.


Usualmente en los libros de física no se habla de la convergencia de sucesiones de Cauchy si no de la resolución de la identidad1 para el operador identidad. Supongo que la razón para ello es que la resolución de la identidad es una “definición” operativa, mientras que la convergencia de las sucesiones de Cauchy es un elemento técnico que no aporta mucho a la hora de realizar cálculos y por tanto no es tan importante a la hora de aprender mecánica cuántica desde una perspectiva física.


- Definición 3: Sea \(B = \{ v_{i} \}_{i \in I}\) un conjunto de vectores de \(\mathbb{H}\). Llamamos al espacio generado por \(B\), denotado por \(\langle B \rangle_{G}\), como el conjunto posible de todas las posibles combinaciones lineales de los vectores de \(B\). Si \(\langle B \rangle_{G} = \mathbb{H}\) decimos que \(B\) genera a \(\mathbb{H}\). Y ademas si \(B\) es linealmente independiente, entonces \(B\) es una base de \(\mathbb{H}\).


- Proposición 1: \(\langle B \rangle_{G}\) es un subespacio vectorial de \(\mathbb{H}\).

Demostración

Sea \(B = \{ v_{i} \}_{i \in I}\). Claramente se tiene que \(0 \in \langle B \rangle_{G}\). Para ello basta considerar que el \(0 \in \mathbb{C}\) y por tanto se puede asignar como escalar valido para todo elemento en la combinación lineal.


Sean \(v, w \in \langle B \rangle_{G}\), entonces existen unos \(\alpha_{i}, \beta_{i} \in \mathbb{C}\) tales que \(v = \sum_{i \in I} \alpha_{i}v_{i}\) y \(w = \sum_{i \in I}\beta_{i}v_{i}\), entonces:

\[v + w = \sum_{i \in I} \alpha_{i}v_{i} + \sum_{i \in I}\beta_{i}v_{i} = \sum_{i \in I} (\alpha_{i} + \beta_{i})v_{i} \tag{P1.1}\]

Pero por las propiedades de campo de \(\mathbb{C}\), se tiene que \(\alpha_{i} + \beta_{i} \in \mathbb{C}\) y por tanto \(v + w \in \langle B \rangle_{G}\).


De igual manera similar se prueba que \(\alpha v \in \langle B \rangle_{G}\) para todo \(\alpha \in \mathbb{C}\).


De lo anterior se sigue que \(\langle B \rangle_{G}\) es un subespacio de \(\mathbb{H}\).

\(\square\)


- Definición 4: Sean \(v, w \in \mathbb{H}\). Si \(\langle v, w \rangle = 0\), decimos que \(v\) y \(w\) “son ortogonales respecto al producto interno \(\langle -, - \rangle\).” Si el producto interno al cual se refiere es claro, entonces decimos simplemente “son ortogonales.” Sea \(B\) el conjunto de la definición 3, si los vectores de \(B\) son ortogonales entre si y ademas \(B\) es una base, entonces decimos que \(B\) es una base ortogonal. Y si la normal de los vectores es 1, decimos que \(B\) es una base ortonormal.


- Definición 5: Sea \(B = \{v_{i}\}_{i \in I}\) una base ortonormal de \(\mathbb{H}\). Y sea \(v \in \mathbb{H}\). Claramente existen \(\alpha_{i} \in \mathbb{H}\) tales que \(v = \sum_{i \in I} \alpha_{i} v_{i}\). Ha estos coeficientes le llamamos la representación de \(v\) en términos de la base \(B\), y usualmente se escribé como un vector columna denotado como \(|v|_{B}\), esto es:

\[ |v|_{B} = \begin{bmatrix} \alpha_{1} \\\ \alpha_{2} \\\ \vdots \\\ \alpha_{n} \end{bmatrix} \]


- Proposición 2: Sea \(B = \{v_{i}\}_{i \in I}\) una base ortonormal de \(\mathbb{H}\), entonces para todo \(v \in \mathbb{H}\) se cumple \(v = \sum_{i \in I} \langle v_{i}, v \rangle v_{i}\). O sea los \(\alpha_{i}\) de la definición 5 son \(\alpha_{i} = \langle v_{i}, v \rangle\).

Demostración

Sea \(v \in \mathbb{H}\), por tanto existen \(\alpha_{i} \in \mathbb{C}\) tales que \(v = \sum_{i \in I} \alpha_{i}v_{i}\).


Sacando el producto interno entre \(v\) y algún \(v_{i}\) se tiene que:

\[\langle v_{i}, v \rangle = \langle v_{i}, \sum_{j \in I} \alpha_{i}v_{j} \rangle \tag{P2.1}\]

Por las propiedades y definición del producto interno se sigue:

\[\langle v_{i}, v \rangle = \sum_{j \in I} \alpha_{j} \langle v_{i}, v_{j} \rangle \tag{P2.2}\]

Pero \(\langle v_{i}, v_{j} \rangle = \delta_{ij}\), pues \(B\) es una base ortonormal. Por tanto:

\[\langle v_{i}, v \rangle = \sum_{j \in I} \alpha_{j} \delta_{ij} = \alpha_{i} \tag{P2.3}\]

\(\square\)


+ Representación de operadores


En la definición 5 establecimos que las matrices columna corresponden a vectores, y sus entradas depende de la base en la cual estamos trabajando. Esta definición se puede extender a cualquier función de una o varias variables que sea lineal o multilineal. Por el momento nos restringiremos a operadores lineales.


- Definción 6: Sean \(B = \{v_{i}\}_{i \in I}\) y \(B' = \{w_{i}\}_{i \in I}\) bases ortonormales de \(\mathbb{H}\). Y sea \(\hat{T}\) un operador lineal en \(\mathbb{H}\). Definimos la matriz \(|\hat{T}|_{BB'}\) como la matriz de entradas \(t_{ij}\) que cumplen la relación \(\hat{T}v_{j} = \sum_{i \in I} t_{ij} w_{i}\). Ha esta matriz la llamamos la matriz de representación de \(\hat{T}\) en términos de las bases \(B\) y \(B'\). Cuando las bases \(B\) y \(B'\) son las mismas escribimos \(|\hat{T}|_{B}\) en ves de \(|\hat{T}|_{BB'}\).


Por tanto la representación de la aplicación del operador \(\hat{T}\) sobre un vector \(v\), o sea \(\hat{T}v = w\), queda representada como \(|\hat{T}|_{BB'}|v|_{B} = |w|_{B'}\), o cuando la base es la misma, \(|\hat{T}|_{B}|v|_{B} = |w|_{B}\).


+ Espacio dual y notación de Dirac


En mecánica cuántica nuestro espacio de configuración, llamado espacio de estado, es un espacio de Hilbert. En el caso de la computación cuántica la mayoría de nuestros espacios de Hilbert son de dimensión finita, lo cual facilita algunas cosas. Por ejemplo no tenemos que tener en cuenta la diferencia entre dual algebráico y dual topológico, pues al ser \(\mathbb{H}\) un espacio de dimensión finita toda transformación lineal es continua y por tanto el dual algebraico y el dual topológico son el mismo.


- Definición 7: Sea \(\mathbb{H}\) un espacio de Hilbert. Definimos su dual algebraico como el conjunto de todas las transformaciones lineales que van de \(\mathbb{H}\) a \(\mathbb{C}\), y lo denotamos como \(\mathbb{H}^{*}\).


- Teorema 3 “De representación de Riesz”: Sea \(\mathbb{H}\) un espacio de Hilbert. Y sea \(f \in \mathbb{H}^{*}\), entonces existe un único elemento \(v \in \mathbb{H}\) tal que para todo \(w \in \mathbb{H}\), \(f(w) = \langle v, w \rangle\), mas aún \(||f||_{\mathbb{H}^{*}} = ||v||_{\mathbb{H}}\).

Demostración

Para el caso general se requieren herramientas propias del análisis funcional, una buena referencia para ver la prueba es [4]. Sin embargo el caso de dimensión finita es mas sencillo.


Sea \(B = \{v_{i}\}_{i \in I}\) una base ortonormal de \(\mathbb{H}\). Por tanto para todo \(w \in \mathbb{H}\) se tiene que, \(w = \sum_{i \in I} \alpha_{i}v_{i}\) donde \(\alpha_{i} = \langle v_{i}, w\rangle\), como vimos en la proposición 2. Al aplicar \(f\) sobre \(w\) se obtiene:

\[f(w) = \sum_{i \in I} \alpha_{i}f(v_{i}) = \sum_{i \in I} \langle v_{i}, w\rangle f(v_{i}) \tag{T3.1}\]

Como \(f \in \mathbb{H}^{*}\), entonces por la definición y propiedades de producto interno se sigue que:

\[f(w) = \sum_{i \in I} \langle \overline{f(v_{i})} v_{i}, w\rangle = \langle \sum_{i \in I} \overline{f(v_{i})} v_{i}, w\rangle \tag{T3.2}\]

Claramente \(\sum_{i \in I} \overline{f(v_{i})} v_{i} \in \mathbb{H}\) por tanto sea \(v = \sum_{i \in I} \overline{f(v_{i})} v_{i}\). Se puede apreciar que este vector no depende de \(w\) si no de \(f\). Luego:

\[f(w) = \langle v, w \rangle \tag{T3.3}\]

La unicidad del vector \(v\) se sigué de la no-generación de \(\langle -,-\rangle\).


Con esto demostramos un isomorfismo entre \(\mathbb{H}^{*}\) y \(\mathbb{H}\). Para la isometría basta equipar a \(\mathbb{H}^{*}\) con el siguiente producto interno: Si \(f_{v}\) es el vector dual asociado a \(v \in \mathbb{H}\), entonces basta definir el producto interno de \(\mathbb{H}^{*}\) como \(\langle f_{v}, f_{w} \rangle = \langle v, w \rangle\).

\(\square\)


De lo anterior podemos ver que en espacios de Hilbert cada vector dual esta asociado a un vector en \(\mathbb{H}\) y por tanto esta transformación lineal se puede representar a través del producto interno, en notación: \(f_{v}(-) = \langle v, - \rangle\). Ha esté tipo de función también se le llama un funcional lineal.


La notación de Dirac se justifica a partir del teorema de representación. Los vectores en el espacio de Hilbert los denotamos como \(| \psi \rangle\), y al vector dual asociado a este se denota como \(\langle \psi |\). De esta manera el producto interno de dos vectores queda representado por medio de la aplicación del vector dual sobre el vector, esto es \(\langle v, w \rangle = \langle v | w \rangle\).


Una pregunta natural es: ¿Cual es la representación de los vectores de \(\mathbb{H}^{*}\)?.


Por la misma definición 5, necesitamos una base para representarla. Si tenemos que \(B = \{e_{i}\}_{i \in I}\) es una base ortonormal de \(\mathbb{H}\), podemos construir una base ortonormal para \(\mathbb{H}^{*}\) de la siguiente forma: Sea \(B^{*} = \{e^{i}\}_{i \in I}\) un subconjunto de \(\mathbb{H}^{*}\), tales que \(e^{i}(e_{j}) = \delta_{ij}\). Se puede ver que \(B^{*}\) es efectivamente una base ortonormal de \(\mathbb{H}^{*}\). A \(B^{*}\) se le dice la base dual de \(B\).


- Proposición 4: \(B^{*}\) es una base ortonormal de \(\mathbb{H}^{*}\).
Demostración

Sea \(B = \{e_{i}\}_{i \in I}\) una base ortonormal de \(\mathbb{H}\) y sea \(B^{*} = \{e^{i}\}_{i \in I}\) el conjunto de los \(e^{i} \in \mathbb{H}^{*}\) tales que \(e^{i}(e_{j}) = \delta_{ij}\).


  1. Veamos que \(\langle B^{*} \rangle_{G} = \mathbb{H}^{*}\).

Sea \(f \in \mathbb{H}^{*}\) por el teorema de representación se tiene que existe un único \(v \in \mathbb{H}\) tal que \(f(w) = \langle v, w \rangle\), para todo \(w \in \mathbb{H}\). Como \(B\) es una base de \(\mathbb{H}\) entonces se tiene que existen \(\alpha_{i}\) y \(\beta_{i}\) tales que \(v = \sum_{i \in I} \alpha_{i}e_{i}\) y \(w = \sum_{i \in I} \beta_{i} e_{i}\), por tanto:

\[f(w) = \langle v, w \rangle = \langle \sum_{i \in I} \alpha_{i}e_{i}, \sum_{j \in I} \beta_{j} e_{j} \rangle \tag{P4.1}\]

Por la definición y propiedades del producto interno, y del hecho de que \(B\) es una base ortonormal se sigue:

\[f(w) = \sum_{i \in I}\sum_{j \in I} \overline{\alpha_{i}} \beta_{j} \delta_{ij} \tag{P4.2}\]

Pero tenemos que \(\delta_{ij} = e^{i}(e_{j})\), por tanto P4.2 se puede rescribir como:

\[f(w) = \sum_{i \in I}\sum_{j \in I} \overline{\alpha_{i}} \beta_{j} e^{i}(e_{j}) \tag{P4.3}\]

Y como \(f\) es una transformación lineal, entonces:

\[f(w) = \sum_{i \in I} \overline{\alpha_{i}} e^{i}(\sum_{j \in I} \beta_{j} e_{j}) \tag{P4.4}\]

Como \(w = \sum_{j \in I} \beta_{j} e_{j}\), entonces podemos escribir \(f\) como \(f = \sum_{i \in I} \overline{\alpha_{i}} e^{i}\). Y por tanto tenemos que \(\langle B^{*} \rangle_{G} = \mathbb{H}^{*}\).


  1. Veamos que \(B^{*}\) es ortonormal.

    El hecho de que \(B^{*}\) es ortonormal es consecuencia de que los vectores duales asociados de \(B\), los que hace referencia el teorema de representación, son efectivamente los elementos de \(B^{*}\), esto se sigué del hecho de que \(B\) es una base ortonormal y que \(\langle -, -\rangle\) es un producto interno.


De 2 también se tiene como consecuencia que \(B^{*}\) también es linealmente independiente, y junto a 1 demuestran que \(B^{*}\) es una base ortonormal de \(\mathbb{H}^{*}\).

\(\square\)


La representación de \(f\) depende del producto interno, pues este define la isometría entre \(\mathbb{H}^{*}\) y \(\mathbb{H}\), como se puede ver en la demostración del teorema de representación. Asumiendo que usamos la base dual de alguna base ortonormal \(B\) y que nuestro espacio de Hilbert es \(\mathbb{C}^{n}\) con su producto interno usual, llamado producto punto. Por tanto:

\[ |v|_{B} = \begin{bmatrix} \alpha_{1} \\\ \alpha_{2} \\\ \vdots \\\ \alpha_{n} \end{bmatrix} \] Entonces, la representación del vector dual asociado \(f_{v} \in \mathbb{H}^{*}\) es: \[ |f_{v}|_{B^{*}} = \begin{bmatrix} \overline{\alpha_{1}} \\\ \overline{\alpha_{2}} \\\ \vdots \\\ \overline{\alpha_{n}} \end{bmatrix} \]

Y como \(f_{v}(w) = \langle v, w \rangle = |f_{v}|_{B^{*}}^{T}|v|_{B}\) (recordando la definición 6, también se tiene que \(|f_{v}|_{B^{*}}^{T} = |f_{v}|_{B}\)), entonces:

\[ \langle v, w \rangle = \begin{bmatrix} \overline{\alpha_{1}} & \overline{\alpha_{2}} & \dots & \overline{\alpha_{n}} \end{bmatrix} \begin{bmatrix} \beta_{1} \\\ \beta_{2} \\\ \vdots \\\ \beta_{n} \end{bmatrix} \]

De esta manera si el ket \(|\psi\rangle \in \mathbb{H}\) es representado de la siguiente forma respecto a una base \(B\): \[ |\psi\rangle = \begin{bmatrix} \alpha_{1} \\\ \alpha_{2} \\\ \vdots \\\ \alpha_{n} \end{bmatrix} \] Entonces el bra asociado al ket es: \[ \langle \psi | = \begin{bmatrix} \overline{\alpha_{1}} & \overline{\alpha_{2}} & \dots & \overline{\alpha_{n}} \end{bmatrix} \]

En otras palabras: !El bra del ket es la transpuesta del vector columna que representa a su vector dual!.


Gracias a esta representación podemos definir la siguiente operación entre kets y bras, llamada producto exterior2, en términos de la multiplicación de matrices, esto es:

\[ |\phi \rangle \langle \psi | = \begin{bmatrix} \beta_{1} \\\ \beta_{2} \\\ \vdots \\\ \beta_{n} \end{bmatrix} \begin{bmatrix} \overline{\alpha_{1}} & \overline{\alpha_{2}} & \dots & \overline{\alpha_{n}} \end{bmatrix} = \begin{bmatrix} \beta_{1}\overline{\alpha_{1}} & \beta_{1}\overline{\alpha_{2}} & \dots & \beta_{1}\overline{\alpha_{n}} \\\ \beta_{2}\overline{\alpha_{1}} & \beta_{2}\overline{\alpha_{2}} & \dots & \beta_{2}\overline{\alpha_{n}} \\\ \vdots & \vdots & \ddots & \vdots \\\ \beta_{n}\overline{\alpha_{1}} & \beta_{2}\overline{\alpha_{2}} & \dots & \beta_{n}\overline{\alpha_{n}} \end{bmatrix} \]


+ Bibliografía
  1. Michael A. Nielsen and Isaac L. Chuang. Quantum Computation and Quantum Information. Cambridge University Press, New York, 2010.
  2. Sheldon Axler. Linear Algebra Done Right. Springer, New York, 2015.
  3. Sergei Treil. Linear Algebra Done Wrong. Author, Providence, 2017.
  4. Eberhard Zeidler. Applied Functional Analysis. Applications to Mathematical Physics. Springer, New York, 1995.

  1. Esta identidad usualmente se expresa usando la notación de Dirac. Para un espectro continuo se escribe como: \(\hat{A} = \int_{\Omega} \lambda d | i \rangle \langle i |\); Y para el caso discreto: \(\hat{A} = \sum_{i \in I} \lambda_{i} |i\rangle \langle i|\). Donde los \(| i \rangle\) son los vectores de alguna base ortonormal.

  2. Esta operación es realmente un producto tensorial, sin embargo diferenciamos ambos. Aún así es bueno tener en mente que ambos son matemáticamente equivalentes, gracias al isomorfismo entre \(\mathfrak{T}_{m}^{n}(\mathbb{V})\) y \(\bigotimes_{i = 1}^{n} \mathbb{V}^{*} \otimes \bigotimes_{i = 1}^{m} \mathbb{V}\). Donde \(\mathfrak{T}_{m}^{n}(\mathbb{V})\) es el conjunto de tensores de tipo \((n, m)\).