Propagació de creences

Representació parcial d'un factor graph. Resulta útil imaginar-se que dins dels nodos factors (cuadrados) radica una funció f a (x a) {\displaystyle f_{a}(x_{a})} que expressa la interacció entre les variables que resideixen al seu veïnat.

La propagació de creences, també coneguda com a transmissió de missatges suma-producte, és un algorisme de pas de missatges per realitzar inferències sobre models gràfics, com ara xarxes bayesianes i camps aleatoris de Markov. Calcula la distribució marginal per a cada node (o variable) no observat, condicionada a qualsevol node (o variable) observat. La propagació de creences s'utilitza habitualment en la intel·ligència artificial i la teoria de la informació, i ha demostrat un èxit empíric en nombroses aplicacions, com ara codis de control de paritat de baixa densitat, codis turbo, aproximació d'energia lliure i satisfacció.[1]

L'algorisme va ser proposat per primera vegada per Judea Pearl l'any 1982,[2] que el va formular com un algorisme d'inferència exacta sobre arbres, més tard estès als arbres.[3] Tot i que l'algorisme no és exacte en gràfics generals, s'ha demostrat que és un algorisme aproximat útil.[4]

Donat un conjunt finit de variables aleatòries discretes X 1 , , X n {\displaystyle X_{1},\ldots ,X_{n}} amb funció de massa de probabilitat conjunta p {\displaystyle p} , una tasca habitual és calcular les distribucions marginals de la X i {\displaystyle X_{i}} . El marginal d'un sol X i {\displaystyle X_{i}} es defineix per ser

p X i ( x i ) = x : x i = x i p ( x ) {\displaystyle p_{X_{i}}(x_{i})=\sum _{\mathbf {x} ':x'_{i}=x_{i}}p(\mathbf {x} ')}

on x = ( x 1 , , x n ) {\displaystyle \mathbf {x} '=(x'_{1},\ldots ,x'_{n})} és un vector de valors possibles per a X i {\displaystyle X_{i}} , i la notació x : x i = x i {\displaystyle \mathbf {x} ':x'_{i}=x_{i}} significa que la suma s'agafa per sobre d'aquests x {\displaystyle \mathbf {x} '} de qui i {\displaystyle i} la coordenada és igual a x i {\displaystyle x_{i}} .

El càlcul de distribucions marginals mitjançant aquesta fórmula esdevé ràpidament computacionalment prohibitiu a mesura que creix el nombre de variables. Per exemple, donades 100 variables binàries X 1 , , X 100 {\displaystyle X_{1},\ldots ,X_{100}} , calculant un únic marginal X i {\displaystyle X_{i}} utilitzant p {\displaystyle p} i la fórmula anterior implicaria la suma 2 99 6.34 × 10 29 {\displaystyle 2^{99}\approx 6.34\times 10^{29}} valors possibles per x {\displaystyle \mathbf {x} '} . Si se sap que la funció de massa de probabilitat p {\displaystyle p} factors d'una manera convenient, la propagació de creences permet calcular els marginals de manera molt més eficient.

Referències

  1. Braunstein, A.; Mézard, M.; Zecchina, R. Random Structures & Algorithms, 27, 2, 2005, pàg. 201–226. arXiv: cs/0212002. DOI: 10.1002/rsa.20057.
  2. "[1]" a AAAI-82: Pittsburgh, PA.  
  3. "[2]" a IJCAI-83: Karlsruhe, Germany.  
  4. Pearl, Judea. Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference. 2nd. San Francisco, CA: Morgan Kaufmann, 1988. ISBN 978-1-55860-479-7.