Suite à discrépance faible

En mathématiques, une suite à discrépance faible est une suite ayant la propriété que pour tout entier N, la sous-suite x1, ..., xN a une discrépance basse.

Dans les faits, la discrépance d'une suite est faible si la proportion des points de la suite sur un ensemble B est proche de la valeur de la mesure de B, ce qui est le cas en moyenne (mais pas pour des échantillons particuliers) pour une suite équidistribuée. Plusieurs définitions de la discrépance existent selon la forme de B (hypersphères, hypercubes, etc.) et la méthode de calcul de la discrépance sur B.

Les suites à discrépance faible sont appelées quasi aléatoires ou sous-aléatoires, en raison de leur utilisation pour remplacer les tirages de la loi uniforme continue. Le préfixe « quasi » précise ainsi que les valeurs d'une suite à discrépance faible ne sont pas aléatoires ou pseudo-aléatoires, mais ont des propriétés proches de tels tirages, permettant ainsi leur usage intéressant dans la méthode de quasi-Monte-Carlo.

Définitions

Discrépance

La discrépance ou discrépance extrême[1] d'un ensemble P = {x1, ..., xN} est définie (en utilisant les notations de Niederreiter) par

D N ( P ) = sup B J | A ( B ; P ) N λ s ( B ) | {\displaystyle D_{N}(P)=\sup _{B\in J}\left|{\frac {A(B;P)}{N}}-\lambda _{s}(B)\right|}

avec

  • λs est la mesure de Lebesgue de dimension s,
  • A(B; P) est le nombre de points de P appartenant à B,
  • J est l'ensemble des pavés de dimension s, de la forme
i = 1 s [ a i , b i [ = { x R s : a i x i < b i } {\displaystyle \prod _{i=1}^{s}[a_{i},b_{i}[=\{\mathbf {x} \in \mathbb {R} ^{s}:a_{i}\leq x_{i}<b_{i}\}\,}

avec 0 a i < b i 1 {\displaystyle 0\leq a_{i}<b_{i}\leq 1} .

Discrépance à l'origine et discrépance isotrope

La discrépance à l'origine D*N(P) est définie de façon similaire, mis à part que la borne inférieure des pavés de J est fixée à 0 :

D N ( P ) = sup B J | A ( B ; P ) N λ s ( B ) | {\displaystyle D_{N}^{*}(P)=\sup _{B\in J^{*}}\left|{\frac {A(B;P)}{N}}-\lambda _{s}(B)\right|}

avec J* l'ensemble des pavés de dimension s, de la forme

i = 1 s [ 0 , u i [ {\displaystyle \prod _{i=1}^{s}[0,u_{i}[}

ui est dans l'intervalle semi-ouvert [0, 1[.

On définit également la discrépance isotrope JN(P) :

J N ( P ) = sup C C | A ( C ; P ) N λ s ( C ) | {\displaystyle J_{N}(P)=\sup _{C\in {\mathcal {C}}^{*}}\left|{\frac {A(C;P)}{N}}-\lambda _{s}(C)\right|}

avec C {\displaystyle {\mathcal {C}}^{*}} la famille des sous-ensembles convexes du cube unité fermé de dimension s.

On a les résultats suivants

0 D N D N J N 1 {\displaystyle 0\leq D_{N}^{*}\leq D_{N}\leq J_{N}\leq 1} ,
D N D N 2 s D N {\displaystyle D_{N}^{*}\leq D_{N}\leq 2^{s}D_{N}^{*}} ,
D N J N 4 s ( D N ) 1 s {\displaystyle D_{N}\leq J_{N}\leq 4s(D_{N})^{\frac {1}{s}}} .

Propriétés

L'inégalité de Koksma-Hlawka

On note Īs le cube unitaire de dimension s,

I ¯ s = [ 0 , 1 ] × . . . × [ 0 , 1 ] {\displaystyle {\bar {I}}^{s}=[0,1]\times ...\times [0,1]} .

Soit f une fonction à variation bornée de variation de Hardy-Krause V(f) finie sur Īs. Alors pour tout x1, ..., xN dans Is = [0, 1[ × ... × [0, 1[

| 1 N i = 1 N f ( x i ) I ¯ s f ( u ) d u | V ( f ) D N ( x 1 , , x N ) {\displaystyle \left|{\frac {1}{N}}\sum _{i=1}^{N}f(x_{i})-\int _{{\bar {I}}^{s}}f(u)\,du\right|\leq V(f)\,D_{N}^{*}(x_{1},\ldots ,x_{N})} .

L'inégalité de Koksma-Hlawka est consistante dans le sens où pour tout ensemble de points x1,...,xN dans Is et tout ε > 0, il existe une fonction f à variation bornée telle que V(f)=1 et

| 1 N i = 1 N f ( x i ) I ¯ s f ( u ) d u | > D N ( x 1 , , x N ) ϵ . {\displaystyle \left|{\frac {1}{N}}\sum _{i=1}^{N}f(x_{i})-\int _{{\bar {I}}^{s}}f(u)\,du\right|>D_{N}^{*}(x_{1},\ldots ,x_{N})-\epsilon .}

Ainsi, la qualité du calcul de l'intégrale ne dépend que de la discrépance D*N(x1,...,xN).

L'inégalité d'Erdös-Turán-Koksma

Article détaillé : Inégalité d'Erdős–Turán.

Le calcul de la discrépance de grands ensembles est souvent compliquée, mais l'inégalité d'Erdös-Turán-Koksma donne une majoration de la valeur.

Soit x1,...,xN des points sur Is et H un entier positif. Alors

D N ( x 1 , , x N ) ( 3 2 ) s ( 2 H + 1 + 0 < h H 1 r ( h ) | 1 N n = 1 N e 2 π i h , x n | ) {\displaystyle D_{N}^{*}(x_{1},\ldots ,x_{N})\leq \left({\frac {3}{2}}\right)^{s}\left({\frac {2}{H+1}}+\sum _{0<\|h\|_{\infty }\leq H}{\frac {1}{r(h)}}\left|{\frac {1}{N}}\sum _{n=1}^{N}e^{2\pi i\langle h,x_{n}\rangle }\right|\right)}

avec

r ( h ) = i = 1 s max { 1 , | h i | } pour h = ( h 1 , , h s ) Z s . {\displaystyle r(h)=\prod _{i=1}^{s}\max\{1,|h_{i}|\}\quad {\mbox{pour}}\quad h=(h_{1},\ldots ,h_{s})\in \mathbb {Z} ^{s}.}

Conjectures sur la minoration des valeurs de la discrépance

Conjecture 1. Il existe une constante cs dépendant uniquement de la dimension s, telle que

D N ( x 1 , , x N ) c s ( ln N ) s 1 N {\displaystyle D_{N}^{*}(x_{1},\ldots ,x_{N})\geq c_{s}{\frac {(\ln N)^{s-1}}{N}}}

pour tout ensemble fini de points {x1,...,xN}.

Conjecture 2. Il existe une constante c's dépendant uniquement de la dimension s, telle que

D N ( x 1 , , x N ) c s ( ln N ) s N {\displaystyle D_{N}^{*}(x_{1},\ldots ,x_{N})\geq c'_{s}{\frac {(\ln N)^{s}}{N}}}

pour au moins un sous-ensemble fini de valeurs de la suite x1, x2, x3....

Ces conjectures sont équivalentes. Si elles ont été prouvées pour s ≤ 2 par Wolfgang Schmidt, la question des dimensions supérieures est encore ouverte.

Minorations connues

Soit s = 1. Alors

D N ( x 1 , , x N ) 1 2 N {\displaystyle D_{N}^{*}(x_{1},\ldots ,x_{N})\geq {\frac {1}{2N}}}

pour tout N et toute suite de valeurs {x1, ..., xN}.

Soit s = 2. Wolfgang Schmidt a prouvé que pour tout ensemble fini de points {x1, ..., xN}, on a

D N ( x 1 , , x N ) C log N N {\displaystyle D_{N}^{*}(x_{1},\ldots ,x_{N})\geq C{\frac {\log N}{N}}}

avec

C = max a 3 1 16 a 2 a log a = 0,023 335 {\displaystyle C=\max _{a\geq 3}{\frac {1}{16}}{\frac {a-2}{a\log a}}=0{,}023335\dots }

Pour les dimensions s > 1, K. F. Roth a prouvé que

D N ( x 1 , , x N ) 1 2 4 s 1 ( ( s 1 ) log 2 ) s 1 2 log s 1 2 N N {\displaystyle D_{N}^{*}(x_{1},\ldots ,x_{N})\geq {\frac {1}{2^{4s}}}{\frac {1}{((s-1)\log 2)^{\frac {s-1}{2}}}}{\frac {\log ^{\frac {s-1}{2}}N}{N}}}

pour tout ensemble fini de points {x1, ..., xN}.

Construction de suites à discrépance faible

On ne donne ici que des exemples de tirages à discrépance faible pour les dimensions supérieures à 1.

On sait construire des suites telles que

D N ( x 1 , , x N ) C ( ln N ) s N . {\displaystyle D_{N}^{*}(x_{1},\ldots ,x_{N})\leq C{\frac {(\ln N)^{s}}{N}}.}

où la constante C dépend de la suite. Par la conjecture 2, ces suites sont supposées avoir le meilleur ordre de convergence possible.

À partir de nombres aléatoires

Des suites de nombres sous-aléatoires peuvent être générées à partir d'un tirage aléatoire en imposant une corrélation négative entre les nombres du tirage. Par exemple, on peut se donner un tirage aléatoire ri sur [ 0 ; 0 , 5 [ {\displaystyle [0;0,5[} et construire des nombres sous-aléatoires si réparties de façon uniforme sur [ 0 , 1 [ {\displaystyle [0,1[} par :

  • s i = r i {\displaystyle s_{i}=r_{i}} si i impair et s i = 0.5 + r i {\displaystyle s_{i}=0.5+r_{i}} si i pair
  • s i = s i 1 + 0.5 + r i ( mod 1 ) {\displaystyle s_{i}=s_{i-1}+0.5+r_{i}{\pmod {1}}} .

Par récurrence additive

Une méthode classique de génération de nombres pseudo-aléatoires est donné par[2] :

r i = a r i 1 + c ( mod m ) {\displaystyle r_{i}=ar_{i-1}+c{\pmod {m}}} .

En fixant a et c à 1, on obtient un générateur simple :

r i = r i 1 + 1 ( mod m ) {\displaystyle r_{i}=r_{i-1}+1{\pmod {m}}} .

Suites de Sobol

La variante Antonov–Saleev de la suite de Sobol génère des nombres entre 0 et 1 comme fractions binaires de longueur w, pour un ensemble w fractions binaires spéciales, V i , i = 1 , 2 , , w {\displaystyle V_{i},i=1,2,\dots ,w} sont appelés nombres de direction. Les bits du code de Gray de i, G(i), sont utilisés pour choisir des nombres de direction. Obtenir les valeurs de la suite de Sobol si demande le ou exclusif de la valeur binaire du code de Gray de i avec le nombre de direction approprié. Le nombre de dimension a un impact sur le choix de Vi.

Suites de van der Corput

Article détaillé : Suite de van der Corput.

Soit

n = k = 0 L 1 d k ( n ) b k {\displaystyle n=\sum _{k=0}^{L-1}d_{k}(n)b^{k}}

la décomposition de l'entier positif n ≥ 1 en base b, avec donc 0 ≤ dk(n) < b. On pose

g b ( n ) = k = 0 L 1 d k ( n ) b k 1 . {\displaystyle g_{b}(n)=\sum _{k=0}^{L-1}d_{k}(n)b^{-k-1}.}

Alors il existe une constante C dépendant uniquement de b telle que (gb(n))n ≥ 1 vérifie

D N ( g b ( 1 ) , , g b ( N ) ) C log N N . {\displaystyle D_{N}^{*}(g_{b}(1),\dots ,g_{b}(N))\leq C{\frac {\log N}{N}}.}

Suite de Halton

Les 256 points de la suite de Halton (2,3)

La suite de Halton généralise la suite de van der Corput pour les dimensions supérieures à 1. Soit s la dimension du problème et b1, ..., bs des nombres premiers entre eux supérieurs à 1. Alors

x ( n ) = ( g b 1 ( n ) , , g b s ( n ) ) . {\displaystyle x(n)=(g_{b_{1}}(n),\dots ,g_{b_{s}}(n)).}

Il existe une constante C dépendant uniquement de b1, ..., bs, telle que {x(n)}n≥1 vérifie

D N ( x ( 1 ) , , x ( N ) ) C ( log N ) s N . {\displaystyle D_{N}^{*}(x(1),\dots ,x(N))\leq C'{\frac {(\log N)^{s}}{N}}.}

Dans la pratique, on utilise les s premiers nombres premiers pour b1, ..., bs.

Suite de Hammersley

Ensemble 2D de la suite de Hammersley de taille 256

Soit b1,...,bs-1 des nombres premiers entre eux supérieurs à 1. Pour s et N donnés, la suite de Hammersley de taille N est donnée par

x ( n ) = ( g b 1 ( n ) , , g b s 1 ( n ) , n N ) {\displaystyle x(n)=(g_{b_{1}}(n),\dots ,g_{b_{s-1}}(n),{\frac {n}{N}})}

Elle vérifie

D N ( x ( 1 ) , , x ( N ) ) C ( log N ) s 1 N {\displaystyle D_{N}^{*}(x(1),\dots ,x(N))\leq C{\frac {(\log N)^{s-1}}{N}}}

C est une constante ne dépendant que de b1, ..., bs−1.

Références

(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Low-discrepancy sequence » (voir la liste des auteurs).
  1. Discrepancy en anglais, voir par exemple (Lapeyre et Pagès 1989) et (Thiémard 2000), pour une référence de la traduction.
  2. (en) Donald E. Knuth, The Art of Computer Programming, vol. 2, chap. 3.

Bibliographie

Théorie

  • Eric Thiémard, Sur le calcul et la majoration de la discrépance à l'origine (Thèse de doctorat), École polytechnique fédérale de Lausanne, (lire en ligne) Document utilisé pour la rédaction de l’article
  • (en) Josef Dick et Friedrich Pillichshammer, Digital Nets and Sequences. Discrepancy Theory and Quasi-Monte Carlo Integration, Cambridge University Press, Cambridge, 2010, (ISBN 978-0-521-19159-3)
  • (en) L. Kuipers et H. Niederreiter, Uniform distribution of sequences, Dover Publications, , 416 p. (ISBN 0-486-45019-8)
  • (en) Harald Niederreiter, Random Number Generation and Quasi-Monte Carlo Methods, SIAM, 1992 (ISBN 0-89871-295-5)
  • (en) Michael Drmota et Robert F. Tichy, Sequences, discrepancies and applications, Lecture Notes in Math., 1651, Springer, Berlin, 1997 (ISBN 3-540-62606-9)
  • Bernard Lapeyre et G. Pagès, « Familles de suites à discrépance faible obtenues par itération de transformations de [0, 1] », Note aux CRAS, Série I, vol. 17,‎ , p. 507-509

Simulations numériques

  • (en) William H. Press, Brian P. Flannery, Saul A. Teukolsky et William T. Vetterling, Numerical Recipes in C, Cambridge University Press, 2e éd., 1992 (ISBN 0-521-43108-5) (voir Section 7.7 pour une discussion moins technique)
  • Quasi-Monte Carlo Simulations, http://www.puc-rio.br/marco.ind/quasi_mc.html

Liens externes

  • (en) Collected Algorithms of the ACM (voir les algorithmes 647, 659 et 738)
  • (en) GNU Scientific Library Quasi-Random Sequences
  • icône décorative Portail des mathématiques