Differences between revisions 1 and 15 (spanning 14 versions)

Modulo QSPN - Percorsi disgiunti

Contents

Modulo QSPN - Percorsi disgiunti
1. Definizione
  1. Perché memorizzare diversi percorsi disgiunti
    1. Rimozione di uno o più percorsi
    2. Congestione di un percorso
  2. Considerazioni sulla mappa gerarchica
2. Operazioni di scelta dei percorsi
  1. Esempio

L'obiettivo del presente documento è definire cosa si intende con il termine percorsi disgiunti e delineare l'algoritmo per la scelta di tali percorsi.

Definizione

Ricordiamo che l'obiettivo del modulo QSPN è permettere ad ogni nodo n di reperire e mantenere per ogni destinazione d fino a max_paths percorsi disgiunti, che siano i più rapidi.

Si definisce rapporto di hops comuni tra due percorsi p e q verso la stessa destinazione, dove p è il percorso meno costoso dei due, il rapporto tra il numero di singoli nodi comuni nei due percorsi e il numero di singoli nodi nel percorso p. In questo computo non va inclusa la destinazione. Se il rapporto è inferiore ad una certa costante max_common_hops_ratio, oppure se il percorso p è un diretto vicino e quindi il denominatore sarebbe 0, allora si dice che il percorso q è disgiunto dal percorso p.

Si consideri che i percorsi sono composti da g-nodi. Di ogni g-nodo g abbiamo una approssimazione del numero di nodi al suo interno num(g). Se un percorso passa per un g-nodo per arrivare alla destinazione, questo non significa che percorra tutti i nodi al suo interno. Come "stima" del numero di nodi che effettivamente quel percorso prevede prendiamo floor ( 1.5 * sqrt ( num ( g ) ) ).

Perché memorizzare diversi percorsi disgiunti

Quali motivi ci sono per un nodo di memorizzare diversi percorsi verso una destinazione?

Rimozione di uno o più percorsi

Supponiamo che il nodo n ha memorizzato 3 percorsi verso d. Assumiamo anche che il nodo n per inviare pacchetti verso d usi sempre il migliore dei 3. A che serve avere in memoria anche gli altri 2?

Siano questi i percorsi noti a n verso d:

p1 composto da n → a → b → c → d. Sia questo il migliore.
p2 composto da n → x → y → z → d.
p3 composto da n → q → r → s → d. Sia questo il peggiore.

Supponiamo ora che il collegamento tra i nodi b e c si interrompa. Il nodo b avverte a che questo percorso verso d non c'è più. Il nodo a avverte il nodo n che questo percorso verso d non c'è più.

Il nodo n si vede rimosso il percorso p1, il migliore verso d, cioè quello che usava sempre. Avendo esso in memoria altri percorsi che non hanno subito variazioni, non ha bisogno di attendere altri eventi né di iniziare altri processi esplorativi, ma subito conosce un altro percorso p2 da usare per inviare pacchetti verso d.

Ovviamente, per ragioni di memoria e di traffico, il nodo n non può né memorizzare né ritrasmettere tutti i percorsi possibili verso d, ma solo fino ad un certo numero massimo. Vediamo allora perché preferire la memorizzazione di percorsi disgiunti.

Siano questi i percorsi noti a n verso d:

p1 composto da n → a → b → c → d. Sia questo il migliore.
p2 composto da n → x → b → c → d.
p3 composto da n → q → r → s → d. Sia questo il peggiore.

Inoltre, il nodo b avverte x che questo percorso verso d non c'è più. Il nodo x avverte il nodo n che questo percorso verso d non c'è più.

In rapida successione, a motivo di un unico collegamento venuto a mancare, il nodo n si vede rimossi 2 dei suoi 3 percorsi verso n. Questo evento risulta più probabile quando i percorsi tenuti in memoria non sono sufficientemente disgiunti.

Congestione di un percorso

Assumiamo che il lettore abbia una conoscenza di base del meccanismo implementato nel TCP per evitare la congestione di un percorso.

In presenza di un "collo di bottiglia" in un percorso, il meccanismo prevede che il nodo che origina la trasmissione individui in poco tempo quale sia la massima rapidità con cui può trasmettere pacchetti uno dopo l'altro. C'è da dire anche che nei moderni dispositivi di rete usati nelle dorsali di Internet il fenomeno del bufferbloat ostacola questo meccanismo, a discapito del buon funzionamento della rete.

Il meccanismo di congestion avoidance consiste essenzialmente nel segnalare in qualche modo al nodo originante il fatto che sta trasmettendo troppo in fretta. Questa segnalazione può arrivare fondamentalmente in due modi:

alcuni pacchetti sono stati scartati da un router perché li riceve troppo in fretta rispetto a quanto li possa ritrasmettere; quindi il nodo destinazione segnala al mittente che ha ricevuto il pacchetto "n+1" ma non il pacchetto "n".
un router segnala direttamente al mittente, prima che sia costretto a scartare i suoi pacchetti, che sta trasmettendo troppo in fretta.

L'esplorazione della rete svolta dal modulo QSPN mira a trovare i percorsi migliori rispetto ad una certa metrica. Di norma questa sarà la latenza; ma anche se fosse la larghezza di banda questa verrebbe misurata per ogni singolo arco in determinati momenti. Questo per dire che il percorso che è stato individuato come il migliore, qualsiasi metrica sia stata usata per la sua individuazione, in un certo momento potrebbe non essere quello che offre il miglior throughput.

Soltanto nel momento in cui il nodo n usa un percorso p1 per inviare una grossa quantità di dati a d, allora si può rendere conto dell'efficienza che il percorso ha in quel momento.

Il nodo potrebbe provare anche gli altri percorsi a lui noti, per individuare il migliore in quel momento. Anche in questo caso è evidente che sia meglio per il nodo n non solo conoscere diversi percorsi, ma che siano tra loro più disgiunti possibile. Infatti, se il collo di bottiglia di un percorso risulta essere un arco che in quel momento esperimenta un fenomeno di congestione particolarmente elevata, il nodo n non avrà alcun vantaggio se usa un altro percorso che passa per lo stesso arco.

Per finire, una osservazione. Supponiamo che in una versione aggiornata del protocollo TCP (o un altro protocollo del livello di trasporto) il router che satura il suo link di trasmissione sia in grado di indicare al nodo mittente non solo che deve rallentare, ma anche il punto in cui il collo di bottiglia si sta verificando.

Con questa informazione, se il nodo ha memoria di altri percorsi per raggiungere la destinazione d e di questi percorsi conosce i vari passaggi intermedi, il nodo n è in grado di scegliere con maggior accuratezza quale percorso provare per le prossime connessioni.

Considerazioni sulla mappa gerarchica

Abbiamo mostrato sopra che se due percorsi p1 e p2 hanno in comune un passaggio (ad esempio ... → b → c → ...) questo li rende poco disgiunti.

Questo è vero fintanto che si considera un percorso come sequenza di nodi, ma può non essere vero quando si passa a considerare un percorso come sequenza di gruppi di nodi. Infatti due percorsi p1 e p2 che passano per lo stesso gruppo di nodi g (specialmente se il gruppo contiene molti nodi) potrebbero essere in realtà in gran parte (o anche del tutto) disgiunti, cioè passare per nodi in gran parte diversi. Quindi, se il percorso p1 da n verso d viene rimosso a causa della caduta di un collegamento tra due nodi interni a g, il percorso p2 potrebbe rimanere valido.

Quali informazioni ha il nodo n relativamente ad un percorso p verso d che passa per g? Oltre a sapere che passa per g sa anche l'identificativo dell'arco attraverso il quale entra in g e dell'arco attraverso il quale esce da g.

Abbiamo già detto quale formula applichiamo al numero stimato di nodi presenti in g per stimare il numero di nodi interni a g che saranno toccati da un percorso p che "tocca" g.

Consideriamo i due percorsi p e q verso d, con p il percorso meno costoso. Supponiamo che entrambi contengano il passaggio in g. Sia numpath ( g ) il numero di nodi ottenuto con la suddetta formula come stima dei nodi toccati all'interno di g.

Quando si calcola il rapporto di hops comuni tra p e q, nel computo del numero di singoli nodi in p vi sommiamo numpath ( g ). Invece nel computo del numero di singoli nodi comuni nei due percorsi procediamo in maniera diversa a seconda di questi casi:

Se in entrambi i percorsi p e q si entra in g attraverso l'arco a e se ne esce attraverso l'arco b, allora vi sommiamo numpath ( g ).
Se in entrambi i percorsi p e q si entra in g attraverso l'arco a, ma se ne esce attraverso due archi distinti b1 e b2, allora vi sommiamo ceil (numpath ( g ) / 2).
Se nei percorsi p e q si entra in g attraverso due archi distinti a1 e a2, ma se ne esce attraverso lo stesso arco b, allora vi sommiamo ceil (numpath ( g ) / 2).
Se nei percorsi p e q si entra in g attraverso due archi distinti a1 e a2 e se ne esce attraverso due archi distinti b1 e b2, allora vi sommiamo 0.

Operazioni di scelta dei percorsi

Occorre da subito considerare che il nodo n, quando sceglie i percorsi da mantenere in memoria e quelli da scartare, vuole mantenere per ogni destinazione d e per ogni proprio vicino v, almeno 1 percorso, se esiste, indipendentemente dal valore di max_paths e dalle regole di disgiunzione, verso d che non contiene v tra i suoi passaggi. Inoltre n vuole mantenere per ogni destinazione d almeno 1 percorso per ogni diverso fingerprint di d che gli viene segnalato.

Ogni volta che il nodo n finisce di rielaborare i percorsi di uno o più messaggi ETP, si trova con un numero di percorsi per alcune destinazioni, oltre a quelli che erano già nella sua mappa. Sia O_d la lista dei percorsi noti al nodo n per raggiungere la destinazione d. Sia V_n la lista dei vicini di n. In questo documento vediamo come il nodo n decida quali percorsi mantenere nella propria mappa e quali scartare.

Per prima cosa il nodo n ordina per costo crescente i percorsi in O_d.

Per ogni percorso p in O_d, per ogni g-nodo h in p (esclusa la destinazione), il nodo n verifica di avere h come destinazione possibile nella sua mappa e ne reperisce il numero di nodi al suo interno. Se h non è presente nella sua mappa allora rimuove p da O_d.

Poi n prosegue con questo algoritmo:

Il nodo n prepara un insieme vuoto F_d.
Il nodo n prepara un insieme vuoto R_d.
Il nodo n prepara un insieme vuoto V_nd.
Per ogni vicino v ∈ V_n:
- n calcola il massimo distinto g-nodo di v per n e lo mette in V_nd.
Inizia un ciclo c1 per ogni percorso p1 ∈ O_d:
- Se p1.cost = dead:
  - Esci dal ciclo c1.
- obbligatorio = False.
- Se p1.fingerprint ∉ F_d:
  - obbligatorio = True.
  - p1.fingerprint viene inserito in F_d.
- Per ogni g-nodo g ∈ V_nd:
  - Se g ∉ p1:
    - Rimuove g da V_nd.
    - obbligatorio = True.
- Se obbligatorio:
  - p1 viene inserito in R_d.
- Altrimenti-Se R_d.size < max_paths:
  - inserire = True.
  - Inizia un ciclo c2 per ogni percorso p2 ∈ R_d:
    - total_hops = 0.
    - common_hops = 0.
    - Per ogni g-nodo g2 (con arco di ingresso a_in_g2 e arco di uscita a_out_g2) ∈ p2 (esclusa la destinazione):
      - num_path_g2 = floor ( 1.5 * sqrt ( num ( g2 ) ) ).
      - total_hops += num_path_g2.
      - Se g2 ∈ p1:
        Se nel percorso p1 l'arco di ingresso in g2 è a_in_g2:
        Se nel percorso p1 l'arco di uscita da g2 è a_out_g2:
        common_hops += num_path_g2.
        Altrimenti:
        common_hops += ceil (num_path_g2 / 2).
        Altrimenti:
        Se nel percorso p1 l'arco di uscita da g2 è a_out_g2:
        common_hops += ceil (num_path_g2 / 2).
        Altrimenti:
        common_hops += 0.
    - Se total_hops > 0 AND common_hops / total_hops > max_common_hops_ratio:
      - inserire = False.
      - Esci dal ciclo c2.
  - Se inserire:
    - p1 viene inserito in R_d.
Il nodo n sostituisce l'insieme O_d con R_d.

Esempio

Portiamo a semplice esempio una rete con un solo livello. Sia il nostro nodo A, l'unico vicino B, e la destinazione G. Impostiamo max_common_hops_ratio=0.7. Siano noti i percorsi:

BC 150 (AB=50, BC=50, CG=50)
BD 160 (AB=50, BD=55, DG=55)
BEF 170 (AB=50, BE=50, EF=35, FG=35)
BED 180 (AB=50, BE=50, ED=25, DG=55)
BDEF 190 (AB=50, BD=55, DE=15, EF=35, FG=35)

Prima ordino i percorsi (come già fatto sopra) in base al costo.

Il primo è preso per diritto.

Il secondo, per decidere se è sufficientemente disgiunto, lo devo confrontare solo con il primo. Il "rapporto di hops comuni" in questo caso è 1/2, quindi il secondo percorso viene preso.

Il terzo percorso va confrontato con tutti i precedenti presi, quindi il primo e il secondo. Il rapporto con il primo è 1/2, con il secondo 1/2.

Quindi il terzo è preso.

Il quarto percorso nel rapporto con il secondo ha 2/2. Quindi non viene preso.

Il quinto percorso va ora confrontato con i tre precedenti presi. Anche qui, il rapporto con il secondo è 2/2, quindi non viene preso.

Netsukuku/ita/docs/ModuloQSPN/PercorsiDisgiunti (last edited 2016-04-08 17:00:59 by lukisi)

-  ⇤ ← Revision 1 as of 2014-11-27 09:45:41 → 
  Size: 4512
  Editor: lukisi
  Comment:
+   ← Revision 15 as of 2015-08-15 17:04:21 → ⇥
  Size: 14230
  Editor: lukisi
  Comment:
-Deletions are marked like this.
+Additions are marked like this.
 Line 1:
-= Modulo QSPN - Rotte disgiunte =
L'obiettivo del modulo QSPN è che i nodi scoprano e memorizzino per ogni destinazione fino a ''n'' rotte disgiunte preferendo le più veloci.
+= Modulo QSPN - Percorsi disgiunti =
<<TableOfContents(4)>>
 Line 4:
-=== Esempio 1 ===
Sia il nostro nodo A e la destinazione G. Siano note le rotte:
+L'obiettivo del presente documento è definire cosa si intende con il termine ''percorsi disgiunti'' e delineare l'algoritmo per la scelta di tali percorsi.

== Definizione ==
Ricordiamo che l'obiettivo del modulo QSPN è permettere ad ogni nodo ''n'' di reperire e mantenere per ogni destinazione ''d'' fino a ''max_paths'' percorsi disgiunti, che siano i più rapidi.

Si definisce ''rapporto di hops comuni'' tra due percorsi ''p'' e ''q'' verso la stessa destinazione, dove ''p'' è il percorso meno costoso dei due, il rapporto tra il numero di singoli nodi comuni nei due percorsi e il numero di singoli nodi nel percorso ''p''. In questo computo non va inclusa la destinazione. Se il rapporto è inferiore ad una certa costante ''max_common_hops_ratio'', oppure se il percorso ''p'' è un diretto vicino e quindi il denominatore sarebbe 0, allora si dice che il percorso ''q'' è disgiunto dal percorso ''p''.

Si consideri che i percorsi sono composti da g-nodi. Di ogni g-nodo ''g'' abbiamo una approssimazione del numero di nodi al suo interno ''num(g)''. Se un percorso passa per un g-nodo per arrivare alla destinazione, questo non significa che percorra tutti i nodi al suo interno. Come "stima" del numero di nodi che effettivamente quel percorso prevede prendiamo ''floor ( 1.5 * sqrt ( num ( g ) ) )''.

=== Perché memorizzare diversi percorsi disgiunti ===
Quali motivi ci sono per un nodo di memorizzare diversi percorsi verso una destinazione?

==== Rimozione di uno o più percorsi ====
Supponiamo che il nodo ''n'' ha memorizzato 3 percorsi verso ''d''. Assumiamo anche che il nodo ''n'' per inviare pacchetti verso ''d'' usi sempre il migliore dei 3. A che serve avere in memoria anche gli altri 2?

Siano questi i percorsi noti a ''n'' verso ''d'':
 * ''p1'' composto da ''n'' → ''a'' → ''b'' → ''c'' → ''d''. Sia questo il migliore.
 * ''p2'' composto da ''n'' → ''x'' → ''y'' → ''z'' → ''d''.
 * ''p3'' composto da ''n'' → ''q'' → ''r'' → ''s'' → ''d''. Sia questo il peggiore.

Supponiamo ora che il collegamento tra i nodi ''b'' e ''c'' si interrompa. Il nodo ''b'' avverte ''a'' che questo percorso verso ''d'' non c'è più. Il nodo ''a'' avverte il nodo ''n'' che questo percorso verso ''d'' non c'è più.

Il nodo ''n'' si vede rimosso il percorso ''p1'', il migliore verso ''d'', cioè quello che usava sempre. Avendo esso in memoria altri percorsi che non hanno subito variazioni, non ha bisogno di attendere altri eventi né di iniziare altri processi esplorativi, ma subito conosce un altro percorso ''p2'' da usare per inviare pacchetti verso ''d''.

Ovviamente, per ragioni di memoria e di traffico, il nodo ''n'' non può né memorizzare né ritrasmettere tutti i percorsi possibili verso ''d'', ma solo fino ad un certo numero massimo. Vediamo allora perché preferire la memorizzazione di percorsi disgiunti.

Siano questi i percorsi noti a ''n'' verso ''d'':
 * ''p1'' composto da ''n'' → ''a'' → ''b'' → ''c'' → ''d''. Sia questo il migliore.
 * ''p2'' composto da ''n'' → ''x'' → ''b'' → ''c'' → ''d''.
 * ''p3'' composto da ''n'' → ''q'' → ''r'' → ''s'' → ''d''. Sia questo il peggiore.

Supponiamo ora che il collegamento tra i nodi ''b'' e ''c'' si interrompa. Il nodo ''b'' avverte ''a'' che questo percorso verso ''d'' non c'è più. Il nodo ''a'' avverte il nodo ''n'' che questo percorso verso ''d'' non c'è più.

Inoltre, il nodo ''b'' avverte ''x'' che questo percorso verso ''d'' non c'è più. Il nodo ''x'' avverte il nodo ''n'' che questo percorso verso ''d'' non c'è più.

In rapida successione, a motivo di un unico collegamento venuto a mancare, il nodo ''n'' si vede rimossi 2 dei suoi 3 percorsi verso ''n''. Questo evento risulta più probabile quando i percorsi tenuti in memoria non sono sufficientemente disgiunti.

==== Congestione di un percorso ====
Assumiamo che il lettore abbia una conoscenza di base del meccanismo implementato nel TCP per evitare la congestione di un percorso.

In presenza di un "collo di bottiglia" in un percorso, il meccanismo prevede che il nodo che origina la trasmissione individui in poco tempo quale sia la massima rapidità con cui può trasmettere pacchetti uno dopo l'altro. C'è da dire anche che nei moderni dispositivi di rete usati nelle dorsali di Internet il fenomeno del [[https://en.wikipedia.org/wiki/Bufferbloat|bufferbloat]] ostacola questo meccanismo, a discapito del buon funzionamento della rete.

Il meccanismo di ''congestion avoidance'' consiste essenzialmente nel segnalare in qualche modo al nodo originante il fatto che sta trasmettendo troppo in fretta. Questa segnalazione può arrivare fondamentalmente in due modi:
 * alcuni pacchetti sono stati scartati da un router perché li riceve troppo in fretta rispetto a quanto li possa ritrasmettere; quindi il nodo destinazione segnala al mittente che ha ricevuto il pacchetto "n+1" ma non il pacchetto "n".
 * un router segnala direttamente al mittente, prima che sia costretto a scartare i suoi pacchetti, che sta trasmettendo troppo in fretta.

L'esplorazione della rete svolta dal modulo QSPN mira a trovare i percorsi migliori rispetto ad una certa metrica. Di norma questa sarà la latenza; ma anche se fosse la larghezza di banda questa verrebbe misurata per ogni singolo arco in determinati momenti. Questo per dire che il percorso che è stato individuato come il migliore, qualsiasi metrica sia stata usata per la sua individuazione, in un certo momento potrebbe non essere quello che offre il miglior throughput.

Soltanto nel momento in cui il nodo ''n'' usa un percorso ''p1'' per inviare una grossa quantità di dati a ''d'', allora si può rendere conto dell'efficienza che il percorso ha in quel momento.

Il nodo potrebbe provare anche gli altri percorsi a lui noti, per individuare il migliore in quel momento. Anche in questo caso è evidente che sia meglio per il nodo ''n'' non solo conoscere diversi percorsi, ma che siano tra loro più disgiunti possibile. Infatti, se il collo di bottiglia di un percorso risulta essere un arco che in quel momento esperimenta un fenomeno di congestione particolarmente elevata, il nodo ''n'' non avrà alcun vantaggio se usa un altro percorso che passa per lo stesso arco.

Per finire, una osservazione. Supponiamo che in una versione aggiornata del protocollo TCP (o un altro protocollo del livello di trasporto) il router che satura il suo link di trasmissione sia in grado di indicare al nodo mittente non solo che deve rallentare, ma anche il punto in cui il collo di bottiglia si sta verificando.

Con questa informazione, se il nodo ha memoria di altri percorsi per raggiungere la destinazione ''d'' e di questi percorsi conosce i vari passaggi intermedi, il nodo ''n'' è in grado di scegliere con maggior accuratezza quale percorso provare per le prossime connessioni.

=== Considerazioni sulla mappa gerarchica ===
Abbiamo mostrato sopra che se due percorsi ''p1'' e ''p2'' hanno in comune un passaggio (ad esempio ... → ''b'' → ''c'' → ...) questo li rende poco disgiunti.

Questo è vero fintanto che si considera un percorso come sequenza di nodi, ma può non essere vero quando si passa a considerare un percorso come sequenza di gruppi di nodi. Infatti due percorsi ''p1'' e ''p2'' che passano per lo stesso gruppo di nodi ''g'' (specialmente se il gruppo contiene molti nodi) potrebbero essere in realtà in gran parte (o anche del tutto) disgiunti, cioè passare per nodi in gran parte diversi. Quindi, se il percorso ''p1'' da ''n'' verso ''d'' viene rimosso a causa della caduta di un collegamento tra due nodi interni a ''g'', il percorso ''p2'' potrebbe rimanere valido.

Quali informazioni ha il nodo ''n'' relativamente ad un percorso ''p'' verso ''d'' che passa per ''g''? Oltre a sapere che passa per ''g'' sa anche l'identificativo dell'arco attraverso il quale entra in ''g'' e dell'arco attraverso il quale esce da ''g''.

Abbiamo già detto quale formula applichiamo al numero stimato di nodi presenti in ''g'' per stimare il numero di nodi interni a ''g'' che saranno toccati da un percorso ''p'' che "tocca" ''g''.

Consideriamo i due percorsi ''p'' e ''q'' verso ''d'', con ''p'' il percorso meno costoso. Supponiamo che entrambi contengano il passaggio in ''g''. Sia ''numpath ( g )'' il numero di nodi ottenuto con la suddetta formula come stima dei nodi toccati all'interno di ''g''.

Quando si calcola il rapporto di hops comuni tra ''p'' e ''q'', nel computo del numero di singoli nodi in ''p'' vi sommiamo ''numpath ( g )''. Invece nel computo del numero di singoli nodi comuni nei due percorsi procediamo in maniera diversa a seconda di questi casi:
 * Se in entrambi i percorsi ''p'' e ''q'' si entra in ''g'' attraverso l'arco ''a'' e se ne esce attraverso l'arco ''b'', allora vi sommiamo ''numpath ( g )''.
 * Se in entrambi i percorsi ''p'' e ''q'' si entra in ''g'' attraverso l'arco ''a'', ma se ne esce attraverso due archi distinti ''b1'' e ''b2'', allora vi sommiamo ''ceil (numpath ( g ) / 2)''.
 * Se nei percorsi ''p'' e ''q'' si entra in ''g'' attraverso due archi distinti ''a1'' e ''a2'', ma se ne esce attraverso lo stesso arco ''b'', allora vi sommiamo ''ceil (numpath ( g ) / 2)''.
 * Se nei percorsi ''p'' e ''q'' si entra in ''g'' attraverso due archi distinti ''a1'' e ''a2'' e se ne esce attraverso due archi distinti ''b1'' e ''b2'', allora vi sommiamo 0.

== Operazioni di scelta dei percorsi ==
Occorre da subito considerare che il nodo ''n'', quando sceglie i percorsi da mantenere in memoria e quelli da scartare, vuole mantenere per ogni destinazione ''d'' e per ogni proprio vicino ''v'', almeno 1 percorso, se esiste, indipendentemente dal valore di max_paths e dalle regole di disgiunzione, verso ''d'' che non contiene ''v'' tra i suoi passaggi. Inoltre ''n'' vuole mantenere per ogni destinazione ''d'' almeno 1 percorso per ogni diverso fingerprint di ''d'' che gli viene segnalato.

Ogni volta che il nodo ''n'' finisce di rielaborare i percorsi di uno o più messaggi ETP, si trova con un numero di percorsi per alcune destinazioni, oltre a quelli che erano già nella sua mappa. Sia ''O~-,,d,,-~'' la lista dei percorsi noti al nodo ''n'' per raggiungere la destinazione ''d''. Sia ''V~-,,n,,-~'' la lista dei vicini di ''n''. In questo documento vediamo come il nodo ''n'' decida quali percorsi mantenere nella propria mappa e quali scartare.

Per prima cosa il nodo ''n'' ordina per costo crescente i percorsi in ''O~-,,d,,-~''.

Per ogni percorso ''p'' in ''O~-,,d,,-~'', per ogni g-nodo ''h'' in ''p'' (esclusa la destinazione), il nodo ''n'' verifica di avere ''h'' come destinazione possibile nella sua mappa e ne reperisce il numero di nodi al suo interno. Se ''h'' non è presente nella sua mappa allora rimuove ''p'' da ''O~-,,d,,-~''.

Poi ''n'' prosegue con questo algoritmo:

 * Il nodo ''n'' prepara un insieme vuoto ''F~-,,d,,-~''.
 * Il nodo ''n'' prepara un insieme vuoto ''R~-,,d,,-~''.
 * Il nodo ''n'' prepara un insieme vuoto ''V~-,,nd,,-~''.
 * Per ogni vicino ''v'' ∈ ''V~-,,n,,-~'':
  * ''n'' calcola il massimo distinto g-nodo di ''v'' per ''n'' e lo mette in ''V~-,,nd,,-~''.
 * Inizia un ciclo ''c1'' per ogni percorso ''p1'' ∈ ''O~-,,d,,-~'':
  * Se ''p1''.cost = ''dead'':
   * Esci dal ciclo ''c1''.
  * ''obbligatorio'' = False.
  * Se ''p1''.fingerprint ∉ ''F~-,,d,,-~'':
   * ''obbligatorio'' = True.
   * ''p1''.fingerprint viene inserito in ''F~-,,d,,-~''.
  * Per ogni g-nodo ''g'' ∈ ''V~-,,nd,,-~'':
   * Se ''g'' ∉ p1:
    * Rimuove ''g'' da ''V~-,,nd,,-~''.
    * ''obbligatorio'' = True.
  * Se ''obbligatorio'':
   * ''p1'' viene inserito in ''R~-,,d,,-~''.
  * Altrimenti-Se ''R~-,,d,,-~''.size < ''max_paths'':
   * ''inserire'' = True.
   * Inizia un ciclo ''c2'' per ogni percorso ''p2'' ∈ ''R~-,,d,,-~'':
    * ''total_hops'' = 0.
    * ''common_hops'' = 0.
    * Per ogni g-nodo ''g2'' (con arco di ingresso ''a_in~-,,g2,,-~'' e arco di uscita ''a_out~-,,g2,,-~'') ∈ ''p2'' (esclusa la destinazione):
     * ''num_path_g2'' = floor ( 1.5 * sqrt ( num ( ''g2'' ) ) ).
     * ''total_hops'' += ''num_path_g2''.
     * Se g2 ∈ p1:
      * Se nel percorso p1 l'arco di ingresso in g2 è ''a_in~-,,g2,,-~'':
       * Se nel percorso p1 l'arco di uscita da g2 è ''a_out~-,,g2,,-~'':
        * ''common_hops'' += ''num_path_g2''.
       * Altrimenti:
        * ''common_hops'' += ceil (''num_path_g2'' / 2).
      * Altrimenti:
       * Se nel percorso p1 l'arco di uscita da g2 è ''a_out~-,,g2,,-~'':
        * ''common_hops'' += ceil (''num_path_g2'' / 2).
       * Altrimenti:
        * ''common_hops'' += 0.
    * Se ''total_hops'' > 0 AND ''common_hops'' / ''total_hops'' > ''max_common_hops_ratio'':
     * ''inserire'' = False.
     * Esci dal ciclo ''c2''.
   * Se ''inserire'':
    * ''p1'' viene inserito in ''R~-,,d,,-~''.
 * Il nodo ''n'' sostituisce l'insieme ''O~-,,d,,-~'' con ''R~-,,d,,-~''.

=== Esempio ===
Portiamo a semplice esempio una rete con un solo livello. Sia il nostro nodo A, l'unico vicino B, e la destinazione G. Impostiamo ''max_common_hops_ratio=0.7''. Siano noti i percorsi:
-Line 13:
+Line 141:
-Prima ordino le rotte (come già fatto sopra) in base al costo.
+Prima ordino i percorsi (come già fatto sopra) in base al costo.
-Line 15:
+Line 143:
-La prima rotta è presa per diritto.
+Il primo è preso per diritto.
-Line 17:
+Line 145:
-La seconda rotta, per decidere se è sufficientemente disgiunta, la devo confrontare solo con la prima. Il confronto si fa con il "rapporto di disgiunzione". Esso è il rapporto tra il numero di nodi in comune nelle due rotte e il numero totale di nodi nella rotta più veloce.
+Il secondo, per decidere se è sufficientemente disgiunto, lo devo confrontare solo con il primo. Il "rapporto di hops comuni" in questo caso è 1/2, quindi il secondo percorso viene preso.
-Line 19:
+Line 147:
-In questo caso è 1/2.
+Il terzo percorso va confrontato con tutti i precedenti presi, quindi il primo e il secondo. Il rapporto con il primo è 1/2, con il secondo 1/2.
-Line 21:
+Line 149:
-Se il rapporto è inferiore ad una costante k tra 0 e 1 (oppure se il denominatore è 0) le rotte sono da considerarsi disgiunte. Supponiamo k=0.7.
+Quindi il terzo è preso.
-Line 23:
+Line 151:
-Nel nostro caso la seconda rotta è presa.
+Il quarto percorso nel rapporto con il secondo ha 2/2. Quindi non viene preso.
-Line 25:
+Line 153:
-La terza rotta va confrontata con tutte le precedenti prese, quindi la prima e la seconda. Il rapporto con la prima è 1/2, con la seconda 1/2.

Quindi la terza è presa.

La quarta rotta nel rapporto con la seconda ha 2/2. Quindi non viene presa.

La quinta rotta va ora confrontata con le tre precedenti prese. Anche qui, il rapporto con la seconda è 2/2, quindi non viene presa.

=== Esempio 2 ===
Sia il nostro nodo A e la destinazione H. Siano note le rotte:

 * BCDE   65 (AB=15, BC=15, CD=15, DE=15, EH=5)
 * BCFE   85 (AB=15, BC=15, CF=25, FE=25, EH=5)
 * G     100 (AG=50, GH=50)
 * GFE   120 (AG=50, GF=40, FE=25, EH=5)

Prima ordino le rotte (come già fatto sopra) in base al costo.

La prima rotta è presa per diritto. La seconda ha ratio 3/4 con la prima quindi viene scartata.

La terza va confrontata solo con la prima, ha ratio 0/4 quindi viene presa.

La quarta va confrontata con la prima e con la terza, ha rispettivamente 1/4 e 1/1 quindi per via della terza viene scartata.

=== Esempio 3 - valutazione di un ETP ===
La situazione iniziale è quella dell'esempio precedente, ma la descriviamo meglio.

Il nodo A conosce il costo dell'arco AB e il costo delle path da B verso H. Non sa ad esempio che DE=15 e FE=25.

Quindi, in riferimento alle rotte per H passanti per B, sa:

 * AB=15
 * BCDEH=50   => ABCDEH=65
 * BCFEH=70   => ABCFEH=85

Analogamente C sa che:

 * CD=15
 * DEH=20     => CDEH=35
 * CF=25
 * FEH=30     => CFEH=55

Supponiamo ora che il costo del link CF si riduce a 4. Cioè il link è migliorato.

C aggiorna le sue rotte e scopre un cambiamento. Ora CFEH=34.

C prepara un ETP con le sue rotte aggiornate tra cui CFEH=34 e l'ETP raggiunge B. B scopre che CFEH=34; sapendo che BC=15 ora ha una rotta aggiornata che è BCFEH=49. B prepara un ETP con le sue rotte aggiornate tra cui BCFEH=49 e l'ETP raggiunge A.

Cosa deve fare A quando arriva questo ETP?

A vede la rotta BCFEH=49. A cerca le rotte verso H nella sua mappa e trova che aveva già la rotta BCFEH, che costava 70. Può quindi aggiornarla.

 . '''''Nota''': Oltre alle variazioni nel costo di una rotta, un ETP può trasportare altre informazioni da divulgare, come il cambio del fingerprint del g-nodo o del numero di nodi contenuti.''
 . '''''Nota''': Qui A potrebbe decidere che la variazione è di poca importanza  (ad esempio se il costo della rotta cambia poco in percentuale o se  il numero di nodi nel g-nodo cambia poco in percentuale) e, per mantenere  basso il traffico delle informazioni, non aggiornare questi dati nella  sua mappa. Questa decisione però è vietata se ci sono informazioni  cruciali come il cambio di fingerprint del g-nodo.''

Ora A riordina la mappa: cioè per tutte le destinazioni, fra cui anche H, ordina tutte le rotte che conosce dalla più veloce a scendere, applica l'eliminazione delle rotte non disgiunte come descritto sopra, mantiene un massimo di ''n'' rotte e rimuove le altre. Alla fine deve valutare se la sua mappa rispetto a H è cambiata: se ci sono rotte nuove, o non ci sono rotte che prima c'erano, o alcune rotte hanno cambiato il costo. Le rotte nuove o con costo aggiornato (magari dead) vanno a popolare un nuovo set di rotte R.

Alla fine, se R ≠ ∅, A produce un ETP con R, la lista di hop attraversati dall'ETP ricevuto da B più l'ID di A. Il nuovo ETP viene inviato a tutti i vicini tranne B.
+Il quinto percorso va ora confrontato con i tre precedenti presi. Anche qui, il rapporto con il secondo è 2/2, quindi non viene preso.