En fait, nous ne comptons pas les utilisateurs, mais nous comptons les demandes que les clients adressent périodiquement aux annuaires pour mettre à jour leur liste de relais et nous estimons le nombre d'utilisateurs indirectement à partir de là.
Non, mais nous pouvons voir quelle fraction des annuaires les a signalés, puis nous pouvons extrapoler le nombre total dans le réseau.
Nous partons de l'hypothèse qu'un client moyen effectue 10 demandes de ce type par jour.
Un client tor connecté 24 heures sur 24 et 7 jours sur 7 effectue environ 15 requêtes par jour, mais tous les clients ne sont pas connectés 24 heures sur 24 et 7 jours sur 7, c'est pourquoi nous avons choisi le chiffre 10 pour le client moyen.
Nous divisons simplement les demandes d'annuaire par 10 et considérons le résultat comme le nombre d'utilisateurs.
Une autre façon de voir les choses est de supposer que chaque demande représente un client qui reste en ligne pendant un dixième de la journée, soit 2 heures et 24 minutes.
Le nombre moyen d'utilisateurs simultanés est estimé à partir des données recueillies au cours d'une journée. Nous ne pouvons pas dire combien il y a d'utilisateurs distincts.
Non, les relais qui communiquent ces statistiques regroupent les demandes par pays d'origine et sur une période de 24 heures.
Les statistiques que nous devrions recueillir sur le nombre d'utilisateurs par heure seraient trop détaillées et pourraient mettre les utilisateurs en danger.
Nous comptons alors ces utilisateurs comme un seul. En réalité, nous comptons les clients, mais il est plus intuitif pour la plupart des gens de penser aux utilisateurs, c'est pourquoi nous disons utilisateurs et non clients.
Non, car cet utilisateur met à jour sa liste de relais aussi souvent qu'un utilisateur qui ne change pas d'adresse IP au cours de la journée.
Les annuaires convertissent les adresses IP en codes de pays et rapportent ces chiffres sous forme agrégée. C'est l'une des raisons pour lesquelles tor est livré avec une base de données GeoIP.
Très peu de ponts communiquent des données sur les transports ou les versions IP et, par défaut, nous considérons les demandes d'utilisation du protocole OR par défaut et de l'IPv4.
Lorsque davantage de ponts communiqueront ces données, les chiffres deviendront plus précis.
Les relais et les ponts transmettent certaines données par intervalles de 24 heures qui peuvent se terminer à n'importe quel moment de la journée.
Une fois cet intervalle écoulé, les relais et les ponts peuvent prendre 18 heures de plus pour transmettre les données.
Nous avons supprimé les deux derniers jours des graphiques, car nous voulons éviter que le dernier point de données d'un graphique indique un changement de tendance récent qui n'est en fait qu'un phénomène de l'algorithme.
En effet, nous publions les nombres d'utilisateurs une fois que nous sommes suffisamment sûrs qu'ils ne changeront plus de manière significative.
Mais il est toujours possible qu'un annuaire rapporte des données quelques heures après que nous ayons été suffisamment confiants, mais qui ont alors modifié légèrement le graphique.
Nous disposons d'archives de descripteurs datant d'avant cette période, mais ces descripteurs ne contenaient pas toutes les données que nous utilisons pour estimer le nombre d'utilisateurs.
Pour plus de détails, veuillez consulter l'archive suivante :
Tarball
Pour les utilisateurs directs, nous incluons tous les répertoires, ce qui n'était pas le cas dans l'ancienne approche.
Nous utilisons également des historiques qui ne contiennent que les octets écrits pour répondre aux demandes de répertoire, ce qui est plus précis que l'utilisation d'historiques d'octets généraux.
Oh, c'est une toute autre histoire. Nous avons rédigé en 13 pages un rapport technique expliquant les raisons de l'abandon de l'ancienne approche.
tl;dr : dans l'ancienne approche, nous mesurions la mauvaise chose, et maintenant nous mesurons la bonne chose.
Nous utilisons un système de détection de la censure basé sur les anomalies qui examine le nombre d'utilisateurs estimé sur une série de jours et prédit le nombre d'utilisateurs pour les jours suivants.
Si le nombre réel est supérieur ou inférieur, cela peut indiquer un événement de censure possible ou une levée de la censure.
Pour plus de détails, voir notre rapport technique.