Page de référence : Anglais (US English).
Retour au sommaire de SETI@home.
Informations sur SETI et
SETI@home :
Calendrier
des opérations.
État du
serveur.
Rapports techniques :
Aidez-nous.
Utilisez SETI@home.
Statistiques et résultats.
|
Les rapports techniques sur SETI@home.
Juin 2001.
- Jeudi 26 Juin 2001.
- Dans les dernières semaines passées, nous avons connu bien des difficultés pour connecter notre nouveau serveur web à nos bases de données des
utilisateurs et scientifiques. C'est pourquoi les pages statistiques des utilisateurs et équipes étaient hébergées par un serveur secondaire.
- Cet après-midi, nous avons éteint brièvement le serveur de données et avons redémarré les deux serveurs web pour corriger le problème. La
résolution effective du problème n'a été possible finalement qu'en revenant à une version précédente du système d'exploitation Solaris. Et jusqu'à
présent, tout semble bien aller. Nous allons laisser incuber ces changements durant quelques jours avant de conclure cette opération par un succès.
- Vendredi 20 Juin 2001.
- A cause d'une opération de maintenance prévue sur le réseau du campus universitaire de Berkeley, la connexion au site web américain sera
intermittente, à partir de dimanche 24 juin 13:00 UTC (15:00 CEDT, 06:00 PDT), et ce jusqu'à dimanche 24 juin 23:00 UTC (lundi 01:00 CEDT, dimanche 16:00
PDT).
- Mercredi 20 Juin 2001.
- Encore une matinée bien chargée :
- Nous avons mis à jour la version d'Informix sur la base de données des utilisateurs, principalement motivé par le besoin de rétablir le fonctionnement
du serveur web avec tous ses scripts CGI. Nous avons eu bien des difficultés récemment à ce sujet (au cas où vous ne l'auriez pas constaté) à cause d'un
conflit entre les nouvelles version du système d'exploitation Solaris, et les anciennes versions du logiciel client Informix. Finalement cette mise à jour
du serveur de données s'est plutôt bien passée.
- Cependant cela n'a pas totalement éliminé tous les problèmes que nous avions : nous ne pouvons toujours pas faire de requête à la base de
données des utilisateurs depuis le nouveau serveur web, et c'est pourquoi tous les scripts CGI tournent encore sur une machine auxiliaire, "iosef".
- De même, après avoir redémarré le serveur de données, il est rapidement monté à une charge maximale, à un point tel qu'il devait éliminer des
connexions, et échouait lors des tentatives de requêtes dans la base de données des utilisateurs. Certains utilisateurs ont alors pu constater des erreurs
troublantes "unknown user" (utilisateur inconnu). Après recherche, il est apparu que l'ancien fichier de configuration du serveur Informix n'était
pas très bien adapté au nouveau logiciel du moteur Informix. Avec quelques tâtonnements, nous avons pu faire les modifications nécessaires pour qu'Informix
soit content et retrouve son régime de fonctionnement normal.
- A ce point, nous avons redémarré le serveur de données, ainsi que tous les scripts CGI pour la consultation des statistiques des utilisateurs. Nous
laissons cependant la fonctionalité "Voir les résultats récemment terminés" désactivée, car cela nécessite une seconde connexion vers le
serveur de données scientifiques, qui est actuellement indisponible, car nous avions désespérément besoin de construire certains nouveaux
indexes de recherche. La construction de ces indexes accélérera beaucoup certaines requêtes à la base de données.
- A ce propos, la mention "View Recently Completed Units" (Voir les unités récemment terminées) a remplacé la mention "View
Last 10 Completed Units" (Voir les 10 dernières unités terminées) dans la page de statistiques détaillées de l'utilisateur. Pourquoi ce
changement ? Afin de rendre les recherches beaucoup plus rapides. La nouvelle méthode restreint les recherches aux seules dernières semaines, alors que
l'ancienne méthode devait parfois parcourir la totalité des 2 années du projet (notamment pour les utilisateurs récemment inscrits qui n'ont pas encore
accompli au moins 10 unités de travail). Les utilisateurs récemment inscrits devaient endurer de nombreux échecs d'accès à cette page, car les requêtes
prenaient trop de temps à calculer.
- Avec la nouvelle méthode, il est possible que vous ne puissiez pas avoir accès à vos 10 dernières unités de travail s'il vous a fallu plus de
temps pour calculer vos 10 dernières unités de travail que la limite fixée pour cete recherche. N'ayez pas d'inquiétude toutefois, vos unités sont bien
comptabilisées même si elles ne sont plus accessibles sur cette page. Vous pourrez le constater dès que la base de données scientifiques sera de nouveau
disponible. Dans l'immédiat, la fonction "View Recently Completed Units" reste indisponible.
- Aussi voici ce qui nous reste actuellement à faire : (1) parvenir à connecter le serveur web avec le serveur Informix de la base de données des
utilisateurs, et (2) achever la construction des nouveaux indexes de recherche dans la base de données scientifiques.
- Mardi 19 Juin 2001.
- Plein de nouvelles aujourd'hui :
- Les défauts qui causaient des fluctuation de l'alimentation électrique (et à l'origine de la longue panne du 13 au 14 juin) ont été éliminés par
l'électricien du bâtiment. Cela demandait une interruption de 2 heures ce matin à Berkeley (le soir en Europe). Nos serveurs web et de données ont été
indisponibles durant ce temps. Ils sont maintenant tous accessibles.
- Nous avons réactivé hier les "10 dernières unités de travail traitées" dans vos statistiques personnelles, mais à cause d'un aléas du
système pare-feu protégeant notre réseau, personne ne pouvait plus accéder aux statistiques régulières ou étendues. Cela a été aussi réglé ce
matin.
- Le serveur de données est encore pénalisé par des périodes d'intense activité, à cause du volume de travail à rattraper, suite à la longue
restauration du serveur le mois dernier. L'effet de cette surcharge de travail est que le serveur de données cesse de répondre de temps en temps durant de
courtes périodes (généralement de 15 à 20 minutes). Cela s'est produit régulièrement durant toute la semaine passée durant laquelle nous avons
diagnostiqué la cause de ce problème pour pouvoir la traiter.
- Les pages HTML statiques de statistiques et les graphes n'ont pas été mis à jour durant ces 10 derniers jours. Cela est dû aux fréquentes
interruptions du réseau et de la base de données que nous avons dû subir, et aux bogues temporaires introduits alors que nous altérions les
fonctionnalités de plusieurs de nos machines au laboratoire. Nous sommes également très occupé en ce moment à traiter ces derniers problèmes.
- Samedi 16 Juin 2001.
- Interruptions de services prévues la semaine prochaine :
- Lundi 18 juin 2001 à partir de 17:00 UTC (19:00 CEDT, 10:00 PDT). Cette interruption durera près de 2 heures pour mettre à niveau le logiciel Informix
de la base de données des utilisateurs.
- Mardi 19 juin 2001 à partir de 15:00 UTC (17:00 CEDT, 08:00 PDT). Cette interruption durera près de 3 heures pour effectuer des réparations
électriques au Laboratoire des Sciences Spaciales, suite à la panne sérieuse survenue le 13 juin dernier en soirée.
- Jeudi 14 Juin 2001.
- Nous avons eu la nuit dernière une coupure de courant, ce qui a interrompu les connexions au serveur durant de longues heures. L'électricien du
bâtiment a trouvé un défaut dans un panneau de distribution électrique. Il a appliqué une réparation temporaire, mais il va devoir remplacer rapidement
ce panneau électrique, probablement aujourd'hui. Cela devrait causer une autre interruption du service durant 2 heures. Nous posterons l'heure de cette
intervention dès que nous la connaîtrons.
- De ce fait, l'interruption de service prévue aujourd'hui pour mettre à jour le logiciel Informix a été reportée à la semaine prochaine, afin
de laisser le champ libre aujourd'hui pour l'intervention de l'électricien. Nous posterons également ici l'heure de cette intervention logicielle sur le
serveur.
- Mercredi 13 Juin 2001.
- Nous prévoyons une interruption de 2 heures jeudi 14 juin à partir de 09:00 PST (18:00 CEDT, 16:00 UTC). Nous allons mettre à jour le logiciel Informix
sur le nouveau serveur web setiathome.ssl.berkeley.edu pour rétablir le fonctionnement des scripts CGI, ce qui réglera le problème actuel de
performance du serveur temporaire iosef.ssl.berkeley.edu.
- Aujourd'hui nous avons remplacé deux des trois contrôleurs RAID de la base de données scientifiques (la troisième carte a déjà été remplacée la
semaine passée). Nous espérons que cela réduira, sinon éliminera, les problèmes que nous avons eu sur le système RAID de la base de données
scientifiques.
- Lundi 11 Juin 2001.
- Les cartes contrôleurs RAID continuent à nous poser des problèmes. Heureusement, la nouvelle architecture de disques (en faisant le miroir de façon
logicielle au travers de contrôleurs RAID différents) a permis d'éviter les pannes. Malheureusement, il y a encore eu une corruption d'un index contrôlant
l'ordre dans lequel les unités de travail sont envoyées au client. Nous avons reconstruit cet index vendredi 8 dernier. Nous allons devoir considérer
maintenant l'option pour désactiver aussi les écritures différées en cache pour prévenir des erreurs telles que celles-ci. Mais nous espérons que cela
n'aura pas trop d'impact sur les performances du serveur.
- Nous avons également (enfin) découvert le bogue qui occasionnait parfois l'afflux de messages "Duplicate results" (résultats
dupliqués) vers les clients SETI@home.
- Mardi 5 Juin 2001.
- Ce matin nous avons remplacé l'ancienne machine du serveur web par une bien meilleure. Tout allait bien jusqu'à ce que nous réalisions que la nouvelle
machine ne pouvait pas communiquer directement avec les bases de données scientifiques et des utilisateurs. Nous travaillons encore sur ce problème, et la
solution pourrait requérir l'installation d'une nouvelle version du logiciel Informix serveur de bases de données, afin de résoudre des conflits avec la
nouvelle version de Solaris utilisée sur ce nouveau serveur. Durant l'intérim, nous avons du installer un second serveur web pour traiter la plupart des
appels CGI et nous implantons de nouveaux liens vers ce serveur auxiliaire. C'est une solution très temporaire. Les statistiques utilisateurs/équipes ne
pourraient en effet pas être mises à jour aussi régulièrement durant cette période transitoire.
- Lundi 4 Juin 2001.
- Durant le week-end, le serveur web Américain de SETI@home a cessé de fonctionner. A cet instant il est difficile de savoir pourquoi - très probablement
la table des processus Unix a du être saturée. La bonne nouvelle c'est que nous avons reçu un tout nouveau bi-processeur Sun Ultra pour remplacer le
serveur web actuel. Le basculement devrait intervenir durant cette semaine. Veuillez noter que durant la phase de transition les statistiques des utilisateurs
et équipes pourraient ne pus être mises à jour durant près d'une journée (ce devrait être purement cosmétique et ne pas affecter du tout les résultats
réellement enregistrées dans la base de données). Dans le même temps, nous pourrions être amenés à désactiver temporairement les consultations de
statistiques. Il y aura des notes d'informations sur la page d'accueil pour vous tenir informé.
- Vendredi 1er Juin 2001.
- Quelle semaine ! Nous avons pu achever la restauration de la base de données scientifique la semaine passée. Cependant en faisant ainsi, nous avons
également restauré un index corrompu que nous venions de réparer. Il nous a fallu donc le réparer à nouveau. Nous devions ensuite exécuter quelques
tâches de mise à jour dans la base de données, car elle était dès lors inconsistantes avec à la fois nos unités de travail sur disques, et les files
d'attentes de résultats. Nous effectuons donc en ce moment une vérification finale pour nous assurer que tout est consistant. Le serveur fonctionne
normalement, mais les modules tranchoirs (qui génèrent de nouvelles unités de travail) sont temporairement désactivés. Cela signifie que la file
d'attente des unités de travail est statique et cela donne une petite chance pour qu'un utilisateur assez rapide obtienne une unité de travail en
doublon (avec pour effet possible une erreur "Duplicate result from user").
- Dans le même temps, un disque de notre base de données scientifique hors ligne a planté. Nous avons pu remplacer le matériel et restaurer rapidement
la base de données. Nous utilisons maintenant cette base de données pour rejeter les Interférences en Radio-Fréquences (I.R.F.) et rechercher les signaux persistants. Les participants SETI@home ont produit un jeu de données
particulièrement riche d'enseignements. Des nouvelles bientôt !
- Nous avons également connu un problème de sécurité : une personne malintentionnée (ou plusieurs) a pu
obtenir un grand nombre d'adresses courriel de nos utilisateurs. Il n'y a pas eu d'intrusion réelle sur nos serveurs. Ceux qui ont perpétré ces attaques
ont tiré profit d'une faille dans le protocole de communication client/serveur utilisé normalement par les clients SETI@home. Ils ont pu ainsi collecter
près de 50 000 adresses et les ont postées sur un site web. Nous considérons ceci comme un vol significatif de nos (et vos) données, et allons mener
une action judiciaire à l'encontre de cette (ou ces) personnes. Si vous pensez avoir reçu un courriel d'un des coupables de ces actes malveillants,
consultez le bulletin de sécurité paru et
traduit en Français ici. Nous avons sollicité et rapidement obtenu la fermeture des sites webs identifiés diffusant les informations piratées.
Nous avons très rapidement colmaté la faille de sécurité utilisée en modifiant le logiciel de notre serveur. Cependant cela a eu aussi pour effet de
mettre à blanc ou à zéro certains champs du fichier "user_info.sah" transmis auparavant aux clients. Nous réalisons que cela a eu un
impact sur le fonctionnement de certains bons outils complémentaires écrits par des tiers, et étudions avec leurs concepteurs le moyen de renseigner
certains champs à nouveau, et discutons avec eux des moyens pour mettre à jour ces logiciels tiers afin de rétablir leurs pleines fonctionnalités.
|