| Page de référence : Anglais (US English).  Retour au sommaire de SETI@home.
 
  Informations sur SETI et
 SETI@home :
   Calendrier
 des opérations.   État du
 serveur.   Rapports techniques :  Aidez-nous.
  Utilisez SETI@home.
  Statistiques et résultats.
 | Les rapports techniques sur SETI@home.Juin 2001.
  Jeudi 26 Juin 2001.Dans les dernières semaines passées, nous avons connu bien des difficultés pour connecter notre nouveau serveur web à nos bases de données des
  utilisateurs et scientifiques. C'est pourquoi les pages statistiques des utilisateurs et équipes étaient hébergées par un serveur secondaire.Cet après-midi, nous avons éteint brièvement le serveur de données et avons redémarré les deux serveurs web pour corriger le problème. La
  résolution effective du problème n'a été possible finalement qu'en revenant à une version précédente du système d'exploitation Solaris. Et jusqu'à
  présent, tout semble bien aller. Nous allons laisser incuber ces changements durant quelques jours avant de conclure cette opération par un succès.Vendredi 20 Juin 2001.A cause d'une opération de maintenance prévue sur le réseau du campus universitaire de Berkeley, la connexion au site web américain sera
  intermittente, à partir de dimanche 24 juin 13:00 UTC (15:00 CEDT, 06:00 PDT), et ce jusqu'à dimanche 24 juin 23:00 UTC (lundi 01:00 CEDT, dimanche 16:00
  PDT).Mercredi 20 Juin 2001.Encore une matinée bien chargée :Nous avons mis à jour la version d'Informix sur la base de données des utilisateurs, principalement motivé par le besoin de rétablir le fonctionnement
  du serveur web avec tous ses scripts CGI. Nous avons eu bien des difficultés récemment à ce sujet (au cas où vous ne l'auriez pas constaté) à cause d'un
  conflit entre les nouvelles version du système d'exploitation Solaris, et les anciennes versions du logiciel client Informix. Finalement cette mise à jour
  du serveur de données s'est plutôt bien passée.Cependant cela n'a pas totalement éliminé tous les problèmes que nous avions : nous ne pouvons toujours pas faire de requête à la base de
  données des utilisateurs depuis le nouveau serveur web, et c'est pourquoi tous les scripts CGI tournent encore sur une machine auxiliaire, "iosef".De même, après avoir redémarré le serveur de données, il est rapidement monté à une charge maximale, à un point tel qu'il devait éliminer des
  connexions, et échouait lors des tentatives de requêtes dans la base de données des utilisateurs. Certains utilisateurs ont alors pu constater des erreurs
  troublantes "unknown user" (utilisateur inconnu). Après recherche, il est apparu que l'ancien fichier de configuration du serveur Informix n'était
  pas très bien adapté au nouveau logiciel du moteur Informix. Avec quelques tâtonnements, nous avons pu faire les modifications nécessaires pour qu'Informix
  soit content et retrouve son régime de fonctionnement normal.A ce point, nous avons redémarré le serveur de données, ainsi que tous les scripts CGI pour la consultation des statistiques des utilisateurs. Nous
  laissons cependant la fonctionalité "Voir les résultats récemment terminés" désactivée, car cela nécessite une seconde connexion vers le
  serveur de données scientifiques, qui est actuellement indisponible, car nous avions désespérément besoin de construire certains nouveaux
  indexes de recherche. La construction de ces indexes accélérera beaucoup certaines requêtes à la base de données.A ce propos, la mention "View Recently Completed Units" (Voir les unités récemment terminées) a remplacé la mention "View
  Last 10 Completed Units" (Voir les 10 dernières unités terminées) dans la page de statistiques détaillées de l'utilisateur. Pourquoi ce
  changement ? Afin de rendre les recherches beaucoup plus rapides. La nouvelle méthode restreint les recherches aux seules dernières semaines, alors que
  l'ancienne méthode devait parfois parcourir la totalité des 2 années du projet (notamment pour les utilisateurs récemment inscrits qui n'ont pas encore
  accompli au moins 10 unités de travail). Les utilisateurs récemment inscrits devaient endurer de nombreux échecs d'accès à cette page, car les requêtes
  prenaient trop de temps à calculer.Avec la  nouvelle méthode, il est possible que vous ne puissiez pas avoir accès à vos 10 dernières unités de travail s'il vous a fallu plus de
  temps pour calculer vos 10 dernières unités de travail que la limite fixée pour cete recherche. N'ayez pas d'inquiétude toutefois, vos unités sont bien
  comptabilisées même si elles ne sont plus accessibles sur cette page. Vous pourrez le constater dès que la base de données scientifiques sera de nouveau
  disponible. Dans l'immédiat, la fonction "View Recently Completed Units" reste indisponible.Aussi voici ce qui nous reste actuellement à faire : (1) parvenir à connecter le serveur web avec le serveur Informix de la base de données des
  utilisateurs, et (2) achever la construction des nouveaux indexes de recherche dans la base de données scientifiques.Mardi 19 Juin 2001.Plein de nouvelles aujourd'hui :Les défauts qui causaient des fluctuation de l'alimentation électrique (et à l'origine de la longue panne du 13 au 14 juin) ont été éliminés par
  l'électricien du bâtiment. Cela demandait une interruption de 2 heures ce matin à Berkeley (le soir en Europe). Nos serveurs web et de données ont été
  indisponibles durant ce temps. Ils sont maintenant tous accessibles.Nous avons réactivé hier les "10 dernières unités de travail traitées" dans vos statistiques personnelles, mais à cause d'un aléas du
  système pare-feu protégeant notre réseau, personne ne pouvait plus accéder aux statistiques régulières ou étendues. Cela a été aussi réglé ce
  matin.Le serveur de données est encore pénalisé par des périodes d'intense activité, à cause du volume de travail à rattraper, suite à la longue
  restauration du serveur le mois dernier. L'effet de cette surcharge de travail est que le serveur de données cesse de répondre de temps en temps durant de
  courtes périodes (généralement de 15 à 20 minutes). Cela s'est produit régulièrement durant toute la semaine passée durant laquelle nous avons
  diagnostiqué la cause de ce problème pour pouvoir la traiter.Les pages HTML statiques de statistiques et les graphes n'ont pas été mis à jour durant ces 10 derniers jours. Cela est dû aux fréquentes
  interruptions du réseau et de la base de données que nous avons dû subir, et aux bogues temporaires introduits alors que nous altérions les
  fonctionnalités de plusieurs de nos machines au laboratoire. Nous sommes également très occupé en ce moment à traiter ces derniers problèmes.Samedi 16 Juin 2001.Interruptions de services prévues la semaine prochaine :
  
   Lundi 18 juin 2001 à partir de 17:00 UTC (19:00 CEDT, 10:00 PDT). Cette interruption durera près de 2 heures pour mettre à niveau le logiciel Informix
   de la base de données des utilisateurs.Mardi 19 juin 2001 à partir de 15:00 UTC (17:00 CEDT, 08:00 PDT). Cette interruption durera près de 3 heures pour effectuer des réparations
   électriques au Laboratoire des Sciences Spaciales, suite à la panne sérieuse survenue le 13 juin dernier en soirée.Jeudi 14 Juin 2001.Nous avons eu la nuit dernière une coupure de courant, ce qui a interrompu les connexions au serveur durant de longues heures. L'électricien du
  bâtiment a trouvé un défaut dans un panneau de distribution électrique. Il a appliqué une réparation temporaire, mais il va devoir remplacer rapidement
  ce panneau électrique, probablement aujourd'hui. Cela devrait causer une autre interruption du service durant 2 heures. Nous posterons l'heure de cette
  intervention dès que nous la connaîtrons.De ce fait, l'interruption de service prévue aujourd'hui pour mettre à jour le logiciel Informix a été reportée à la semaine prochaine, afin
  de laisser le champ libre aujourd'hui pour l'intervention de l'électricien. Nous posterons également ici l'heure de cette intervention logicielle sur le
  serveur.Mercredi 13 Juin 2001.Nous prévoyons une interruption de 2 heures jeudi 14 juin à partir de 09:00 PST (18:00 CEDT, 16:00 UTC). Nous allons mettre à jour le logiciel Informix
  sur le nouveau serveur web setiathome.ssl.berkeley.edu pour rétablir le fonctionnement des scripts CGI, ce qui réglera le problème actuel de
  performance du serveur temporaire iosef.ssl.berkeley.edu.Aujourd'hui nous avons remplacé deux des trois contrôleurs RAID de la base de données scientifiques (la troisième carte a déjà été remplacée la
  semaine passée). Nous espérons que cela réduira, sinon éliminera, les problèmes que nous avons eu sur le système RAID de la base de données
  scientifiques.Lundi 11 Juin 2001.Les cartes contrôleurs RAID continuent à nous poser des problèmes. Heureusement, la nouvelle architecture de disques (en faisant le miroir de façon
  logicielle au travers de contrôleurs RAID différents) a permis d'éviter les pannes. Malheureusement, il y a encore eu une corruption d'un index contrôlant
  l'ordre dans lequel les unités de travail sont envoyées au client. Nous avons reconstruit cet index vendredi 8 dernier. Nous allons devoir considérer
  maintenant l'option pour désactiver aussi les écritures différées en cache pour prévenir des erreurs telles que celles-ci. Mais nous espérons que cela
  n'aura pas trop d'impact sur les performances du serveur.Nous avons également (enfin) découvert le bogue qui occasionnait parfois l'afflux de messages "Duplicate results" (résultats
  dupliqués) vers les clients SETI@home.Mardi 5 Juin 2001.Ce matin nous avons remplacé l'ancienne machine du serveur web par une bien meilleure. Tout allait bien jusqu'à ce que nous réalisions que la nouvelle
  machine ne pouvait pas communiquer directement avec les bases de données scientifiques et des utilisateurs. Nous travaillons encore sur ce problème, et la
  solution pourrait requérir l'installation d'une nouvelle version du logiciel Informix serveur de bases de données, afin de résoudre des conflits avec la
  nouvelle version de Solaris utilisée sur ce nouveau serveur. Durant l'intérim, nous avons du installer un second serveur web pour traiter la plupart des
  appels CGI et nous implantons de nouveaux liens vers ce serveur auxiliaire. C'est une solution très temporaire. Les statistiques utilisateurs/équipes ne
  pourraient en effet pas être mises à jour aussi régulièrement durant cette période transitoire.Lundi 4 Juin 2001.Durant le week-end, le serveur web Américain de SETI@home a cessé de fonctionner. A cet instant il est difficile de savoir pourquoi - très probablement
  la table des processus Unix a du être saturée. La bonne nouvelle c'est que nous avons reçu un tout nouveau bi-processeur Sun Ultra pour remplacer le
  serveur web actuel. Le basculement devrait intervenir durant cette semaine. Veuillez noter que durant la phase de transition les statistiques des utilisateurs
  et équipes pourraient ne pus être mises à jour durant près d'une journée (ce devrait être purement cosmétique et ne pas affecter du tout les résultats
  réellement enregistrées dans la base de données). Dans le même temps, nous pourrions être amenés à désactiver temporairement les consultations de
  statistiques. Il y aura des notes d'informations sur la page d'accueil pour vous tenir informé.Vendredi 1er Juin 2001.Quelle semaine ! Nous avons pu achever la restauration de la base de données scientifique la semaine passée. Cependant en faisant ainsi, nous avons
  également restauré un index corrompu que nous venions de réparer. Il nous a fallu donc le réparer à nouveau. Nous devions ensuite exécuter quelques
  tâches de mise à jour dans la base de données, car elle était dès lors inconsistantes avec à la fois nos unités de travail sur disques, et les files
  d'attentes de résultats. Nous effectuons donc en ce moment une vérification finale pour nous assurer que tout est consistant. Le serveur fonctionne
  normalement, mais les modules tranchoirs (qui génèrent de nouvelles unités de travail) sont temporairement désactivés. Cela signifie que la file
  d'attente des unités de travail est statique et cela donne une petite chance pour qu'un utilisateur assez rapide obtienne une unité de travail en
  doublon (avec pour effet possible une erreur "Duplicate result from user").Dans le même temps, un disque de notre base de données scientifique hors ligne a planté. Nous avons pu remplacer le matériel et restaurer rapidement
  la base de données. Nous utilisons maintenant cette base de données pour rejeter les Interférences en Radio-Fréquences (I.R.F.) et rechercher les signaux persistants. Les participants SETI@home ont produit un jeu de données
  particulièrement riche d'enseignements. Des nouvelles bientôt !Nous avons également connu un problème de sécurité : une personne malintentionnée (ou plusieurs) a pu
  obtenir un grand nombre d'adresses courriel de nos utilisateurs. Il n'y a pas eu d'intrusion réelle sur nos serveurs. Ceux qui ont perpétré ces attaques
  ont tiré profit d'une faille dans le protocole de communication client/serveur utilisé normalement par les clients SETI@home. Ils ont pu ainsi collecter
  près de 50 000 adresses et les ont postées sur un site web. Nous considérons ceci comme un vol significatif de nos (et vos) données, et allons mener
  une action judiciaire à l'encontre de cette (ou ces) personnes. Si vous pensez avoir reçu un courriel d'un des coupables de ces actes malveillants,
  consultez le  bulletin de sécurité paru et
  traduit en Français ici.  Nous avons sollicité et rapidement obtenu la fermeture des sites webs identifiés diffusant les informations piratées.
  Nous avons très rapidement colmaté la faille de sécurité utilisée en modifiant le logiciel de notre serveur. Cependant cela a eu aussi pour effet de
  mettre à blanc ou à zéro certains champs du fichier "user_info.sah" transmis auparavant aux clients. Nous réalisons que cela a eu un
  impact sur le fonctionnement de certains bons outils complémentaires écrits par des tiers, et étudions avec leurs concepteurs le moyen de renseigner
  certains champs à nouveau, et discutons avec eux des moyens pour mettre à jour ces logiciels tiers afin de rétablir leurs pleines fonctionnalités. |