L'article suivant écrit en septembre 1996 a été
publié en 1997 dans le livre :
"Les
origines astronomiques et biochimiques et la recherche de la vie dans
l'univers,"
Proc. de la 5ème Conférence Internationale de Bio-astronomie = Colloque
de l'I.A.U.
n° 161, par S. Bowyer et D. Werthimer, aux éditions C.B. Cosmovici
(éditeur : Editrice Compositori, Bologne, Italie.)
Retour au sommaire.
Un nouveau projet SETI majeur basé sur les données du projet SERENDIP
et 100 000 ordinateurs personnels.
W. T. Sullivan III (U. Washington), D. Werthimer, S. Bowyer, J. Cobb
(U.Californie, Berkeley), D. Gedye, D. Anderson (Big Science, Inc.)
RÉSUMÉ.
Nous développons ici un projet SETI innovant, pour l'instant nommé
SETI@home, impliquant le calcul massivement parallèle sur des ordinateurs
de bureau autour du monde. Le public sera impliqué de façon unique dans
un véritable projet scientifique. Les individus téléchargeront un
programme d'écran de veille qui non seulement produira les graphiques
attractifs usuels quand leur ordinateur est inactif, mais conduira
également sur l'ordinateur hôte l'analyse sophistiquée des données
SETI.
Les données sont prises du récepteur du Projet SERENDIP IV et de
l'étude SETI menée au radio-télescope de 305 mètres de diamètre
d'Arecibo. Nous réalisons un enregistrement continu d'un signal de
2 MHz en largeur de bande centrée sur la ligne de 21 cm de
longueur d'onde de l'ion Hydrogène. Les données de ces bandes sont alors
préalablement circonscrites et morcelées par un serveur qui fournit de
petits tronçons de données (50 secondes d'une bande passante de
20 kHz, un total de 0,25 Mo) su Internet aux clients qui
possèdent le logiciel d'écran de veille.
Une fois que l'ordinateur a achevé l'analyse complète du bloc de
données (d'une façon bien plus détaillée que ce que fait SERENDIP
normalement) un rapport sur les meilleurs signaux candidats est renvoyé
au serveur, d'où un nouveau tronçon de données est envoyé. Si
50 000 à 100 000 clients sont réunis, la puissance de calcul
sera équivalente à une fraction substantielle d'un super-ordinateur
typique, et SETI@home couvrira un volume comparable d'espace de
paramètres que celui de SERENDIP IV.
Introduction.
La science, bien que pratiquement entièrement supportée par des fonds
publics, a traditionnellement été menée dans des laboratoires et
observatoires non ouverts au public général. Dans une ère où le
support du public à la science se développe, ce modus operandi pourrait
se perdre lui-même et il demande un réexamen. Le but du présent projet
SETI, qu'on nommera pour l'instant SETI@home, est (a) de faire de la bonne
science, et (b) de le faire d'une façon qui engage et attire le public
général. C'est une chance pour éduquer les participants sur comment
travaille la science, aussi bien que pour leur donner un information
fiable sur le SETI (au contraire, par exemple, du film "Independence
Day"). En fin de compte la communauté scientifique ne peut tirer un
profit que si le public comprends mieux l'entreprise scientifique.
Une fois opérationnel, SETI@home :
- sera la première fois que des utilisateurs d'ordinateurs ordinaires
pourront participer à une expérience scientifique majeure.
- sera la plus grande application informatique distribuée jamais
tentée.
- offrira à chaque participant la faible mais captivante possibilité
que son ordinateur soit l'instrument de la détection d'une autre
civilisation technologique dans la Voie Lactée.
Architecture du projet et flux des données.
SETI@home est une étude menée en "ferroutage"
et basée sur l'étude SERENDIP IV, qui est elle-même une étude greffée
opérant sur le télescope de 305 m d'Arecibo. SERENDIP IV, qui
débutera ses opérations en 1997 sur la "galette" récemment
améliorée d'Arecibo, est décrit (en même temps que ses
prédécesseurs) par [ Bowyer et al. ] (1997) ailleurs dans ce volume.
L'idée de base est qu'un récepteur et un processeur de données SERENDIP
séparé "se balade" sur la plate-forme de collecte d'Arecibo
alors que la radio-astronomie classique continue à être menée
normalement. Le ciel visible à Arecibo est donc étudié d'une façon
pseudo aléatoire, et en fait chaque secteur du ciel est typiquement
revisité tous les 3 à 6 mois. Ces revisites sont critiques pour
discriminer les interférences en radio-fréquence (I.R.F.) d'origine
humaine.
L'architecture globale de SETI@home est présentée en figure 1. A
Arecibo, SETI@home enregistrera sur bande magnétique dans la bande de
base une petite portion des 183 MHz de largeur totale de bande du
SERENDIP ; 2 MHz couvriront les trois cadres de repos possibles
de radiations héliocentriques, galactocentriques et de bruit de fond
cosmique. Cette bande sera d'abord réduite et convertie à partir d'une
fréquence d'observation centrée sur la frange à 21 cm de
l'hydrogène à 1420 MHz, idéale en terme de stratégie SETI, et
libre des interférences d'origine humaine (I.R.F.). Avec un
échantillonnage sur un bit à la cadence de Nyquist, cela donne une
vitesse d'enregistrement de 0,5 Mo/s, soit un D.A.T. Exabyte Monmouth
(capacité 25 Go) toutes les 11 heures, ou encore 500 bandes par ans
(pour une efficacité d'observation escomptée de 70 %).
Ces bandes sont envoyées par Fed-Ex au serveur Big-Science où elles
sont validées, archivées, et augmentées de paramètres d'indexation, en
particulier les positions dans le ciel et dans le temps. Seule une portion
des données sera analysée, en première instance pour ce qui sera
nécessaire afin de maintenir l'alimentation des clients (voir
ci-dessous). Cette portion des données sera choisie pour être à la plus
petite latitude galactique possible, c. à d., dans la direction du plan
galactique comme voulu dans la "stratégie Voie Lactée" mise en
avant par [ Sullivan et Mighell ] (1984).
Figure 1. Un diagramme schématique de
l'architecture et du flot de données de SETI@home.
Notez que "N" se réfère au nombre d'ordinateurs participant
actuellement à l'analyse.
Même si aucun signal n'apparaît au premier passage à une position
donnée du ciel, Les positions du ciel qui sont (par chance) répétées
seront analysées en priorité parce qu'elles permettent de combattre les
I.R.F. et de traiter la possibilité de scintillements interstellaires.
Les signaux candidats reçoivent de forts Q.I.'s (Quotients d'Intérêt)
suivant le nombre de fois où ils se répètent, et de la façon dont ils
se distinguent des possibles I.R.F. par leur ajustement au motif du
faisceau et par leur propriété de dérive Doppler non locale.
Chaque client travaillera à tout moment sur 0,25 Mo de données, ce
qui représente 50 secondes du signal à 20 kHz. Ces largeurs de
bande de 20 kHz seront créées depuis les données originales à
2 MHz par le serveur qui calculera des F.F.T.'s conduites par tables.
Ces 50 secondes de données de dérive correspondent à un secteur de ciel
de 6x25 minutes d'arc (4 faisceaux indépendants, essentiels pour la
discrimination des I.R.F.). Cela signifie que chaque personne reçoit une
table de 50 secondes par 20 000 Hz pour son ensemble de données
de base ; l'espace requis pour le stockage du code et des données
pour analyser ce tronçon est estimé à 3 ou 4 Mo.
Du côté réception, un tronçon de 0,25 Mo demandera 1,3 s
sur une liaison d'abonné T1 à 190 Ko/s, ou 2,3 minutes sur une
ligne à 14,4 kbaud (suffisamment court en ligne pour ne pas
décourager les clients). Une fois terminée (typiquement après quelques
jours) l'analyse des données de chaque tronçon, un court message
rapportant les signaux candidats est présenté au client et retourné
également à Big Science et à l'Université de Washington pour analyse
ultérieure (voir ci-dessous).
Du côté du serveur, une ligne T1 peut transmettre 90 Go par
semaine et donc 360 clients pourrait être servis chaque semaine (ou
180 000 deux fois par semaine) avec une seule liaison sortante. Ces
90 Go représentent 30 % d'une semaine complète
d'enregistrement à Arecibo, ou 43 % d'une semaine plus réaliste
(avec une efficacité de 70 %).
L'analyse des signaux chez soi (@home).
Le caractère unique et l'avantage de SETI@home d'un point de vue SETI
est la profondeur de l'analyse de signal qui sera possible par chaque
tronçon de bande passante et de temps (position dans le ciel.)
(N.B. : Les clients n'auront aucun contrôle sur la nature de la
recherche les cycles processeur de l'ordinateur domestique sont
simplement empruntés par un programme automatique.)
On propose de rechercher des signaux de largeur allant de 0,1 Hz
(une F.F.T. à 2 x 105 points) à 2 000 Hz. (SERENDIP
recherche actuellement des lignes de largeur 0,6 à 640 Hz ; la
redondance partielle entre les deux recherches fournira une
inter-vérification utile.) Tous les signaux seront cherchés pour chacune
des 40 vitesses distinctes de dérive Doppler (durant les 12 secondes de
traversée d'un faisceau) ; tout ce qui a une dérive nulle en accord
avec le cadre de référence de Puerto Rico sera automatiquement rejeté
en tant que I.R.F., mais toutes les dérives non nulles seront retenues,
particulièrement celles correspondant à l'accélération rotationelle et
orbitale de la Terre (de l'ordre de 0,5 à 1,5 Hz sur 12
secondes ; la valeur réelle au moment de l'observation sera
calculée par le serveur et inscrite dans le tronçon de données.)
Les données permettent également la recherche des signaux intermittents
ou pulsatifs avec des durées de 0,5 ms à 10 s - c'est un des
avantages principaux de SETI@home sur SERENDIP, qui ne peut détecter des
impulsions espacées de plus de 1,7 s. Tout signal qui dure moins
qu'une largeur de faisceau pourrait être une I.R.F. parasite, mais il
sera conservé (au moins avec un poids plus faible). Les candidats les
plus viables doivent néanmoins s'accorder à la forme du faisceau, c'est
le meilleur critère pour distinguer une source ponctuelle réelle d'une
I.R.F. Aussi un filtre de corrélation Gaussien au faisceau (avec une
largeur de 12 secondes) sera aussi appliqué à tous les signaux
candidats. En résumé, les signaux candidats seront rapportés au serveur
sur la base de leur rapport signal/bruit affiché pour les meilleurs
largeur de bande, longueur de temps, canal de fréquence et accord à la
forme du faisceau.
Le post-traitement.
Le post-traitement à l'Université de Washington construira une base de
données de tous les signaux candidats rapportés par les ordinateurs
clients. Cette base de données sera utilisée pour consulter la
progression de l'étude, la qualité des données, et l'environnement
I.R.F. d'Arecibo, et décider si des changements sont souhaitables dans
l'étude ou les procédures opérationnelles.
Avec le nombre extrêmement élevé de cas que nous examinerons, nous
nous attendons à ce que des I.R.F. se comportent, par chance, d'une telle
manière qu'ils imitent un signal extraterrestre. Aussi il est très
important que tous les candidats de rapport signal/bruit élevé observés
une fois ne soient considéré comme de sérieux candidats qu'après une
confirmation positive par d'autres passages (aléatoires) du faisceau
(normalement 3 à 6 mois plus tard) sur le même secteur de ciel. Le
traitement final surveillera ces passages suivants et comparera la
consistance des caractéristiques des signaux candidats pour chaque
passage. De cette façon un ensemble des meilleurs candidats sera
accumulé, à vérifier plus tard avec un temps dédié d'observation à
Arecibo.
Ce post-traitement recherchera également des régularités
caractéristiques des signaux rapportés en tant que membres d'un même
groupe. Un exemple en est les multiplets de fréquences, nommément des
paires de n-uplets de signaux étroits arbitraires, mais espacés de
façon égale. Pour les avantages de ces signaux dans la recherche SETI,
voyez [ Cohen ] (1994) et [ Cordes et Sullivan ] (1994).
On ne doit pas oublier qu'il existe finalement la possibilité très
tentante de découvrir au travers du SERENDIP, en tant que sous-produit de
cette analyse SETI, un tout nouveau type de phénomène astrophysique se
produisant naturellement. L'analyse globale de recherche est la même
excepté que les signaux naturels pourraient être bien plus diffus qu'un
simple faisceau, et par conséquent bien plus difficiles à distinguer des
I.R.F. Pour des candidats plus petits que le faisceau, cependant, la
distinction entre une origine naturelle ou intelligente ne pourra venir
que plus tard après observations et analyse conséquente.
L'écran de veille lui-même.
Le programme que tourne sur chaque ordinateur client ressemble et se
comporte comme un écran de veille captivant. Il ne fonctionne que quand
la machine est inactive, et l'utilisateur peut choisir entre plusieurs
"visualisations" différentes du processus SETI, colorées et
animées. Certaines de ces visualisations paraîtront techniques, d'autres
paraîtront abstraites, et certaines pourrait décidément ressembler à
de l'art. Nous fournirons un ensemble de base de visualisations, en même
temps qu'un mécanisme de "plug-in" de manière à pouvoir en
ajouter d'autres facilement.
Les modes standards de l'écran de veille pourraient inclure (1) une
carte du monde montrant la localisation de toutes les machines participant
au projet, (2) une carte du ciel montrant quels secteurs ont été
couverts par l'étude et la localisation du secteur de ciel en cours
d'analyse (avec l'option d'afficher les figures mythologiques classiques
pour les constellations - on pourrait voir, par exemple, que le secteur de
quelqu'un est dans l'aisselle d'Orion !), (3) des motifs colorés et
changeant qui correspondent aux transformées de Fourier actuellement
menées, et (4) des graphiques "plats" montrant les résultats
de l'analyse de données évoluant actuellement.
Conclusion.
En ce septembre 1996, SETI@home n'est encore qu'une proposition, mais
nous nous sentons certains que cela se produira rapidement. Les clients
potentiels pour SETI@home incluent les enthousiastes d'astronomie et
d'espace (par exemple les membres de la Planetary Society), les fans de
science-fiction (p. ex. les "Trekkies"), les aventuriers
d'Internet (les "têtes branchées"), les professeurs de science
et leurs étudiants, et tous les enthousiastes de sciences &
technologies. Tout ce dont nous avons besoin pour faire de ce projet
communautaire global une réalité est le partenariat d'une compagnie de
haute technologie visionnaire. Le projet est de la bonne science et il
générera une publicité attirante et bienfaitrice pour tout partenaire,
de même que pour la science en général et la bio-astronomie en
particulier. Il y a preneurs ?
RÉFÉRENCES.
- [ Bowyer S., Werthimer D., Cobb J., et Lampton M. ] (1997) :
"Twenty years of SERENDIP, the Berkeley SETI
effort : past results and future plans" (Vingt ans du
projet SERENDIP, l'effort SETI de Berkeley : résultats passés et
plans futurs), ce volume.
- [ Cohen N., et Charlton D. ] (1995) :
"Polychromatic SETI" (SETI polychrome), pp.
313-22 dans "Progress in the search for
extraterrestrial life" (Des progrès dans la Recherche de la
Vie Extraterrestre),
éd. G.S. Shostak (San Francisco : Astronomical Soc. of the
Pacific).
- [ Cordes J., et Sullivan W.T. III ] (1995) :
"Astrophysical coding" (Encodage
astrophysique), pp. 325-42 dans "Progress in the
search for extraterrestrial life" (Des progrès dans la
Recherche de la Vie Extraterrestre),
éd. G.S. Shostak (San Francisco : Astronomical Soc. of the
Pacific).
- [ Sullivan W.T. III, et Mighell K.M. ] (1984) :
"A Milky Way search strategy for extraterrestrial
intelligence" (Une stratégie de recherche dans la Voie Lactée
pour l'intelligence extraterrestre),
Icarus numéro 60, pp. 675-84.
Des questions ? Écrivez-nous !
Retour au sommaire de SETI@home.
|