Bonjour, je suis très heureux de pouvoir vous parler aujourd`hui des
Transcription
Bonjour, je suis très heureux de pouvoir vous parler aujourd`hui des
Bonjour, je suis très heureux de pouvoir vous parler aujourd’hui des plateformes sur réseau au nom de CANARIE. Avant d’entrer dans le vif du sujet, veuillez m’excuser si j’écorche un peu le français. Écossais de naissance, j’ai grandi à Vancouver avant de passer les vingt dernières années à Toronto. Un tel cheminement n’est malheureusement guère propice à l’exercice de la langue de Molière. Comme je le disais à un groupe auquel je me suis adressé en France, il y a quelques années, « vous pouvez entendre que suis anglophone – anglophone mais francophile ». Venir au Québec me fait toujours plaisir, particulièrement ce matin, puisque nous aurons la chance de nous entretenir des plateformes sur réseau qui, je crois, joueront un rôle déterminant dans l’avenir de la découverte au Canada. En effet, si les plateformes sur réseau sont essentielles au progrès de la science, elles le sont encore plus à la prospérité du Canada dans une économie planétaire fondée sur le savoir car, sans recherche ni innovation, notre pays ne pourra maintenir et encore moins rehausser sa situation actuelle dans le monde. Vous êtes sans doute nombreux à connaître le Programme des plateformes sur réseau de CANARIE. L’échéance pour le premier appel de propositions a été fixée au 15 novembre. De toute évidence, les groupes qui souhaitent y participer devraient déjà être très avancés, s’ils n’ont pas déjà finalisé leur proposition. Au lieu de vous parler du programme, je vous donnerais donc plutôt une idée du raisonnement à son origine, l’illustrer avec des exemples concrets et vous amener à réfléchir sur la manière dont il influera sur vos travaux en vous incitant à songer aux possibilités qui s’ouvriront par la suite. L’intérêt que nous portons aux plateformes sur réseau vient de l’intime conviction que l’avenir de la découverte dépend du passage à la cyber-recherche. Veuillez noter que j’ai dit « cyber-recherche », pas « cyberscience ». Si la cyber-science joue un rôle important en cyber-recherche, cette dernière connaît une croissance phénoménale dans les sciences humaines et sociales. Or, les découvertes de demain sont étroitement liées à la façon dont on regroupera les idées qui jaillissent de toute part, à la façon dont les différentes disciplines s’alimenteront l’une l’autre et dont on réussira éventuellement à tout intégrer. Dans une économie articulée sur la connaissance, la manière dont le savoir est structuré et la façon dont la collectivité humaine l’accueille et l’utilise ont autant d’importance que la connaissance proprement dite. Depuis quelques années, les exemples où de grandes percées scientifiques ont failli à leurs promesses simplement parce qu’on n’avait pas ou pas assez porté attention aux facteurs humains ne font que se multiplier. Les aliments génétiquement modifiés en sont sans doute la plus brillante illustration. Les scientifiques et les industriels en faveur des OGM n’ont pas préparé l’opinion publique à cette innovation parce que son utilité leur paraissait évidente. Jamais ils ne s’attendaient à la virulente polémique qui a éclaté, surtout en Europe. Les partisans des OGM étaient persuadés qu’une « bonne idée scientifique » se justifiait d’elle-même. Je ne suis néanmoins pas venu pour défendre ou combattre les OGM. Je tiens simplement à souligner que, pour qu’elle soit vraiment utile, toute percée doit être adoptée. Scientifiques et ingénieurs ont profondément besoin des sciences sociales lorsqu’ils étudient les possibilités d’une découverte et cherchent comment l’Homme pourrait l’exploiter. Je ne veux pas dire que les sciences sociales aideront l’homme de science à berner le commun des mortels, pas plus que la circulation se fait à sens unique. La science pure, comme les sciences sociales, évolueront si elles engagent et maintiennent le dialogue. La cyber-recherche est l’avenir pour trois raisons : 1. une prolifération explosive des données; 2. la reconnaissance que l’intelligence collective existe; 3. l’admission que traitement brut des données et raisonnement sont deux choses distinctes. Durant la majeure partie de cette décennie, nous avons entendu des expressions du genre « explosion de données », « tsunami numérique », « croissance exponentielle de l’information » et j’en passe. Beaucoup d’entre vous connaissent l’étude de Berkeley qui, en 2000, utilisant des données de 1999, prévoyait que la genèse d’environ 2 exaoctets de données par année. Reprise en 2003 avec les chiffres de 2002, cette étude rehaussait son estimation à 5 exaoctets annuellement. Pour ceux qui se souviennent mal du système méga, giga, téra, péta, exa, un exaoctet est l’équivalent de 10 à la puissance 18. L’étude de Berkeley situe la totalité des documents gardés à la Bibliothèque du Congrès américain à 10 téraoctets, soit 10 à la puissance 12, ou 0,000001 exaoctet, ou encore 0,0000002 pour cent des données produites dans le monde en 2002. De tels chiffres dépassent vite l’entendement. Le point capital est, qui ces chiffres ont été avancés en 2002 (aussi époustouflants qu’ils soient) ces chiffres sont avant des développements qui n’ont fait que multiplier davantage l’avalanche de données. Parmi eux, on retrouve : • le déploiement du rfid • l’ubiquité des téléphones cellulaires numériques • l’usage omniprésent de la photographie numérique (elle a dépassé la pellicule en popularité dès 2004) • le Blackberry et ses imitations • les réseaux de capteurs • un relèvement de la résolution de plusieurs ordres de grandeur grâce à diverses techniques de numérisation • le grand collisionneur de hadrons et les centaines d’autres instruments scientifiques majeurs comme les télescopes, les microscopes et les synchrotrons • les réseaux sociaux • le Web 2.0 • et bien d’autres développements qui m’échappent. Bref, il est clair qu’une grande partie des 5 exaoctets de données de 2002 et, Dieu seul sait combien, de données produites en 2007 ne sont que du vent. Encore faut-il posséder la capacité requise pour transformer une masse aussi phénoménale de données en information, pour en tirer des connaissances et pour exploiter ces dernières de façon pratique. L’enjeu s’avère encore plus complexe. Chaque domaine de l’activité humaine engendre une quantité incroyable de données. En essayant de solutionner les problèmes d’aujourd’hui et en creusant notre imagination pour identifier les possibilités qu’ouvrirait la capacité de traiter une telle masse, nous ne nous attaquons pas à un seul monstrueux ensemble de données. Nous composons souvent avec de nombreux ensembles et en créons de nouveaux en cherchant les corrélations susceptibles de les relier. Au récent colloque e-Science 2007 de Microsoft, Catherine Blake, de l’Université de Caroline du Nord, a déclaré que l’enjeu, pour la science contemporaine, n’était pas tant de recueillir les données mais d’en faire la synthèse. En d’autres termes, si la pénurie de données ralentissait naguère la découverte, on chancelle maintenant sous le poids de l’information. Les plateformes sur réseaux sont les outils technologiques qui permettront aux chercheurs de faire bon usage de cette masse inouïe de données. Précisons que le phénomène n’est pas nouveau pour l’humanité. Lors de la révolution industrielle, les sociétés qui ont réussi sont celles qui avaient le mieux développé l’infrastructure permettant de transformer la montagne de matière première en une quantité comparativement réduite de produits finis. Au Canada, des tonnes de minerai de fer de Schefferville, des tonnes de charbon du Cap Breton et des milliers de kilowatts d’électricité des chutes Niagara ont servi à fabriquer quelques kilos d’acier à Hamilton. En considérant les données comme le minerai de fer de l’économie du savoir, on saisira mieux pourquoi il faut bâtir sans tarder l’infrastructure qui nous aidera à transformer la matière première en produit fini. Bref, il faut se lancer dans l’érection de plateformes sur réseau. La deuxième raison pour laquelle de telles plateformes sont indispensables est qu’on admet maintenant que l’intelligence collective est une possibilité. Comme je l’ai mentionné plus tôt, la recherche contemporaine intègre de plus en plus les idées d’autres disciplines. Elle met donc en jeu de nombreuses personnes pour ne pas dire équipes. Depuis une dizaine d’années environ, nous avons découvert ou, plutôt, redécouvert que l’intelligence peut être collective. Nous avons aussi appris que cette forme d’intelligence dépasse constamment la somme de ses parties, c’est-à-dire les intelligences individuelles affectées à un travail quelconque. Naguère, nous croyions collaborer, mais la collaboration survenait toujours après manipulation des données. Les scientifiques lisaient un rapport, analysaient discrètement les données chacun de leur côté puis se réunissaient pour en discuter. On ne comprenait pas alors que, les données ayant été examinées en privé, les conversations ou débats ultérieurs ne portaient que sur des conclusions toutes faites. Depuis qu’on ne se fie plus uniquement au texte et à la notation pour communiquer et qu’on s’est rendu compte de la puissance des simulations et des visualisations, on constate qu’en initiant la collaboration au moment où les données sont captées – donc avant de parvenir à des conclusions – l’interaction des intellects sans parti pris aboutit à des conclusions fort différentes. Puisque les jeux de données gagnent toujours en volume et en complexité, il devient impérieux de tirer le maximum de cette synergie cérébrale. L’industrie pétrolière et gazière est un cas intéressant. En une décennie à peine, cette industrie a accru la proportion de forages fructueux de 14 à 70 pour cent, simplement parce qu’elle a maîtrisé l’intelligence collective au lieu de miser sur une multitude d’intelligences individuelles dans les nombreuses disciplines requises – géologie, hydrologie, sismologie, forages, géophysique, etc. Quand les équipes multidisciplinaires ont eu la chance de collaborer à l’analyse des données, leur intelligence collective a engendré des idées nettement plus audacieuses que celles nées antérieurement des intelligences individuelles lors des discussions suivant l’analyse des données. Rien qu’au cours des quelques dernières années, nous avons vu surgir le Web 2.0, les wikkis, les blogues, youtube, facebook, Second Life... Chacun de ces réseaux sociaux fait intervenir l’intelligence collective sous des angles différents. Penser que leurs créateurs partent à la chasse des jeunes désœuvrés est une grave erreur. Les réseaux sociaux transforment l’activité humaine. À la mi-octobre, à Banff, je présidais un comité pour Cybera, l’organisme albertain qui a remplacé Netera en combinant le réseau optique régional avec la promotion et l’implantation de la cyberinfrastructure dans la province. Les cinq membres du comité venaient d’importantes sociétés et j’ai été très sévère avec eux. Je leur ai déclaré qu’il n’était pas question de faire une présentation de marketing. Je voulais savoir en quoi la cyberinfrastructure avait changé la manière dont fonctionnent les entreprises. Tous, sans exception, ont expliqué comment divers outils des réseaux sociaux avaient modifié leurs activités. Un a déclaré que les documents techniques et les discussions les concernant se faisaient désormais en wikki; un autre, que les manuels avaient tous été mis en ligne dans un environnement wikki; un troisième, que les dirigeants de l’entreprise alimentaient chacun un blogue. Ils ont expliqué comment les réseaux sociaux transforment l’expérience au travail et accroissent sensiblement le rendement. Quel meilleur témoignage du pouvoir des réseaux sociaux et de leurs répercussions potentielles sur les économies classiques de l’information et des communications pourrait-il y avoir que Microsoft annonçant qu’elle achète une partie de Facebook pour 240 millions de dollars? 1,6 pour cent d’un marché global de 15 milliards de dollars. Soyez sûr que si l’un de vous désire acheter 1,6 pour cent de Walter Stewart & Associates, je vous ferai un bon prix. Soyons sérieux. Les réseaux sociaux constituent vraiment une technologie de transformation, car leur influence se fait sentir partout. Cependant il leur faut une infrastructure pour réaliser leur plein potentiel. Pour aller au-delà de la simple conversation, pour qu’il y ait une interaction utile sur des données sérieuses en vue d’aboutir à de vraies solutions, nous avons besoin de plateformes sur réseau. La troisième raison qui rendent de telles plateformes indispensables est qu’on reconnaît désormais que le traitement des données et le raisonnement sont deux choses distinctes. Face au besoin impérieux de comprendre les nombreux et colossaux jeux de données, et de le faire presque en temps réel, nous nous sommes tournés vers l’informatique, les réseaux et le stockage pour traiter, acheminer et conserver la masse phénoménale de données. Il s’agit d’une extension du processus intellectuel, un processus très familier dans le monde physique. Dieu a chassé Adam et Ève du jardin d’Éden en leur disant « Tu gagneras ton pain à la sueur de ton front ». La première fois où ils ont ramassé un bâton pointu pour se procurer plus facilement de la nourriture, la technologie était née. À compter de ce moment, chaque fois que l’humanité a imaginé un moyen pour se rendre maître des forces physiques, la civilisation a connu à un relèvement majeur de sa productivité – le levier, la roue, la voile, le cheval, la chaudière, le moteur à combustion interne, le réacteur, l’énergie nuccléaire. À chaque invention, l’humanité a atteint un niveau supérieur au précédent et la productivité s’en est trouvée grandement accrue. Si j’avais dû me rendre à Montréal par mes seuls moyens physiques, j’aurais quitté Toronto il y a un mois, mais grâce à la puissance du moteur à réaction, cela ne m’a demandé qu’une heure. Nous appliquons maintenant cette hausse de productivité au plan intellectuel. Certains d’entre vous savent que j’ai travaillé pour SGI pour quelques années. Le plus puissant ordinateur que Sun, ou Dell, ou HP, ou IBM, ou moi aurions pu vous vendre à l’époque, et même maintenant, ne fait rien que vous ne pourriez accomplir vous-même avec une règle à calcul, beaucoup de papier et trois ou quatre millénaires. Le calcul à haute performance permet de traiter une énorme quantité de données et de les présenter sous une forme qui aide l’être humain à accomplir, dans des délais raisonnables, ce qui est l’apanage de son espèce : raisonner. Jamais encore cela ne s’est produit dans l’histoire de l’humanité. Les générations qui ont précédé la nôtre ne travaillaient qu’avec les données que le cerveau humain est en mesure de traiter. Le calcul à haute performance a abattu l’obstacle de la masse de données avec laquelle on peut composer. En combinant le calcul à haute performance avec les plateformes sur réseau, nous relèverons considérablement la productivité de l’utilisateur en fusionnant la collecte, la saisie, le traitement, le stockage, le partage, la reformulation et la réutilisation des données. J’ai beaucoup parlé des raisons pour lesquelles nous avons besoin des plateformes sur réseau. Je vous dirai maintenant en quoi consiste une telle plateforme en prenant quelques exemples. Les plateformes sur réseau sont des plateformes habituellement destinées à résoudre un problème dans une discipline donnée ou un problème de recherche multidisciplinaire. Ces plateformes relient les sources de données – les capteurs, les instruments, etc.; les outils servant à traiter ces données, par exemple différentes méthodes de calcul; les instruments servant à les visualiser; les appareils qui stockent les données; et les utilisateurs qui, non seulement travaillent sur les données, mais peuvent diriger l’expérience à distance et contrôler les appareils générant les données. Manifestement, ces éléments de la plateforme sont connectés entre eux par un réseau qui recourt sans cesse plus au commandement des routes optiques aménagées par l’utilisateur en périphérie du réseau. Soulignons qu’il ne s’agit pas d’un processus linéaire. On ne suit pas nécessairement le cheminement production, traitement, stockage, visualisation et exploitation des données. Plus souvent qu’autrement, il s’agit d’un processus itératif et circulaire, dans lequel les composantes n’interviennent pas toujours toutes. Le processus varie selon les besoins. Ou, pour être plus précis, en fonction de la question qu’on se pose. J’ai récemment entendu Dan Reed du Renaissance Computing Institute de Caroline du Nord déclarer : « Avant, la réussite supposait une meilleure infrastructure. Aujourd’hui, ce sont ceux qui posent de meilleures questions qui connaissent le succès. » Les plateformes sur réseau permettront de poser les meilleures questions qui soient. Des questions libres de toute contrainte comme seul le permet un amalgame de l’imagination humaine et de la technologie. Nous disposons déjà de la plupart des éléments nécessaires aux plateformes sur réseau – appareils, ordinateurs, réseaux, disques de stockage, machines pour la visualisation, utilisateurs. Ce qui manque le plus souvent sont les intergiciels pour tout relier impeccablement et avec souplesse. De nombreuses équipes de chercheurs dans le monde s’efforcent de développer et de perfectionner ces logiciels dans un processus aussi itératif que celui pour lequel les intergiciels sont conçus. Les meilleurs exemples sont l’Observatoire virtuel international, le projet Physiome et ATLAS. Nous y reviendrons plus tard. Ces dernières années, mon travail au sein de CANARIE et avec l’Open Grid Forum m’a donné l’occasion d’assister à des rencontres sur les intergiciels un peu partout sur la planète. Outre celles sur l’astronomie et la physique des particules, le Canada y était largement absent. Les intergiciels qui feront des plateformes sur réseau une réalité doivent sans aucun doute être élaborés de concert avec des partenaires de l’étranger. Les plateformes d’un pays doivent se greffer sans peine aux plateformes analogues du reste du monde. La chose sera aisée pour les grands projets scientifiques. Il est clair qu’il n’y aura qu’un seul grand collisionneur de hadrons sur la Terre. Parallèlement, il est manifeste que le Canada comptera plus d’un synchrotron. Nous devons donc élaborer de concert l’intergiciel qui permettra une exploitation répartie de ces ressources afin que les normes reposent sur l’exploitation libre. Même considérablement plus modestes, les plateformes sur réseau doivent épouser des normes et favoriser l’établissement de normes qui garantiront l’interopérabilité des intergiciels et le partage des connaissances dans le monde entier. Le Canada doit redoubler d’efforts pour que ses découvertes trouvent leur place sur la scène internationale. Il se peut que notre pays doive d’abord insister sur la création de communautés d’utilisateurs. Bien que le Programme des plateformes sur réseau de CANARIE se concentre directement sur les outils, l’architecture, les normes et les interfaces qui font partie intégrante de la plateforme de recherche, indirectement, il attache beaucoup d’importance à la naissance de la collectivité répartie d’utilisateurs qui bâtira la plateforme, y compris l’architecture qui facilitera leur collaboration. La communauté répartie et les ententes internes régissant les relations mutuelles portent souvent le nom d’ « organisation virtuelle ». Une organisation virtuelle se composera des éléments que voici : i) la communauté d’utilisateurs concernée, ii) l’ensemble de ressources privées ou publiques comme les ordinateurs, les bases de données, les unités de stockage, etc. que partage la communauté et iii) les ententes conclues par les membres du groupe au sujet de la mise en commun et de l’exploitation des ressources (à savoir, qui a accès à quoi? comment assurera-t-on la sécurité? quels intergiciels permettront l’interaction uniforme des membres de l’organisation virtuelle avec les ressources? etc.). CANARIE exigera sans nul doute que ces organisations virtuelles s’établissent au Canada et imitent les organisations virtuelles des autres pays. La découverte s’est mondialisée. Les activités nationales de développement des plateformes doivent s’orchestrer avec les efforts analogues poursuivis ailleurs, et y concourir. L’interopérabilité n’est pas négociable. À présent, voyons les plateformes sur réseau en train d’être élaborées ici et là dans le monde. Certaines sont déjà extraordinairement complexes; d’autres ne fond que leurs premiers pas. Examinons quelques plateformes en développement au Canada. Veuillez noter que, dans chaque cas, une forme quelconque d’organisation virtuelle a été mise en place. Veuillez m’excuser si les diapositives sont en anglais. Je les ai glanées de divers organismes et le temps manquait pour les faire traduire, obtenir les autorisations nécessaires et faire approuver la traduction. Diaporama Donc, Que tout cela signifie-t-il pour une organisation comme RISQ qui exploite un réseau. Brièvement : que votre importance n’a jamais été aussi grande! Cependant, pour surmonter les obstacles que suppose votre mission, vous devrez impérativement vous allier à d’autres et faire front commun, qu’il s’agisse d’informaticiens, de chercheurs dans des domaines pointus, de créateurs d’intergiciels ou d’exploitants d’appareils et de dispositifs spécialisés. Sans plateformes sur réseau, on ne découvrira pas grand-chose au vingt-et-unième siècle et de telles plateformes ne verront pas le jour sans réseaux comme le RISQ, eux-mêmes raccordés à des réseaux fédérateurs tel CANARIE. Au Québec comme partout ailleurs au Canada, les réseaux demeurent la composante la mieux développée des plateformes sur réseau. À nous de faire preuve d’assez de leadership pour qu’on élabore les plateformes de manière à procurer capacités et moyens aux chercheurs dont les besoins précis forgeront les caractéristiques de chacune d’elle. En tant qu’organismes exploitant un réseau, l’enjeu est, pour nous, d’attirer l’attention des équipes scientifiques vers les plateformes sur réseau et le travail déjà fort avancé dans d’autres pays, puis de les convaincre à travailler de concert avec nous afin de mettre au point les plateformes voulues au Canada. Nous devrons aussi éveiller l’intérêt des organismes publics qui formulent les politiques et débloquent des fonds en les exhortant à revoir les mécanismes au moyen desquels ils financent la recherche pour que la création des plateformes sur réseau bénéficie du financement adéquat. Le Forum mondial de la science de l’OCDE a recommandé aux pays membres de l’Organisation de passer en revue les mécanismes par lesquels ils financent la découverte dans ce but précis. Au Canada, la création du Fonds des plateformes nationales par la FCI et du Programme des plateformes sur réseau par CANARIE sont un début. Néanmoins, il y a encore beaucoup à faire. Un autre enjeu interpelle ceux qui font partie des organisations exploitant un réseau. Cet enjeu n’est pas nouveau; il ne fait que s’accentuer. Les réseaux étant parvenus à maturité, devenant plus puissants et gagnant en fiabilité, les utilisateurs s’attendent maintenant à recevoir l’équivalent de la commutation numérique mais sur large bande. De plus en plus de gens jugent le service que nous leur procurons comme tout à fait naturel. Quand nous avons entamé les vastes consultations nationales qui ont précédé le refinancement de CANARIE, plus tôt cette année, chaque fois que nous avons évoqué la possibilité que CA*net disparaisse advenant l’absence de financement, la réponse était toujours : « Ne soyez pas ridicule. Le réseau est là pour rester. » Vous êtes nombreux à savoir que nous sommes passés à un cheveu de perdre le réseau national. Son financement n’a été confirmé que deux semaines avant la date fatidique. Oubliez qu’il « est là pour rester ». En servant toujours plus efficacement les utilisateurs des plateformes sur réseau, nous ne cesserons de gagner en transparence, car nos organisations – si elles demeurent indispensables au bon fonctionnement du réseau – perdront tout contact quotidien avec les utilisateurs, ceuxci prenant le contrôle du réseau en périphérie. Si une telle délocalisation vers les extrémités est essentielle à une véritable fonctionnalité, avec elle vient le problème « loin des yeux, loin du cœur ». En nous retirant techniquement de plus en plus dans les coulisses, nous devrons veiller, en tant qu’organisation, à illustrer davantage que nous sommes les vrais artisans derrière l’érection des nouvelles infrastructures de la découverte. Nous pouvons nous attaquer à ces enjeux et nous le ferons. La chose sera d’autant plus aisée si CANARIE et les RORE continuent de travailler avec autant d’efficacité et d’esprit d’équipe que dans le passé. Les récents perfectionnements entrepris par RISQ, ORION et CANARIE pour rehausser le réseau dans les provinces centrales et introduire la technologie ROADM illustrent parfaitement ce que nous devons réaliser en tandem. Le financement de CANARIE a été reconduit jusqu’en 2012. Notre objectif est assurément de faire en sorte qu’avant cette date, nous contribuions avec tant de succès à la création des plateformes sur réseau canadiennes pour la recherche, pour l’administration publique et pour l’industrie qu’on saisira sans peine et soutiendra largement la place des réseaux nationaux et l’apport capital des réseaux régionaux. CANARIE, RISQ et les autres RORE y parviendront en s’unissant. Merci de m’avoir donné l’occasion de m’adresser à vous ce matin.