La presse en ligne d`ailleurs vers ailleurs
Transcription
La presse en ligne d`ailleurs vers ailleurs
everydata lab article # 03 La presse en ligne d’ailleurs vers ailleurs ! Christophe Carioua, Patrick Le Flochb et Fabrice Le Guelc a Chercheur indépendant, everydata lab, 31 A5 Rue Mirabeau, 35700 Rennes. [email protected] b Maître de Conférences, Institut d’Etudes Politiques, 104 Boulevard de la Duchesse Anne, 35700 Rennes. patrick. [email protected] c Maître de Conférences, Université de Nice-Sophia Antipolis, 250 Avenue Albert Einstein, 06560 Valbonne. [email protected] Première version : 06 octobre 2008 www.everydatalab.com 1 La presse en ligne d’ailleurs vers ailleurs ! Résumé Nous participons aux débats sur l’état de la presse en ligne en nous intéressant à la double question suivante : d’où viennent les lecteurs ? où repartent les lecteurs ? Ces questions sont d’autant plus importante que la presse en ligne avait pris l’habitude de chercher à garder le lecteur au sein de son propre contenu. L’étude se focalise sur les 89 leaders de la presse en ligne internationale et sur les sites les plus utilisés pour arriver et repartir de la presse en ligne. L’étude montre une dichotomie très forte. Les internautes viennent principalement du web 2.0 - agrégateurs sociaux, blogosphère, réseaux sociaux, sites communautaires d’échanges de photos et de vidéos - et repartent principalement vers la presse spécialisée et régionale.... Mots clés : Presse ; Internet ; Hyperliens ; Réseaux. 2 Introduction Depuis quelques années, le paysage économique de la presse connaît d’importants et incessants bouleversements. Pour des raisons structurelles ainsi que par l’avènement de l’internet, son modèle économique est remis en cause (Le Floch et Sonnac 2005 1). Le récent rapport sur la presse américaine dresse un constat relativement pessimiste : “L’état des nouveaux médias américains est plus inquiétant en 2008 qu’il y a un an. Et les problèmes ressortent, de plus en plus, différents de ce que de nombreux experts avaient prédits 2” (PEJ 2008) Les études actuelles se focalisent sur la problématique des modèles économiques et les types de sites web de la presse, sans qu’émerge jusqu’à présent de modèle dominant ou de bonne stratégie3. L’objectif de cette étude est de se focaliser sur deux caractéristiques mises en évidence dans le récent rapport de la presse américaine mais quasiment pas analysées de manière approfondie. L’étude suggère que la presse en ligne avait tendance à vouloir garder les usagers à l’intérieur de leur propre contenu. Il en ressort alors deux conséquences. D’une part, la page d’accueil était considérée comme le point d’entrée de la lecture de la presse en ligne, ce qui ne semble plus être le cas puisque de l’ordre des 2/3 aux 3/4 des visiteurs viennent d’ailleurs, autrement dit sont des lecteurs indirects. D’autre part, la presse en ligne avait tendance a cité ses nombreuses sources sans pour autant en faire des hyperliens 4 permettant aux lecteurs de poursuivre ailleurs leur lecture, ce qui semble être relativement moins le cas aujourd’hui, même si lier son site à un concurrent semble encore considéré comme une trahison. Comme le rappelle Barabasi (2003), grand spécialiste de la sciences des réseaux appliquée à l’internet, le web permet à l’internaute d’aller de page en page, de site en site, d’hyperlien en hyperlien. Et c’est ainsi qu’alors que le web est constitué de plus de 181 millions de sites (selon Netcraft), son diamètre5 n’est que de l’ordre de 19 (Albert et al. 1999). En d’autres termes, il ne faut en moyenne que 19 clics pour accéder à n’importe quelle page web en partant de n’importe quelle autre page web, même sans aucun lien thématique a priori. Mais l’étude de Broder et al. (2000) suggère un web relativement plus compliqué avec des pages totalement isolées au sein du web (9%), des pages avec des hyperliens mais qu’aucune autre ne référence 1 Egalement Le Floch (2008) montre que de la distribution physique à la distribution numérique, le coût ne tend aucunement vers zéro, contrairement à ce que l’on peut entendre en la matière. 2 Traduction des auteurs. 3 Pour la presse française, voir les rapports de Tessier et Baffert (2007), de Precepta (2006) ou encore de Ineum Consulting (2006) ainsi que l’étude de Attias (2008) qui nous semble plus systématique sur un échantillon de 382 sites de la presse professionnelle française. 4 Un hyperlien est un lien présent sur une page et pointant vers une autre page. 5 Le diamètre d’un réseau n’est autre que la distance, autrement dit ici le nombre de clics, maximum entre les deux pages les plus éloignées du réseau. 3 (21%), ou encore des pages citées qui ne citent aucune autre (21%), des pages qui vont et viennent de nulle part (21%), à côté du web bien connu où toutes les pages sont plus ou moins rapidement accessibles (28%). Notre question est d’étudier l’organisation de la presse en ligne par l’intermédiaire des parcours de navigation des internautes : de quels sites viennent-ils pour lire la presse en ligne ? et vers quels sites repartent-ils après avoir lu la presse en ligne ? quelles sont les différences ? quels sont les sites les plus centraux ? la presse formet-elle un ou plusieurs ensembles ? Autant de questions étudiées en fonction des acteurs numériques de la presse : moteurs de recherche, agrégateurs d’actualités, blogosphère, médias télévisuels, magazine, agences de presse et bien évidemment quotidiens. Notre étude s’organise de la manière suivante. Nous commençons par présenter les 89 leaders de la presse en ligne sur lesquels nous nous focalisons en fonction du type d’acteurs numériques. Nous poursuivons par l’analyse des liens entrants, autrement dit des sites par lesquels les lecteurs arrivent à la presse en ligne. Et nous faisons de même pour les liens sortants, c’est-à-dire les sites vers lesquels les lecteurs de la presse en ligne repartent. Et nous finissons par étudier le réseau formé par ces liens entrants, ces leaders et ces liens sortants afin de mieux appréhender les différences existantes. Et nous nous focalisons sur les relations entretenus par les leaders entre eux. Les leaders de la presse en ligne : la presse traditionnelle et les nouveaux acteurs numériques Les données mobilisées dans cette étude proviennent d’Alexa6. Il s’agit des 89 sites de presse en ligne ayant l’audience la plus élevée au cours du 1er trimestre 2008 selon ce classement. Nous considérons donc que ces sites représentent ceux ayant jusqu’à présent le mieux tirer leur épingle du jeu dans le domaine de la presse en ligne. L’Annexe 1 présente l’ensemble des sites, leur audience et leur catégorie. Nous retrouvons les sites présents dans les différents classements existants 7. La typologie construite8 nous permet de faire quelques commentaires sur les acteurs de la presse en ligne (cf. Tableau 1). 6 Alexa est un service de mesure d’audience des sites web réalisée à partir d’une sonde centrée sur plus de 2 millions d’usagers, ce qui permet d’avoir l’audience en termes de nombre de lecteur et non de nombre de visiteurs uniques (Rosanvallon 2008). Nous nous sommes focalisés sur les leaders plutôt qu’un ensemble relativement plus large de sites, de manière à retrouver les sites des autres classements existants, compte-tenu que Alexa ne fournit aucun renseignement sur les usagers de sa sonde. 7 Comscore, Compete, Nielsen et Technorati pour les plus utilisés dans cette étude. 8 La nomenclature Alexa provient du site collaboratif Dmoz. Cependant, compte-tenu des nombreux sites mal ou peu renseignés, nous avons reconstruit manuellement les types de sites en fonction des études sur la presse en ligne op cit. 4 Les 4 grands moteurs de recherche bien évidemment Le web fourmille d’informations avec ses quelques 181 millions de sites disponibles (selon Netcraft), et les moteurs de recherche, lieux de passages quasi-obligatoires (ou hubs), jouent alors un rôle relativement structurant du web. Barabasi (2003) parle d’attachement préférentiel des internautes en parlant d’eux. Nous retrouvons ainsi les 4 principaux moteurs de recherche (et/ou portails) du web - Google, Yahoo!, MSN et AOL - et leur service dédié à l’actualité : ils proposent l’actualité à partir d’accords passés avec les différentes sources de la presse traditionnelle (PEJ 2008). Les sites de Google, Yahoo! et Microsoft dépassent les 500 millions de visiteurs uniques par mois au niveau international, et les sites AOL les 250 millions de visiteurs uniques (selon Comscore). Et rien que Google détient quasiment 70% du marché de la recherche en ligne, bien loin devant les autres (selon Compete). Ces sites bénéficient très clairement de leur rôle de hub du web. En somme, ces moteurs constituent des concurrents de la presse traditionnelle en termes d’audience. Ils ne produisent certes aucune information mais permettent aux internautes de s’orienter dans ce déluge informationnel. Ils offrent des sources multiples pour suivre une information, et permettent d’aller directement à la source de l’information plutôt que de passer par la page d’accueil d’un site de presse. Tableau 1. Les audiences Alexa pour chaque catégorie de la presse en ligne9 . catégorie agence magazine moyenne 0,069 0,053 déviation 0,085 0,035 variation 1,226 0,667 minimum 0,016 maximum 0,246 7 nombre quotidien tv météo web 2.0 moteur 0,07 0,51 0,194 0,058 17,881 0,092 0,611 0,23 0,038 12,71 1,328 1,197 1,185 0,653 0,711 0,017 0,013 0,037 0,023 0,017 0,023 0,118 0,568 1,387 0,533 0,149 27,105 10 41 8 4 15 4 Les grandes chaînes de télévision également A côté des traditionnels moteurs de recherche, nous retrouvons à la suite les autres concurrents numériques de la presse : les télévisions et radios, lesquels ont l’habitude et la maîtrise du son, de l’image et de la vidéo, trois médias numériques dont le succès sur le web ne se dément pas10. Les médias traditionnels de la télévision tirent donc bien leur épingle du jeu dans le secteur de la presse en ligne 9 Les valeurs d’audience représentent le nombre de visiteurs rapporté au nombre d’internautes. La déviation est l’écart-type, la variation est le rapport entre la déviation et la moyenne. 10 Les sites de partage de photos et vidéos sont parmi les plus fortes audiences de ces dernières années. Ainsi Youtube (de Google), qui représente rien moins que la moitié des vidéos visionnées sur le web (selon Comscore), est le 4ème site en termes d’audience, avec près de 20% des internautes comme visiteurs uniques (selon Alexa). 5 avec 8 télévisions : ABC (n°5), la BBC (n°6) ou encore CNN (n°7) sont devant la presse traditionnelle, alors que la Fox (n°13), BSkyB (n°34), Voice of America (n °42), CBS (n°43) ou encore CNBC (n°52) sont dans le classement mêlé à la presse traditionnelle en termes d’audience. Dans la catégorie presse de Alexa, on trouve également 4 sites métérologiques dont The Weather Channel (n°9), également chaîne de télévision, et aussi présent dans le classement américain tous sites confondus avec quelques 34 millions de visiteurs uniques (selon Comscore). En somme, la presse traditionnelle doit faire face à une concurrence encore plus accrue que précédemment de la part des médias télévisuels, lesquels partaient avec l’avantage du multimédia, intérêt marqué de la part des internautes. Le web 2.0 fortement présent : agrégateurs et weblogs La littérature sur le web 2.0 a largement mis en avant le rôle potentiellement important de l’intervention des usagers tant au niveau du contenu informationnel qu’éditorial des agrégateurs sociaux ou de la blogosphère. Pour Tapscott et Williams (2008 : 39), comme pour nombre d’autres observateurs, le phénomène du blog est ce qui a le plus profondément changé le web, et par effet de cascade, changera l’économie11 . Il y a environ 133 millions de blogs indexés depuis 2002, et près de 1 million de billets postés chaque jour (selon Technorati), ou encore 184 millions de personnes auraient commencé un blog, et le double serait des lecteurs de blogs (selon Universal McCann). Et pour les seules Etats-Unis, sur 190 millions d’internautes, de 78 millions (selon Comscore) à 94 millions (selon eMarketer) seraient des lecteurs, et 23 millions des rédacteurs (selon eMarketer). L’ampleur du phénomène est telle que nombre de sites hébergeurs de blogs sont parmi les sites ayant la plus forte audience. Ainsi Blogger (de Google) est la 7ème audience internationale avec 8.6% des internautes visiteurs (selon Alexa). Véritable phénomène de société, il n’en demeure pas moins que la très grande majorité des blogs n’ont qu’une très faible audience, et que seuls quelques blogs font autorité dans leur domaine12. Dans notre classement nous trouvons 15 acteurs qui entrent pleinement dans cette catégorie. D’un côté, les agrégateurs ne produisent pas d’informations mais permettent aux internautes de naviguer plus facilement dans le déluge informationnel. D’un autre côté, les blogs utilisent pleinement l’information produite 11 L’ouvrage de Tapscott et Williams (2008) est sous-titré comment la collaboration de masse peut tout changer, et fourmille de très nombreux exemples. Il ressort tout de même fortement optimiste, voire idéaliste. L’autre best-seller plus appliquée au secteur des médias est celui de Gillmor (2004) dont le titre est suffisamment illustratif : nous les médias, journalisme à la base par les personnes pour les personnes. 12 C’est le principe de la longue traîne décrite par Anderson (2006) qui rappelle par ailleurs que 99% des blogs ont une audience inférieure à 12 visiteurs uniques au quotidien. Cependant, contrairement au récent rapport américain (PEJ 2008), l’existence de la longue traîne ne remet aucunement en cause la phénomène des blogs, et leur influence potentielle sur la presse en ligne. 6 ailleurs, la commente, la critique, la complète, etc., et certains blogs, avec des journalistes professionnels notamment, peuvent fournir de nouvelles informations. Et entre les deux, les frontières deviennent relativement floues. Notre classement est alors relativement intéressant, il fournit un échantillon de la diversité des agrégateurs et des blogs d’actualités, et du flou de plus en plus important entre ces deux types de sites. Nous avons News Now (n°61), un pur agrégateur d’actualités et acteur numérique, ou encore Bankrate (n°62) spécialisée dans l’agrégation d’informations financières en tout genre, et qui ne cesse de croître d’année en année de l’ordre de 20%, avec entre 3 et 4.5 millions d’Américains qui l’utilisent chaque mois (selon Compete). Nous avons ensuite les agrégateurs avec une intervention importante des usagers, lesquels votent pour les articles qu’ils préfèrent, et la popularité des articles déterminent alors le contenu éditorial de la page d’accueil notamment, comme c’est le cas pour Find Articles (n°25), racheté par CBS, dont il dépasse par ailleurs l’audience. Nous avons également l’exemple souvent cité de Reddit (n°29), agrégateur d’actualités qui permet aux usagers de poster uniquement des liens vers un contenu ou une page jugé intéressant, et qui évolue dans le classement Reddit en fonction du vote des usagers eux-mêmes. Fondé sur le système de Digg 13, le grand frère, ce système est devenu une application présente sur nombre de sites de presse : on peut digger un article, c’est-à-dire qu’un internaute peut lire un article sur un site, et cliquer sur un bouton afin qu’il soit directement proposé au vote sur le site de Digg notamment. Un site tel que Reddit a une audience plus importante que les magazines Time et Business Week, ou encore que le Financial Times, preuve du poids accordé à l’avis des autres usagers. Nous avons ensuite des agrégateurs qui tendent vers la blogosphère. Digital Spy (n °55) en Angleterre, est un agrégateur avec une très forte composante de type forums, où les usagers peuvent intervenir autour d’une information. Egalement, entre agrégateur, blog et réseau social, nous trouvons 43 Things (n°50) : chaque usager construit sa propre page et y met des tags (à l’image du site de partage de photos flickR) pour les articles d’actualités considérés intéressants par eux. Et enfin, l’agrégateur le plus proche d’un blog est probablement le Drudge Report (n °15) : principalement agrégateur d’actualités politiques (internationales), il arrive que l’équipe diffuse ou produise leur propre information, ou encore celle que les autres refusent, sans oublier la réputation relativement sulfureuse qu’il s’est créé dans la diffusion des rumeurs. Il est dans le Top 30 des sites américains d’actualités 13 Reddit est souvent cité dans les exemples du web 2.0 comme le petit frère de Digg, autre agrégateur du même type. Ce dernier n’est pas présent dans notre classement, Dmoz le classant dans une autre catégorie. Pour comparaison son audience est de l’ordre de 0.25% des internautes, soit 3 fois plus élevé que Reddit ; Digg serait 10ème dans notre classement. Pour une description précise de ces types d’agrégateurs, voir Tapscott et Williams (2008 : 144-145). 7 (selon Nielsen), et son audience semble allée de pair avec les grands événements (selon Alexa). Dans notre classement, Drudge Report se situe devant USA Today, Times et le Wall Street Journal tout de même, ce qui est très loin d’être négligeable. Nous entrons ensuite dans la stricte blogosphère 14 avec The Huffington Post (n°28) : c’est une communauté de blogs d’actualités politiques construite autour d’un coeur de journalistes professionnels qui proposent une couverture de l’actualité et produisent de l’information également. Il a reçu de très nombreuses récompenses 15 et est considéré comme le blog politique le plus influent de la planète en 2008 (selon The Observer), et également présent dans le classement du Top 50 de la blogosphère (selon Technorati). Dans le même genre entre mixte journalisme professionnel et journalisme citoyen, Newsvine (n°84), initialement acteur numérique, fut racheté par la chaîne de télévision MSNBC. D’autres acteurs de la presse en ligne ont préféré héberger des blogs (et des experts) à succès : on peut citer l’exemple des auteurs du best-seller Freakonomics16, dont le blog également à succès, est maintenant hébergé par le New York Times. Mais au-delà de ces acquisitions, l’impact de la blogosphère et des agrégateurs sociaux a été et est relativement importante sur les orientations prises par la presse traditionnelle. Aujourd’hui plus de 95% des 100 premiers sites de presse américaine ont actuellement développé des blogs internes (selon The Bivings Group), et l’audience de ces blogs peut représenter jusqu’à 9% des pages vues pour le Washington Post et encore 7% pour le New York Times et le Guardian (selon Alexa). Egalement, on peut citer les autres expérimentations du New York Times : un journal personnalisé via My Times, ou encore sur la page d’accueil la mise en évidence des articles les plus envoyés, les plus lus et / ou les plus blogués, etc. En somme, le succès du web 2.0 sous ses différentes formes n’est aucunement démenti, bien au contraire, il représente une audience non négligeable et une influence potentiellement forte sur l’évolution de la presse en ligne. La presse traditionnelle très bien représentée A côté de tous ces acteurs concurrents, les acteurs de la presse traditionnelle sont très bien représentés dans ce classement, avec plus de la moitié des 89 sites étudiés. Les agences de presse, au nombre de 7, trouvent avec le numérique une audience relativement plus large que traditionnellement : Reuters (n°10) arrive juste après les 14 Boing Boing, exemple très souvent cité, et présent dans le classement de la blogosphère Technorati, n’est pas présent dans notre classement, il se situait juste après le dernier de nos 89 sites de la presse en ligne selon Alexa. Pour plus d’informations sur ce site, voir Tapscott et Williams (2008 : 34) qui considèrent que c’est l’un des organes du web les plus populaires et les plus influents, avec une audience de l’ordre de 750 000 visiteurs par jour, et qui ne cesse de croître. 15 Il a notamment gagné le Webby Awards deux années de suite, en 2006 et 2007. 16 Levitt and Dubner (2005) Freakonomics, William Morrow Ltd. 8 moteurs de recherche, les télévisions, le New York Times et The Weather Channel. On y trouve également Bloomberg (n°21) devant le Los Angeles Time, et l’agence américaine très officielle Associated Press (n°56) est également présente dans ce classement. Il est également possible de souligner la présence de l’agence de photographies Shutterstock (n°58) laquelle met encore en évidence l’intérêt très élevé des internautes pour la composante multimédia. Les magazines, avec 10 sites présents dans ce classement, tirent également leur épingle du jeu, avec les magazines d’affaires Forbes (n°20) et Business Week (n°31), les plus généralistes Time (n°30), ou encore les culturels National Geographic (n°35) et The Atlantic (n°69) et enfin le people avec Variety (n°60), etc. Mais surtout, 41 des 89 leaders ne sont autres que des journaux traditionnels. Le New York Times 17 se trouve en tête de liste des journaux, et 8ème du classement, juste derrière les 4 moteurs de recherche et les 3 médias télévisuels. Au niveau international (tous sites confondus), le New York Times numérique est le seul journal à être présent dans le Top 20 avec un peu plus de 77 millions de visiteurs uniques en mai 2008 (selon Comscore), et il est le 12ème site le plus visité aux Etats-Unis avec quelques 44 millions de visiteurs en juillet 2008 (selon Comscore). Les autres grands quotidiens américains sont également présents et très bien placés, avec The Guardian (n°11), The Washington Post (n°12), USA Today (n°16), le Wall Street Journal (n°18) et le Los Angeles Times (n°24), à côté du grand quotidien indien The Times of India (n°14), l’anglais Times (n°17) et l’australien News (n°19). Comme nous l’avons précisé en introduction, le fait que les grands quotidiens soient très bien placés en termes d’audience web ne signifie aucunement qu’ils aient trouvé leur bon modèle économique, sachant qu’ils n’ont pas la même stratégie. Ainsi après avoir abandonné le modèle payant, après avoir réalisé nombre d’expérimentations, les recettes publicitaires du New York Times ne cessent de diminuer, les réductions de postes se succèdent et se ressemblent, et pour la première fois depuis sa création, l’action du New York Times devient une valeur boursière potentiellement spéculative (The Economist 20.09.2008). Et ce n’est qu’un exemple parmi tant d’autres, The Los Angeles Time se déclarant web-stupid (PEJ 2008), malgré son audience. A côté des grands quotidiens américains, nous retrouvons des quotidiens en langue anglo-saxonne, principalement indien (Malayala Manorama, Hindustan Times...), australien (The Age...) et canadien (The Toronto Star, The Globe and Mail...) ; des quotidiens américains spécialisés dans l’information internationale (International Herald Tribunes...), financière (Financial Times...) ou encore satirique (The Onion), voire même un quotidien créé par un collectif de journaliste (Independent Media Center). Mais la majeure partie des autres quotidiens sont des quotidiens américains régionaux : The Seattle Times, Chicago Tribune, The Houston Chronicle... 17 Le statut du New York Times est d’être le journal de référence. 9 En somme, la presse traditionnelle est fortement présente et dominée par la presse anglo-saxonne, et plus particulièrement américaine, avec non seulement les grands quotidiens nationaux mais également avec un très grand nombre de quotidiens régionaux. A propos des lecteurs en ligne... L’audience est importante bien évidemment mais relativement insuffisante pour comprendre l’organisation du secteur de la presse en ligne, et d’autant plus que même les quotidiens ayant la plus forte audience doivent faire face à nombre de difficultés. Le récent rapport sur la presse américaine (PEJ 2008) nous fournit quelques éléments qu’il peut sembler important d’approfondir. L’idée générale est que jusqu’en 2007 encore, la presse en ligne avait tendance à garder les usagers à l’intérieur de leur propre contenu. Cette tendance s’inscrit clairement dans la double logique de savoir d’un côté d’où les lecteurs viennent, et d’un autre côté vers où les lecteurs vont. Pour l’entrée, les 2/3 des lecteurs numériques n’arrivent pas via la page d’accueil (PEJ 2008 18) mais bel et bien via d’autres sites sur lesquels le lecteur a trouvé un hyperlien l’amenant sur le site de presse pour approfondir une information. Dit autrement, la majorité des lecteurs viennent d’ailleurs ! Pour la sortie, la presse en ligne semble encore avoir des difficultés à mettre des hyperliens et permettre ainsi au lecteur de poursuivre sa lecture ailleurs, et considère encore comme une trahison le fait de diriger son lecteur vers le concurrent. (PEJ 2008) Dès lors la plupart du temps, les hyperliens existants orientent le lecteur vers ce que la presse ne considère pas comme des concurrents directs. Dit autrement, la majorité des lecteurs s’en vont ailleurs ! C’est ce double ailleurs de la presse en ligne que nous souhaitons étudier plutôt que la problématique de l’audience ou du contenu des leaders de la presse en ligne. Nous mobilisons alors les liens entrants et les liens sortants de la presse en ligne, c’est-àdire les sites par lesquels les lecteurs sont arrivés et vers lesquels les lecteurs sont repartis19. Mais contrairement aux études des sciences des réseaux (Albert et al. 1999 et Border et al. 2000 par exemple) nous ne nous focalisons pas sur tous les hyperliens existants, mais nous nous concentrons sur les 11 hyperliens entrants et les 11 hyperliens sortants les plus utilisés par les lecteurs. Nous sommes alors en mesure d’étudier les parcours privilégiés des lecteurs qui entrent d’un côté et qui sortent d’un autre côté de la presse en ligne, et de comparer leurs caractéristiques, ainsi que 18 Le rapport souligne que ce chiffre n’est pas connu mais lui a été suggéré en off, et marque une différence cruciale par rapport à 2004 où la page d’accueil était encore une valeur sûre pour l’usager. 19 Alexa ne fournit que les 11 hyperliens sortants les plus utilisés, nous avons donc mobilisé les 11 hyperliens entrants également les plus utilisés. Nous avons transformé ces hyperliens pour n’avoir que les sites et non les différents sous domaines éventuels, et avons éliminé les redondances existantes lorsqu’un site était alors présent plusieurs fois en tant qu’hyperlien. 10 de préciser la structure du ou des réseaux formés par l’ensemble de nos leaders de la presse en ligne. Les leaders entrants de la presse en ligne : quand l’audience vient d’ailleurs ! Définition d’un hit entrant Nous étudions les leaders entrants, autrement dit les sites les plus utilisés par les internautes pour visiter les leaders de la presse en ligne. Plus précisément, le fait qu’un site quelconque E mette un hyperlien vers l’un des leaders de la presse en ligne fait du site E un site entrant, et le fait que cet hyperlien soit l’un des plus utilisés par les internautes pour venir vers le hit en question fait du site E un hit entrant. Par ailleurs, un hit de la presse en ligne peut également être un hit entrant. (cf. Figure 1) Figure 1. Les liens entrants vers la presse en ligne. La figure représente les liens entrants via les flèches orientées. Les sites C1 à C3 représentent les sites de la presse en ligne. Les flèches orientées représentent les liens entrants. Les sites E à E’’ ainsi que le site C2 sont des sites entrants. Il y a alors plusieurs possibilités d’organisation de la presse en ligne : C2 représente un site entrant et sortant ; C1 est lié à C2 directement, mais également indirectement via E’ ; et enfin C3 n’est pas relié aux autres sites, il est ici isolé. Le réseau formé par les leaders entrants Dans notre étude, il y a 109 leaders entrants et 882 liens entrants, dont seulement 7 leaders de la presse en ligne, lesquels ne sont autres que les 3 grands moteurs de recherche Google, Yahoo! et MSN, les 2 grandes chaînes de télévision BBC et CNN, et les quotidiens New York Times et San Francisco Chronicle. La visualisation de ces liens nous montre qu’il n’y a qu’une seule composante entrante. Autrement dit, tous les sites de presse en ligne s’avèrent reliés entre eux par l’intermédiaire des leaders entrants. Dès lors que 102 autres sites permettent de relier nos 89 leaders, il en ressort qu’il existe un faible nombre de parcours utilisé par les internautes de manière privilégié pour arriver à la presse en ligne, et que ces parcours ne semblent pas fortement différenciés en fonction du type de presse en ligne (cf. Figure 2). Les 882 liens entrants ne sont pas distribués également au niveau des sites, puisque 20% des leaders entrants représentent 80% des liens, autrement dit des parcours les plus utilisés pour visiter les sites de presse en ligne. D’ailleurs, le premier hit entrant est Wikipedia et représente à lui seul 10% des manières de parvenir à la presse en ligne pour les internautes. Nous retrouvons au niveau des leaders la règle présente au niveau de l’ensemble du web : la longue traîne ou la loi de Pareto 80/20 du nombre 11 de liens entrants, laquelle nous indique que peu de sites constituent les points d’entrée dans la presse en ligne, et beaucoup de sites représentent des manières assez faibles d’entrée dans la presse en ligne20. En conclusion, il ressort que les leaders de la presse en ligne sont relativement liés entre eux et forment une seule composante, dont les parcours sont relativement restreints. Figure 2. Les leaders entrants vers la presse en ligne. Au-delà de cette analyse générale, nous nous intéressons à la nature de ces leaders entrants. L’Annexe 2 reprend le Top 20 et permet d’illustrer notre propos, et de participer aux débats sur les contenus potentiellement pertinents en termes d’attractivité des internautes. Wikipedia, l’encyclopédie grande pourvoyeuse d’audience La première place des leaders entrants est pour l’encyclopédie participative Wikipedia. Elle est utilisée par les lecteurs de manière privilégiée pour accéder à tous les leaders de la presse en ligne (ou presque avec 88 des 89 leaders). Wikipedia représente tout de même la 4ème audience internationale avec plus de 260 millions de visiteurs uniques, dont 1/5ème en provenance des Etats-Unis (selon Comscore). C’est également la plus grande encyclopédie du monde, avec plus de 2 millions d’articles en anglais, contre environ 80 000 pour Britannica, et tout juste 40 000 pour 20 Pour plus de détails sur la longue traîne, la loi de Pareto ou encore la loi puissance, voir les ouvrages de Barabasi (2003) et Anderson (2006). 12 Encarta (de Microsoft). Au total, plus de 5 millions d’articles en plus de 200 langues. Et enfin, plus de 100 000 contributeurs ont créé ou modifié un minimum de 10 articles anglophones (Levrel 2006 : 199). Wikipedia marque un véritable succès international du web 2.0, et est repris en exemple dans tous les articles et ouvrages sur l’internet. Pour ce qui nous intéresse par rapport à la problématique des médias, il est possible de noter bien évidemment la très grande abondance et diversité des articles. Ces deux caractéristiques renvoient à la définition de la longue traîne de Anderson (2006), et au résultat : tous les sujets n’ont pas la même audience (en termes de contenu et de lecteurs des articles), loin s’en faut. L’exemple le plus souvent repris est celui de Arrington (2007) : l’article sur le combat au sabre-laser dans Star Wars est beaucoup plus complet que celui sur la guerre moderne. Cela renvoie encore à la grande différence entre le contenu éditorial professionnel (Britannica ici) et amateur (Wikipedia), ce dernier intervenant en fonction de ces centres d’intérêt. L’autre grande caractéristique est que Wikipedia est une encyclopédie dynamique. Dit autrement, l’importance du nombre d’usagers fait que les erreurs peuvent être (et sont généralement) plus nombreuses certes mais plus rapidement corrigées également que dans le cadre de l’encyclopédie Britannica par exemple 21. Dans notre échantillon nous avons certes les moteurs de recherche présents, mais les liens proviennent des services dédiés à l’information. La différence entre Google et Google News notamment n’est autre que le temps : l’accumulation possible du nombre d’hyperliens vers un article dans le temps. Dès lors, les archives prennent une valeur potentiellement nouvelle par rapport à la presse traditionnelle. Wikipedia s’inscrit également dans une telle démarche d’archives bien plus que d’articles en temps réels22. (Anderson 2006 : 143) En somme, l’encyclopédie 2.0 ayant la plus grande audience web utilise pleinement le contenu de la presse traditionnelle pour accroître notamment la qualité des articles, et il en ressort que les usagers de Wikipedia utilisent pleinement les hyperliens présents dans les articles, puisque l’encyclopédie représente le moyen privilégié d’accéder à toute la presse en ligne. 21 Contrairement à une encyclopédie professionnelle, l’écart de qualité est beaucoup plus élevée (inégale) dans Wikipedia. Toutefois, la comparaison entre Wikipedia et Britannica semble bien moindre que ce que l’on pourrait croire. En effet, sur 42 entrées, il y avait en moyenne 4 et 3 erreurs respectivement (Giles 2005). Face à l’encyclopédie allemande Brokhaus, Wikipedia ressort meilleure sur 50 entrées (Stern 2007). Il ne s’agit aucunement de comparer ici la qualité mais plutôt de rappeler que suite à l’article de Nature, les erreurs de WIkipedia ont été très rapidement corrigées, alors que celles de Britannica ont du attendre la réimpression suivante. Un temps de réaction globalement beaucoup plus long chez les professionnels que chez les amateurs. 22 L’étude de Dezso et al. (2006) montre, à partir de l’analyse de toutes les visites réalisées pendant une semaine sur un quotidien hongrois, qu’une nouvelle information a une durée de vie de 36h et non de quelques minutes ; que la plupart des nouvelles génère peu d’intérêts alors que quelques nouvelles sont hautement populaires. 13 Les moteurs de recherche bien évidemment Les moteurs de recherches et les portails web constituent des lieux d’arrivée importants pour la presse en ligne, bien évidemment. Comme nous l’avons précédemment souligné, ils représentent des moyens de contourner les pages d’accueil des sites de presse, et d’aller directement à l’information recherchée par l’internaute, tout en offrant des sources multiples plutôt qu’un seul journal. Google figure clairement le plus important d’entre tous, non seulement avec sa version internationale, mais également par la forte présence de ses différentes versions nationales 23 ; au total, il représente 21% des liens entrants vers la presse en ligne. Nous retrouvons ensuite Yahoo! (n°6), et Microsoft (n°17) - MSN (n°24) ainsi que les autres moteurs de recherche Answers (n°26) et Ask (n°29). Il faut également souligner le rôle important joué par les moteurs de recherche chinois généraliste Baidu (n°14) et spécialisés dans l’actualité Sina (n°9) et Hao123 (n°19), ou encore le site allemand de presse professionnelle Heise (n°21) entre autres. La présence des moteurs de recherche ne constituent aucunement une surprise, et suggère clairement l’intérêt pour les sources multiples, le contournement de la page d’accueil, et la lecture d’informations plutôt que de quotidiens. Le web 2.0 de la presse en ligne en tête de liste Les agrégateurs et la blogosphère sont fortement bien représentés, voire relativement centraux dans la manière d’entrée dans la presse en ligne (cf. Figure 2). Il est à noter que ces acteurs ne sont pas les leaders de notre étude, ce qui suggère que nos leaders semblent représenter des points d’arrivée plutôt que des points d’entrée dans la presse en ligne, en termes d’audience liée. Nous retrouvons dans ce classement tous les acteurs 2.0 cités dans les études sur la problématique de l’internet. Les 3 acteurs les plus importants sont l’agrégateur généré par les usagers Digg (n°5) - op. cit. - et les deux importantes communautés de blogs Xanga (n°3) juste derrière Wikipedia et Google, et devant la BBC, et Wretch (n°8). A eux trois, ils représentent rien moins que 15% des manières privilégiées utilisées par les usagers de la presse en ligne. L’agrégateur Slashdot est également présent dans ce classement, il est souvent cité avec Digg : les deux se basent sur l’intervention des usagers, cependant que les modérateurs jouent un rôle très important chez Slashdot. Nous trouvons également le blog technologique TechCrunch, et les agrégateurs de blogs Technorati et Blog Pulse (de Nielsen) notamment. Il faut également y inclure les hébergeurs de blogs, Alexa nous permettant de cumuler le nombre de liens de blogs individuels hébergés par ces acteurs. Il s’agit notamment de Blogger (de Google), l’hébergeur a plus forte audience internationale - op. cit. -, ou encore Angelfire (de Lycos), Bloglines, ProBlogger, etc. 23 Google.com (n°2) et également les différentes versions nationales : anglaise (n°11), japonaise (n°13), allemande (n°20), canadienne (n°21), indienne (n°23), polonaise (n°28), australienne (n°46), brésilienne (n°47), nouvelle zélandaise, thailandaise, taiwanaise, etc. 14 Selon le récent rapport américain (PEJ 2008), la blogosphère serait à l’origine d’environ 13% de l’audience de la presse en ligne, contre un peu plus de 40% pour les moteurs de recherche. En ajoutant l’importance des agrégateurs et de Wikipedia, le poids du web 2.0 d’actualité en termes d’audience liée vers la presse en ligne serait encore plus élevée24. La presse en ligne ne peut alors négliger l’importance de ce phénomène25 . Ils ne peuvent également mettre de côté le fait que ces acteurs 2.0 ne renferment aucunement l’usager à l’intérieur de leur contenu mais constituent bien plus un moyen de poursuivre l’analyse et la compréhension d’une information, ce qui en fait également l’une des raisons de leur réussite. En conclusion, l’impact de la blogosphère se confirme : leaders de la presse en ligne, ils constituent également des leaders entrants vers la presse en ligne. Le web 2.0 multimédia entre en force dans le classement L’intérêt très élevé des internautes pour le multimédia (photos et vidéos notamment) et pour les sites communautaires ne se dément aucunement. Ces sites représentent des sites à très forte audience sur lesquels il est possible de trouver très rapidement nombre d’images et de vidéos relatifs à l’actualité diverse et variée26 . Et finalement, il ressort qu’une part de ces composantes multimédias proviennent de la presse en ligne. Parmi les plus importants, nous retrouvons les sites de partage de photographies flickR (n°7) et Fotolog (n°12), la plus grande base de données de films Internet Movie Database (n°10) et le site de partage de vidéos Youtube (n°16) - op. cit. -. Ils représentent un peu plus de 12% des manières privilégiées de parvenir à la presse en ligne, ce qui s’avèrent relativement considérable. Et ce d’autant plus qu’on trouve également nombre d’autres sites communautaites de vidéos avec Dailymotion, de photos avec Istockphoto et Deviant Art, et de réseaux sociaux avec les Facebook, Bebo, Friendster, LiveJournal, etc. Et pour conforter l’importance du multimédia, 24 Il nous semble que nombre d’études se focalisent trop sur la longue traîne au niveau de l’audience des blogs (Anderson 2006) et négligent fortement la longue traîne au niveau de l’audience liée - les liens entrants - (Barabasi 2003) : comme la plupart des blogs ont une très faible audience (pas de concurrence), ils engendrent une très faible audience pour la presse en ligne (pas de collaboration), alors que dans les deux cas, l’accumulation de l’audience et de l’audience liée en fait des acteurs auxquels la presse en ligne devrait accorder plus d’importance. 25 Dès lors, nous ne partageons pas pleinement l’analyse à sens unique de Vedel (2008) qui suggère que l’impact potentiel des médias traditionnels sur les blogs est bien plus élevé que la réciproque : une citation par Le Monde génère un traffic relativement important pour un blog que le contraire. 26 Comme le rappelle Alain Le Diberder (2008), si les Youtube, Dailymotion, flickR et Wikipedia relèvent bien de l’information, ils n’entrent pas dans la catégorie de la presse. Il fait également remarquer que ces sites notamment ne sont dynamisés que par une infime partie des internautes (voir Prieur et al. 2008 sur le cas flickR). En somme, le cercle des initiés s’élargit, d’une infime minorité à une ... petite minorité. 15 nombre de sites de télévision complètent la liste avec la BBC (n°4) et CNN (n°18) pour les plus importantes et de loin. En conclusion, ce fait va dans le sens des débats sur la presse en ligne avec l’importance indéniable pour les sites de presse de faire a part belle au multimédia, et fait des usagers des sites communautaires, peu mis en évidence dans les différents rapports, une audience des plus importantes pour la presse en ligne. Mais où est la presse traditionnelle ? Un constat édifiant dans l’ensemble de nos leaders entrants : l’inexistence de la presse en ligne comme manière privilégiée de parvenir à l’information. Nous ne trouvons de nos leaders que le New York Times, Forbes et le San Francisco Chronicle, et autrement le site de la NBA pour les nouvelles sportives (basket), le site de CBS spécialisé dans les nouvelles technologiques, et Der Spiegel pour la presse allemande. Ce fait renvoie très clairement au constat posé par le rapport américain (PEJ 2008) : mettre un hyperlien actif sur son site vers un site concurrent est considéré comme une réelle trahison. En d’autres termes, pour le moment, la presse en ligne n’est pas la plus grande pourvoyeuse de sa propre audience, les usagers viennent d’ailleurs. L’étude des liens sortants permettra alors de savoir vers où la presse en ligne renvoie de manière privilégiée leurs usagers. En conclusion de l’étude des liens entrants, il nous semble assez clair que la presse traditionnelle ne représente aucunement une manière directe de lire l’information, les lecteurs y viennent via principalement les moteurs de recherche et le web collaboratif, qu’il soit spécialisé dans l’actualité ou d’ordre multimédia. Et inversement, cela suggère également que les autres acteurs numériques ont pleinement besoin de la matière produite par la presse traditionnelle. Les leaders sortants de la presse en ligne : quand l’audience s’en va ailleurs ! Définition d’un hit sortant Nous étudions maintenant les leaders sortants, autrement dit les sites les plus visités par les internautes à la suite de leur passage par les leaders de la presse en ligne. Plus précisément, le fait qu’un hit de la presse mette un hyperlien vers un site quelconque S fait du site S un site sortant, et le fait que cet hyperlien soit l’un des plus utilisés par les visiteur du hit de presse fait du site S un hit sortant. Par ailleurs, un hit de la presse en ligne peut également être un hit sortant. (cf. Figure 3) Le réseau formé par les leaders sortants Dans notre étude, il y a 612 leaders sortants et 1033 liens sortants, dont 59 de nos leaders de la presse en ligne. La visualisation de ces liens nous montre qu’il n’y a qu’une seule composante sortante. Autrement dit, tous les sites de presse en ligne s’avèrent reliés entre eux par l’intermédiaire des leaders sortants. Dès lors que nos 16 89 leaders renvoient vers 553 autres sites, il en ressort d’une part une grande diversité dans les leaders sortants vue le nombre et d’autre part une grande homogénéité dans les leaders sortants vue la seule composante formée. (cf. Figure 4) Figure 3. Les liens sortants vers la presse en ligne. La figure représente les liens sortants via les flèches orientées. Les sites C4 à C6 représentent les sites de la presse en ligne. Les flèches orientées représentent les liens sortants. Les sites S à S’’ ainsi que le site C5 sont des sites sortants. Il y a alors plusieurs possibilités d’organisation de la presse en ligne : C5 représente un site entrant et sortant ; C4 est lié à C5 directement, mais également indirectement via S ; et enfin C6 n’est pas relié aux autres sites, il est ici isolé. Les 1033 liens ne sont pas distribués également au niveau des sites, puisque 20% des leaders entrants représentent 52% des liens, autrement dit des parcours les plus utilisés après la visite des sites de presse en ligne. D’ailleurs, la chaîne de télévision CNN représente le site de sortie le plus privilégié par les usagers de la presse en ligne, en redirigeant ses lecteurs de manière privilégiée vers 33 des leaders de presse. D’ailleurs, il n’y a que 11 sites sortants de plus de 10 leaders de la presse, et seulement 132 sites sortants sur les 612 présents en provenance de plus de 1 hit de la presse, le reste représente des sorties uniques. En conclusion, il ressort que les leaders de la presse en ligne sont relativement liés entre eux et forment une seule composante, cependant que les parcours peuvent être relativement diversifiés. Au-delà de cette analyse générale, nous nous intéressons à la nature de ces leaders sortants. L’Annexe 3 présente le Top 20 et permet d’illustrer notre propos et de participer aux débats sur les contenus potentiellement pertinents en termes d’attractivité des internautes : que recherchent les internautes lorsqu’ils viennent sur un site de presse en fonction de ce qu’ils vont visiter par la suite ? La télévision et la radio sont fortement présentes Nous retrouvons de manière très importante la présence des télévisions et de leur composante multmédia, ils sont d’ailleurs relativement nombreux dans le Top 20 des leaders entrants - CNN (n°1), BBC (n°5), MSNCB (n°7), FOXNEWS (n°8), ABC (n °8), CBS (n°12) et la ABC australienne (n°12) -, et représentent de l’ordre de 10% du nombre de liens totaux. Elles sont également fortement présentes dans la suite du classement avec par exemple le site généraliste de la CBC ou encore la composante financière de CNN, et une panoplie d’autres chaînes de télévision. On trouve également quelques médias radios dans la suite du classement avec la radio canadienne CBC ou encore la National Public Radio entre autres. 17 Cette forte présence suggère deux conclusions. (i) La composante vidéo représente un atout relativement majeur pour les télévisions en termes d’attractivité. (ii) La presse en ligne ressort plus que disposer à développer des hyperliens vers les sites de télévision. Par contre, nous ne retrouvons aucunement les sites communautaires précédents, mis à part les sites de stockage de photographies Istock Photo et Foto Search, mais ils ne sont aucunement des leaders sortants des plus importants, seulement utilisés par 2 sites de presse de manière privilégiée. En somme, la presse en ligne dirige son lecteur vers les médias considérés comme produisant de l’information plutôt que vers les médias qui reprennent uniquement des photos et des vidéos sans aucun autre apport. La composante professionnelle prend clairement le dessus sur la composante loisir. Figure 4. Les leaders sortants vers la presse en ligne. La presse traditionnelle centrale sous toutes ces formes La plupart des sites sortants sont des sites de presse en ligne, avec un large nombre des grands quotidiens présents en haut du classement : USA Today (n°2), le Washintong Post (n°3), le New York Times (n°4), le Los Angeles Times (n°5), le Financial Times (n°16), et le Guardian (n°16). A côté de quoi nous retrouvons également The Christian Science Monitor en 15ème position. La liste est complétée par les agences de presse Reuters (n°8) et l’Associated Press (n°16), et même l’AFP par la suite. En somme, il s’agit de la presse ayant la plus forte notoriété, et considérée comme quasiment incontournable. 18 Que peut-on dire du reste du classement en termes de presse en ligne ? Nous retrouvons les magazines focalisés sur le monde politique et des affaires avec en tête le Time, Forbes et Business Week et un peu plus loin dans le classement Fortune, Entrepreneur Mag, The Law Bulletin, Business Wire, et même Wired dans le domaine des technologies par exemple. A côté de cette presse spécialisée dans le monde des affaires, nous retrouvons une autre catégorie importante, à savoir la presse à tendance plutôt régionale et locale, autrement dit de second rang, et a priori de moindres concurrents pour les leaders : Chicago, Dallas, Seattle, Miami, Vancouver, Arizona... pour ne citer que quelques lieux des Etats-Unis. Et enfin, nous trouvons également une large panoplie de sites métérologiques, ainsi que la presse de la catégorie des loisirs divers et variés, la culture au niveau d’une ville, la nourriture, le sport, le people, l’automobile, la famille, l’éducation des enfants... un ensemble de catégories de la presse considérée par les leaders comme finalement des non concurrents, vers lesquels ils peuvent renvoyer leurs lecteurs. La quasi-absence du web 2.0 Si il ressort un résultat relativement important de ce classement, c’est l’absence de tous les leaders 2.0 de la presse en ligne mis à par le Drudge Report. On y trouve également mais pas forcément bien placés les hébergeurs de blogs Blogger et WordPress, et encore moins bien placés Angelfire et Bloglines, sans oublier les agrégateurs d’actualités Slashdot et de blogs Technorati. C’est finalement bien peu, et surtout cela va pleinement dans le sens d’une certaine compétition entre le journalisme professionnel et le journalisme dit citoyen, voire d’une moindre considération (Cardon et al. 2006 : 21). D’ailleurs, même Wikipedia n’est pas parmi les sites de sortie les plus importants. Les moteurs de recherche ne sont pas une porte de sortie prégnante Le Top 20 se complète alors avec les moteurs de recherche Yahoo (n°8) et Google (n °12). On retrouve par la suite les autres moteurs de recherche et portails internet : MSN, About, Lycos, Altavista, Baidu, Sina, Ask... Cependant, il est à noter d’une part qu’ils ne sont pas aussi dominants que précédemment, bien au contraire. Leur présence s’inscrit toutefois dans un double sentiment. D’un côté, leur faible présence suggère clairement une certaine réussite de la presse en ligne, en ce sens qu’ils ne gardent plus les usagers au sein de leur propre contenu, et semblent alors parvenir à proposer des hyperliens que les internautes utilisent de manière privilégiée 27. D’un autre côté, leur présence suggère tout de même une sorte d’échec puisque cela signifie que les usagers s’arrêtent tout simplement aux sites de presse en ligne (ou retournent à Google News par exemple pour trouver une autre source sur une information précise), et ne trouvent pas de quoi poursuivre leur navigation et 27 Et ce malgré le fait que l’on trouve sur la plupart des sites de la presse traditionnelle, une des barres moteurs de recherche de Google, Yahoo! ou Live (de Microsoft). 19 approfondissement de l’information étudiée. Ils tendent encore trop à garder les internautes au sein propre de leur contenu. En conclusion de l’étude des liens sortants, la presse en ligne semble fortement diriger ses lecteurs vers la presse traditionnelle bien plus que vers les nouveaux acteurs numériques, notamment le web collaboratif. Toutefois, elle semble du même coup vouloir garder les lecteurs au sein du réseau de la presse en ligne, et la hiérarchie entre les grands quotidiens et les quotidiens thématiques ou régionaux semble également préservée. La structure dichotomique de la presse en ligne Définition des composantes structurelles L’objectif est ici de fusionner les liens entrants et les liens sortants afin d’étudier le ou les réseaux ainsi formé(s). Ce nouvel ensemble forme un réseau orienté puisque les liens vont d’un site vers un autre. Et comme le rappellent Broder et al. (2000), dans un ensemble de liens orientés, tous les chemins d’un site à un autre n’existent pas forcément. Un tel ensemble peut alors se décomposer en 4 composantes. (1) La composante dite fortement connectée est constituée de l’ensemble des sites pour lequel un chemin existe forcément entre tous ces sites. (2) La composante dite entrante est constituée d’un ensemble de sites où il n’existe aucun moyen d’y arriver (inaccessibles), lesquels ont la particularité de permettre d’entrer au sein de la composante forte. (3) A l’inverse, la composante dite sortante est constituée d’un ensemble de sites où il n’existe aucun moyen de partir, lesquels ont la particularité d’être accessibles à partir de la composante forte. (4) Il y a également la composante dite “tube” constituée de sites non reliés à la composante coeur, elle réalise alors une liaison entre la composante entrante et sortante sans passer par ce coeur. (5) Et enfin, les composantes isolées représentent des sites inaccessibles à partir de l’une des trois autres composantes. (cf. Figure 5) Figure 5. Les composantes d’un ensemble de liens orientés. Les sites E appartiennent à la composante entrante et les sites S à la composante sortante, leurs liens sont en effet à sens unique. La composante forte est constituée de nos leaders C, lesquels possèdent tous au moins un lien entrant et un lien sortant. Les sites ES entrent également dans cette catégorie, ils représentent des sites d’entrée vers C et des sites de sortie de C. Et enfin, le site C est isolé. Comme les liens entrants ou les liens sortants suffisent à relier tous les sites entre eux, le corollaire est alors qu’il n’y a aucune composante isolée dans notre ensemble de la presse en ligne. En d’autres termes la presse en ligne forme un ensemble de sites reliés entre eux en un seul réseau. 20 Les composantes dichotomiques de la presse en ligne La question est maintenant de préciser les composantes entrantes et sortantes, ainsi qu’éventuellement les autres sites constituant la composante forte de la presse en ligne. Le réseau est composé de 735 sites et de 1906 liens entre ces sites, avec très peu de redondances générées par l’addition des liens entrants et des liens sortants, 9 liens seulement. La composante forte de réseau est constituée par seulement 93 sites. D’un côté, nous avons 6 des leaders qui n’appartiennent pas au coeur mais constitue une liaison entre la composante entrante et sortante. D’un autre côté, nous avons 10 sites autres que nos leaders de la presse en ligne entre au sein de cette composante. Nous y trouvons 4 moteurs de recherche / portails web avec Microsoft, ASK, le moteur chinois Baidu et le portail chinois d’informations Sina. Nous y trouvons également 4 hébergeurs / agrégateurs de blogs avec Angelfire (de Lycos), Blogger (de Google), Bloglines et Technorati. Et enfin, il y a également deux sites de stockage de photos avec Istock Photo et le hongrois Stock Exchange. Cependant, il est à remarquer une particularité de ces 10 autres sites : ils appartiennent à la composante forte de manière relativement faible, en ce sens qu’un seul lien les rattache, soit du côté de l’entrée, soit du coté de la sortie. Et cela même si Sina permet d’entrer de manière privilégiée sur 33 de nos 89 leaders de la presse en ligne. Figure 6. Les composantes de la presse en ligne. Dès lors, il ressort assez clairement que l’analyse précédente, qui suggérait une dichotomie entre les liens entrants et sortants, se confirment pleinement du point de 21 vue des composantes de ce réseau 28 (cf. Figure 6). La composante entrante est constituée de 92 sites, dont les caractéristiques ont été décrites précédemment : le web 2.0 avec Wikipedia, les agrégateurs, la blogosphère, les sites de réseaux sociaux et les sites communautaires d’échange de photos et de vidéos. Et la composante sortante est beaucoup plus importantes avec 543 sites, dont les caractéristiques ont été décrites précédemment : les médias télévisuels et de la presse dite de second rang, c’est-à-dire spécialisées ou régionales. Par conséquent, compte-tenu de ce que nous avons précédemment décrit, les sites entrants et les sites sortants ne sont pas les mêmes, et n’appartiennent aucunement à la même catégorie de sites. En conclusion, il en ressort que les leaders étudiés représentent le coeur de la presse en ligne, et que ce coeur peut-être décrit comme exclusif, à savoir que quasiment aucun autre site de presse ou d’ailleurs n’appartiennent à ce coeur de la presse en ligne. Les leaders entre eux, tous liés mais organisés en petits mondes Pour aller plus en profondeur dans l’analyse, nous nous focalisons uniquement sur les relations entretenues entre les 83 leaders de la presse en ligne. Le tableau 2 résume quelques statistiques relatives au réseau orienté formé par notre ensemble de 83 leaders, et les comparent également au cas où tous les liens seraient réciproques. Tableau 2. Les caractéristiques du réseau formé par les leaders29 . réseau orienté densité réciprocité distance degré groupes groupes pondérés coefficient structurel réseau orienté 0.0626 0,156 2.587 2x5.506 0.482 0.142 réseau non orienté 0.1080 1,000 1.932 9.506 0.713 0.230 réseau aléatoire 1,000 1,993 9,506 0,108 - ratio structurel 0,969 6,600 6,810 Nous sommes non seulement en présence d’une seule composante mais surtout il ne faut en moyenne que 2.6 clics pour avoir accès à n’importe quel leader de n’importe 28 La dichotomie au niveau des sites de la presse en ligne diffère fortement par rapport à l’étude des pages web de Broder et al. (2000), lequel trouvait une quasi-parfaite symétrie entre la composante entrante et sortante, autour de 44 millions, et une composante forte un peu plus élevée de l’ordre de 55 millions de pages web. A notre connaissance, il n’y a pas d’études similaires focalisés sur un secteur en particulier, et sur les différentes catégories de sites. 29 Le réseau aléatoire représente la structure d’un réseau non orienté fortement accessible et faiblement polarisée en considérant le même nombre de sites et de liens. Les ratios structurels représentent les valeurs du réseau non orienté rapportées au réseau aléatoire. Lorsque le ratio des distances est proche de 1 et que le ratio des polarisations est largement supérieur à 1, ou encore lorsque le coefficient structurel (la polarisation rapportée à la distance) est largement supérieur à 1, alors le réseau présente une structure de petits mondes : fortement accessible et fortement polarisée. (Watts et Strogratz 1998) 22 quel autre leader. Cette distance est relativement faible30, et la symétrie des hyperliens l’amélioreraient sensiblement. Cela peut s’expliquer par un nombre moyen de liens entrants et sortants relativement élevé, de l’ordre de 5.5, ce qui représente tout de même la moitié des liens mobilisés dans notre étude. En somme, les leaders de la presse en ligne se citent relativement souvent, ne forment qu’une seule grande composante, et sont très proches les uns des autres en termes de clics. Nous sommes également en présence d’une composante faiblement dense et surtout fortement orientée. Ainsi, seulement 6.3% des hyperliens possibles entre les sites sont effectifs, et tout juste 16% des hyperliens sont réciproques. Mais ces moyennes masquent une forte organisation du réseau en petits mondes. Le coefficient de polarisation (clustering coefficient) renvoie à l’idée suivante : les sites cités par les sites que je cite me citent-ils ? Dit autrement, les hyperliens les plus utilisés par les lecteurs les font-ils tournés en rond ? ou encore reviennent-ils en 2 clics au site de départ ? 31 Le coefficient nous indique que 48.2% des triplets orientés possibles sont effectivement présente, une valeur très élevée dans le cas d’un réseau orienté. Cette valeur passe à 71.3% dans le cadre d’un réseau non orienté, ce qui nous indique une très forte orientation de ces triplets. Et enfin, lorsque l’on pondère le coefficient par le nombre de liens 32, le coefficient est divisé par 3, ce qui nous indique que la polarisation est relativement plus forte au coeur qu’à la périphérie du réseau. Par rapport à la littérature sur les réseaux, il en ressort que le réseau des leaders de la presse en ligne est organisé en petits mondes. Dit autrement, le réseau est aisément accessible à tous tout en étant organisé en petits groupes de sites. La presse internationale périphérique et la presse nationale centrale Pour étudier plus précisément les groupes les plus notables ainsi que la très forte orientation du réseau, nous nous concentrons maintenant sur la problématique de la résilience ou stabilité du réseau (Newman 2003 : 15), autrement dit les conditions de maintien du réseau de la presse en ligne. Plus précisément, les acteurs numériques semblent avoir un effet relativement plus structurant sur le réseau de la presse en ligne que les acteurs traditionnels. Qu’en est-il réellement ? 30 Cette valeur est d’autant plus faible que Albert et al. (1999) trouvent une valeur moyenne de l’ordre de 19 à 21 pour l’ensemble du web, Broder et al. (2000) trouvent une valeur de l’ordre de 16 pour un réseau orienté et de 7 pour un réseau non orienté. 31 Dit autrement : l’hyperlien de i vers j, et l’hyperlien de j vers k, signifient-t-ils qu’il existe un hyperlien allant de k vers i ? Pour un réseau orienté, il s’agit donc de faire le rapport entre le nombre de triplet présent (de i vers j, de j vers k, et de k vers i) et le nombre de triplet possible (de i vers j et de j vers k) ; le coefficient pour le réseau est la moyenne des coefficients individuels. 32 Le coefficient moyen est alors la moyenne des coefficients individuels pondérés par le degré moyen, et donne alors plus de poids aux sites centraux par rapport au coefficient non pondéré, lequel donne autant de poids aux regroupements périphériques qu’aux regroupements centraux. (Newman 2003) 23 Nous avons précédemment mis en évidence le fait que les moteurs de recherche et les chaînes de télévision étaient présents tant au niveau des leaders entrants que des leaders sortants. Ils sont dès lors relativement centraux au niveau du réseau ainsi formé. Pourtant lorsque nous éliminons tous les acteurs autres que la presse traditionnelle, ainsi que les agences et les magazines, ils éliminent peu de sites mais beaucoup de liens. Ainsi, l’élimination d’un seul type d’acteurs ne brisent pas la grande composante, sauf dans le cas des moteurs de recherche : 8 sites dont 3 quotidiens (indiens) seulement sont alors isolés. Et le fait de ne garder que les quotidiens n’éliminent en plus que 2 quotidiens canadiens, 1 musulman, 1 satirique et 2 régionaux. En somme, la presse traditionnelle demeure reliée en une grande composante. Et ce n’est alors pas tant la composante qui est réduite que le fait que l’orientation d’un tel réseau est relativement forte, et plutôt très intéressante. Nous en retirons 3 caractéristiques majeures. Figure 7. Le coeur de la presse traditionnelle33 . Premièrement, certains sites, et surtout des groupes de sites, s’avèrent isolés ou périphériques de la grande composante de la presse traditionnelle. Il s’agit plus particulièrement de la presse étrangère aux Etats-Unis, indienne, canadienne et australienne plus spécifiquement, laquelle est fortement lue par les lecteurs de la presse américaine, mais la réciproque n’est pas vérifiée. 33 En rouge les liens réciproques. Ne sont gardés que les sites des quotidiens exceptés les composantes isolés et périphériques. 24 Deuxièmement, les familles de la presse traditionnelle émergent relativement clairement : la presse nationale américaine d’un côté, la presse nationale anglaise d’un autre côté, toutes deux reliées via notamment la presse internationale et la presse financière ; et enfin la presse régionale constitue le groupe le plus important en nombre de sites. Et surtout il ressort la dichotomie entre une presse régionale citée qui ne citent pas et une presse nationale qui citent beaucoup et est moyennement citée. Troisièmement, la presse nationale américaine forme un véritable petit monde au coeur de la presse en ligne, et plus particulièrement les 5 sites du New York Times, de USA Today, du Wasington Post, du Los Angeles Times et du Chicago Tribune. Non seulement ces sites, considérés comme des références, citent nombre d’autres sites mais surtout ils se citent réciproquement, et les lecteurs peuvent passer de manière privilégier de l’un à l’autre. Une mention spéciale au New York Times qui est également fortement cités par la presse internationale et financière. En somme, à côté de l’apparente diversité de l’ensemble des sites, la focalisation sur la seule presse traditionnelle fait clairement ressortir une forte hiérarchie de la presse en ligne : les sites à très forte notoriété n’ont aucune difficulté à renvoyer de manière privilégiée leurs lecteurs chez les concurrents, alors que les sites plutôt régionaux cherchent à préserver leurs lecteurs, et surtout à réduire potentiellement les potentielles fuites vers les quotidiens nationaux. Et enfin, la diversité ne semble encore plus qu’apparente avec un ensemble de 5 sites, avec de fortes audiences et très fortement liées entre eux. Conclusion Notre étude ne s’est pas focalisée sur les modèles économiques, ou encore les types de sites web, développés par la presse traditionnelle. Elle s’est focalisée sur les 2/3 des lecteurs qui ne viennent pas directement sur la page d’accueil de la presse en ligne. Et elle a montré en la matière une véritable dichotomie entre d’où les lecteurs viennent et vers où les lecteurs repartent. Cette dichotomie nous suggère alors plusieurs tendances relativement importante dans le cadre du développement des sites web de la presse traditionnelle, et notamment l’intérêt très important de la présence du multimédia ainsi que du web collaboratif. La presse traditionnelle française semble encore avoir des difficultés à composer avec des nouveautés numériques34 (Rébillard 2006), même si certains sites s’en sortent relativement bien (Precepta 2007). La presse doit accorder plus d’intérêt au web collaboratif, lequel s’avère fortement pourvoyeur d’audience. Une autre tendance relativement forte semble être le fait que la presse traditionnelle use des liens hypertextes vers ce qu’elle ne considère pas comme ses concurrents : la presse financière, la presse 34 Nous n’avons pas parlé des Newsletter ou encore des flux RSS, lesquels permettent d’avoir une information personnalisée et livrée directement sans accès à la page d’accueil, voire même aux sites internet. 25 régionale et les services d’informations très locales. Par contre, elle ne semble pas allée dans le sens des sources multiples d’informations, alors même que les résultats suggèrent un intérêt non négligeable de la part des internautes. La poursuite de cette étude doit aller dans plusieurs directions : l’élargissement à un nombre de sites et de liens beaucoup plus élevé ; l’approfondissement à un ensemble de variables représentatifs du contenu des sites ; l’évolution temporelle par l’étude de la dynamique du réseau. Mais au-delà de ces quelques pistes, nous avons choisi de poursuivre avec notre échantillon afin d’étudier les déterminants de l’audience. En effet, à côté des déterminants individuels des contenus et de la visibilité d’un site, il s’agit également d’étudier l’impact sur l’audience des liens entrants et des liens sortants, ces derniers vont alors dans le sens : “Vous leur donnez une incitation à venir vers vous pour obtenir des informations d’eux” (Le Floch, Cariou et Le Guel 2008). Références Albert R., Jeong H. and Barabasi A-L. (1999) Diameter of the World-Wide Web, Nature 401: 130. Anderson C. (2006) The Long Tail. How endless choice is creating unlimited demand, Random House Business Books, London. Arrington Michael (2007) Wikipedia’s Huge Nerd Bias, TechCrunch 07.06.2007. Attias D. (2008) La presse sur Internet : quelles stratégies d’audience ?, In Greffe X. et Sonnac N. : 513-529. Barabasi A-L. (2003) Linked. How everything is connected to everything else and what it means for business, science and everyday life, A Plume Book, Cambridge. Borgatti S.P., Everett M.G. et Freeman L.C. (1999) Ucinet 6.0, Analytical Technologies. Broder A., Kumar R., Maghoul F., Raghavan P., Rajagopalan S., Stata R., Tomkins A. et Wiener J. (2000) Graph structure in the Web, Computer Networks 33: 309-320. Cardon D., Jeanne-Perrier V., Le Cam F. et Pélissier N. (2006) Présentation aux deux numéros spéciaux de Réseaux sur les Autopublications et les Blogs, Réseaux 137(24): 9-25. Dezso Z., Almaas E., Lukacs A., Racz B., Szakadat I. et Barabasi A-L. (2006) Dynamics of information access on the web, Physical Review E 73, 0066132: 1-6. Giles J. (2005) Internet Encyclopaedias Go Head to Head, Nature 438: 900-901. Greffe X. et Sonnac N., dir. (2008) Culture Web : création, contenus, économie numérique, Editions Dalloz, Paris. 26 Ineum Consulting (2006) Audiences et stratégies des acteurs en ligne face aux acteurs traditionnels du marché de la diffusion des contenus, Rapport pour la Direction du développement des médias, Décembre. Le Diberder A. (2008) User generated contents : retour aux sources ou révolution ?, In Greff X. et Sonnac N. : 49-59. Le Floch P. (2008) De la distribution physique à la distribution numérique : l’exemple de la presse, In Greffe X. et Sonnac N. : 247-259. Le Floch P., Cariou C. et Le Guel F. (2008) La presse en ligne : audiences, contenus et hyperliens, article #04, everydata lab, Décembre. Le Floch P. et Sonnac N. (2005) Economie de la presse, Editions La Découverte Repères, Paris. Levrel J. (2006) Wikipedia, un dispositif médiatique de publics participants, Réseaux 138(24) : 185-218. Newman M.E.J. (2003) The structure and function of complex networks, Society for Industrial and Applied Mathematics 45(2): 167-256. Precepta (2006) Les médias face à l’Internet, Rapport pour la Direction du développement des médias, Juin. Prieur C., Cardon D., Beuscart J-S., Pissard N. and Pons P. (2008) The Strength of Weak Cooperation: A Case Study on Flickr, Orange Labs Working Paper. Rébillard F. (2006) Du traitement de l’information à son retraitement : la publication de l’information journalistique sur l’internet, Réseaux 137(24): 29-68. Rosanvallon J. (2008) Comment mesure-t-on l’audience sur Internet ?, In Greffe X. et Sonnac N. : 181-182. Stern (2007) Wikipedia schlägt Brokhaus, Stern 05.12.2007. The Project for Excellence in Journalism (2008) Digital Journalism: The State of the News Media, An Annual Report on American Journalism. Tapscott D. et Williams A.D. (2008) Wikinomics: How Mass Collaboration Changes Everything, Atlantic Books, London. Tessier M. et Baffert M. (2007) La presse face au défi du numérique, Rapport au ministre de la Culture et de la Communication, février. Vedel T. (2008) Les blogs et la politique : la démocratie en kit ?, In Greffe X. et Sonnac N. : 61-77. Watts D.J. and Strogratz S.H. (1998) Collective dynamics of small-world networks, Nature 393: 440-442. 27 Annexe 1 : Les leaders de la presse en ligne selon Alexa rang 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 nom Yahoo! Google MSN AOL ABC / Disney BBC CNN New York Times The Weather Channel Reuters Guardian The Washington Post Fox The Times of India Drudge Report USA Today Times Wall Street Journal News Forbes Bloomberg Accu Weather Weather Undergroung Los Angeles Times Find Articles The Sidney Morning Herald Redtram The Huffington Post Reddit Time Business Week San Francisco Chronicle Malayala Manorama BSkyB National Geographic The Age Newsweek The Seattle Times New York Post Financial Times Topix Voice of America CBS Chicago Tribune domaine yahoo.com google.com msn.com aol.com go.com bbc.co.uk cnn.com nytimes.com weather.com reuters.com guardian.co.uk washingtonpost.com foxnews.com indiatimes.com drudgereport.com usatoday.com timesonline.co.uk wsj.com news.com.au forbes.com bloomberg.com accuweather.com wunderground.com latimes.com findarticles.com smh.com.au redtram.com huffingtonpost.com reddit.com time.com businessweek.com sfgate.com manoramaonline.com sky.com nationalgeographic.com theage.com.au newsweek.com nwsource.com nypost.com ft.com topix.com voanews.com cbsnews.com chicagotribune.com 28 audience 27,105 26,855 17,54 1,8645 1,387 1,3315 0,978 0,568 0,5325 0,246 0,1825 0,171 0,166 0,151 0,149 0,14 0,1255 0,1235 0,1205 0,118 0,116 0,112 0,1075 0,1025 0,101 0,0976 0,0954 0,0913 0,0883 0,0871 0,0801 0,0765 0,0744 0,073 0,0694 0,0632 0,0613 0,0592 0,0578 0,0574 0,0562 0,0548 0,0545 0,0531 type moteur moteur moteur moteur tv tv tv quotidien météo agence quotidien quotidien tv quotidien web 2.0 quotidien quotidien quotidien quotidien magazine agence météo météo quotidien web 2.0 quotidien web 2.0 web 2.0 web 2.0 magazine magazine quotidien quotidien tv magazine quotidien magazine quotidien quotidien quotidien web 2.0 tv tv quotidien 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 International Herald Tribunes Independant Media Center Fark The Houston Chronicle The Onion 43 Things MetaFilter CNBC The Toronto Star The Globe and Mail Digital Spy Associated Press Newsday Shutterstock Chicago Sun-Times Variety News Now Bankrate The Arizona Republic Press Release News Wire The Mercury News The Dallas Morning News Newsmax Islamic Republic News Agency The Atlantic Weather Bug Atlanta Journal Constitution PR Newswire Association Mediapost Communications Hindustan Times The Philadelphia Inquirer The San Diego Union Tribune The Baltimore Sun Mathrubhumi World Net Daily Dinakaran mental_floss The Miami Herald Star Tribune Newsvine Detroit Free Press U.S. News New Jersey On Line Corbis Corporation The Flint Journal iht.com indymedia.org fark.com chron.com theonion.com 43things.com metafilter.com cnbc.com thestar.com theglobeandmail.com digitalspy.co.uk ap.org newsday.com shutterstock.com suntimes.com variety.com newsnow.co.uk bankrate.com azcentral.com prweb.com mercurynews.com dallasnews.com newsmax.com irna.com theatlantic.com weatherbug.com ajc.com prnewswire.com mediapost.com hindustantimes.com philly.com signonsandiego.com baltimoresun.com mathrubhumi.com worldnetdaily.com dinakaran.com mentalfloss.com miamiherald.com startribune.com newsvine.com freep.com usnews.com nj.com corbis.com flintjournal.com 29 0,0504 0,0439 0,0414 0,0406 0,0402 0,0383 0,0368 0,0367 0,0364 0,0355 0,0347 0,0339 0,0316 0,0306 0,0305 0,0302 0,0297 0,0296 0,0294 0,0286 0,0283 0,0261 0,0243 0,024 0,0235 0,0228 0,0227 0,0223 0,0221 0,0217 0,0202 0,0201 0,0198 0,0197 0,0194 0,0188 0,0185 0,0184 0,0183 0,0173 0,0167 0,0166 0,0157 0,0155 0,0131 quotidien quotidien web 2.0 quotidien quotidien web 2.0 web 2.0 tv quotidien quotidien web 2.0 agence web 2.0 agence quotidien magazine web 2.0 web 2.0 quotidien web 2.0 quotidien quotidien magazine quotidien magazine météo quotidien agence agence quotidien quotidien quotidien quotidien quotidien quotidien quotidien magazine quotidien quotidien web 2.0 quotidien magazine quotidien agence quotidien Annexe 2 : Les leaders entrants de la presse en ligne selon Alexa rang 1 2 3 4 5 6 7 8 9 10 11 11 13 14 15 16 17 18 19 20 domaine wikipedia.org google.com xanga.com bbc.co.uk digg.com yahoo.com flickr.com wretch.cc sina.com.cn imdb.com google.co.uk fotolog.com google.co.jp baidu.com ebay.com youtube.com microsoft.com cnn.com hao123.com google.de liens 88 81 55 51 45 41 36 35 33 27 26 26 25 22 21 18 17 16 14 13 type web 2.0 moteur web 2.0 tv web 2.0 moteur web 2.0 web 2.0 moteur web 2.0 moteur web 2.0 moteur moteur commerce web 2.0 moteur tv moteur moteur Annexe 3 : Les leaders sortants de la presse en ligne selon Alexa rang domaine liens type 1 2 3 3 5 5 7 8 8 8 8 12 13 13 15 15 15 15 16 16 cnn.com usatoday.com nytimes.com washingtonpost.com latimes.com bbc.co.uk msnbc.com go.com reuters.com foxnews.com yahoo.com cbsnews.com abc.net.au google.com csmonitor.com ft.com ap.org guardian.co.uk soccernetwork.com forbes.com 34 23 18 18 16 16 13 12 12 12 12 10 9 9 8 8 8 8 7 7 tv quotidien quotidien quotidien quotidien tv tv tv agence tv moteur tv tv moteur quotidien quotidien agence quotidien tv magazine 30