| La guerre des données (1) : une introduction |
|
|
|
| Ecosystèmes - La guerre des données |
| Écrit par Damien Roussat |
| Samedi, 24 Octobre 2009 09:28 |
|
Qui aurait cru à une évolution si rapide et si riche d'Internet ? A la créativité apportée par le Web, cette myriade d'applications mise à disposition sur le réseau ? Aujourd'hui les médias en ligne orientés technos et les webzines spécialisés ne parlent plus que d'une chose : les données, et ce qu'on peut faire avec. Bien que le sujet grand public numéro 1 reste la "protection des données personnelles", de plus grandes menaces encore pèsent sur nos libertés. Envie d'un coup de paranoïa ? Découvrez les tenants et les aboutissants de "la guerre des données". (...)
L'histoire des ordinateurs et des logiciels n'est pas vieille. On est encore loin du siècle ! Pourtant, en moins de 50 ans, l'informatique a formidablement évolué. Je vous passe le discours nostalgique voir larmoyant sur un historique que tout le monde connaît déjà, IBM, Apple, Microsoft, la souris, Windows 3.1, Internet et compagnie. D'ailleurs, je n'étais pas né :)
Arrive la démocratisation d'Internet. Et les premiers sites Web grand public. Pour ces premiers, il s'agit de sites HTML (HyperText Markup Langage) statiques agrémentés d'images animées. Quelques moteurs de recherche existent déjà, je me souviens encore d'AltaVista ou des débuts de Yahoo. Très vite, l'importance de pouvoir afficher des pages dynamiquement s'impose (c'est-à-dire modérer l'affichage en fonction de critères spécifiques, comme des filtres ou des tris par exemple), et le PHP (HyperText PreProcessor) fait son apparition. Au même moment, le besoin de développer de meilleures techniques de graphismes pour ces sites apparait, et CSS (Cascading Style Sheet) émerge comme un futur standard du Web. HTML, qui entre temps évolue progressivement en XHTML (X pour eXtended), complète le trio qui fait de XHTML+PHP+CSS un standard pour la majorité des sites Web encore aujourd'hui. Bon, et alors ?
Pendant ce temps-là, l'oeuf Google éclot et entame sa croissance de géant. Doté d'un algorithme plus précis (= méthode d'indexation des pages Web), Google marche fort car la réponse qu'il fournit aux mots-clés cherchés est plus pertinente que ses concurrents d'alors. C'est parce qu'il est arrivé à fournir mieux la bonne réponse au bon moment que Google a été un énorme succès (qui s'est tranformé en succès économique avec sa publicité en ligne). Pendant ce temps-là, l'industrie du Web connaît une bulle spéculative qui chamboule ses acteurs, et le propulse vers une professionnalisation croissante. En parallèle, l'avancée de l'industrie du logiciel de bureau (ou d'entreprise, mais installé sur le bureau) suit son cours. Portée par de multiples besoins, elle se diversifie en terme de couverture sectorielle et métier. Des logiciels pour la santé, pour les restaurants, pour la défense, pour la finance, et bien d'autres encore. A cette période, les logiciels classiques (issus de technologies comme C++ ou Java) sont indépendants du Web (ils sont dits "stand alone"). Très vite pourtant, le succès et le potentiel d'Internet rattrape le monde du logiciel pour créer des technologies hybrides permettant, d'une part, la communication à distance entre des logiciels (notamment le modèle client-serveur, déjà pilier du fonctionnement du Web), puis le couplage technologies Web / logiciel classique permettant par exemple le traitement par l'un, et l'affichage par l'autre. Vous n'êtes pas perdu ?
J'ai oublié de mentionner que très vite, tous ces logiciels, Web ou non, ont fonctionné en relation étroite avec des bases de données. Concept développé dans les années 1970, la base de données dite "relationnelle" permet de représenter des données à stocker sous forme de tables (des listes de données) liées entre elle par des relations. A la conception, avant d'y insérer les premières données, on définit un "schéma" qui permet de modéliser notre représentation des données réelles que l'on souhaite stocker. Pour faire court, par exemple un logiciel de supermarché devra réfléchir à la façon de représenter les tickets de caisse, les produits, les stocks, etc... Et un produit a un code-barre, qui apparait sur le ticket, etc... Ces liens sont reproduits dans la base de données. Quelle importance me direz-vous ? Nous aurons l'occasion de le découvrir prochainement. A savoir qu'en entreprise des bases de données comme Oracle (ou Sybase, SQL Server) se sont imposées, et que sur le Web MySQL (et PostgreSQL) sont leaders. Le Web fourmille de références à ces noms si vous ne les connaissez pas, aussi ne détaillerais-je pas leur spécificité ici (ce n'est pas du tout l'objet de l'article !).
Il nous faut passer par ces préambules pour pouvoir arriver progressivement au coeur du sujet. Sinon, comment comprendre la subilité des enjeux en place ? Au milieu d'un jargon toujours plus fourni, les non-techniciens (et même les techniciens !) s'y perdent trop facilement.
La suite au prochain épisode ! |






