Mot-clé - web sémantique

Fil des billets

mercredi 11 mars 2009

Microsoft + Science Commons = du contenu sémantique pour la science en ligne

Que voilà une bonne nouvelle. Lu via le fil Twitter de Tim Or'Reilly, Microsoft et l'équipe de Science Commons s'apprêtent à ajouter du contenu sémantique à la science en ligne.

Comme je l'expliquais dans cet article de 2005 pour Les Echos, le régime Science Commons, ouvert en France en janvier 2005, est important pour favoriser la publication scientifique en accès ouvert sur la Toile : il fournit aux chercheurs un cadre plus adapté pour leurs publications, en leur proposant des modèles de licence pour la publication d'un même article dans plusieurs revues, des modèles juridiques pour l'édition commerciale en libre accès et des licences ouvertes. C'est une déclinaison des licences Creative Commons (qui protègent d'ailleurs les écrits de mon blog), qui permettent de copier et de redistribuer les contenus et de les exploiter commercialement sans rétribuer son auteur si celui-ci ne l'interdit pas.

Or, comme il l'indique sur son blog, John Wilbanks, de Creative Commons, lui a annoncé que Licrosoft allait réaliser, sous une licence open source, des applications Word qui permettraient aux scientifiques de préparer leurs articles directement avec des entités scientifiques. Plus précisément ,

"The scientific culture is not one, traditionally, where you have hyperlinks," Wilbanks told us. "You have citations. And you don't want to do cross-references of hyperlinks between papers, you want to do links directly to the gene sequences in the database." Wilbanks says that Science Commons has been working for several years to build up a library of these scientific entities. "What Microsoft has done is to build plugins that work essentially the same way you'd use spell check, they can check for the words in their paper that have hyperlinks in our open knowledge base, and then mark them up."

En gros, cela permettra aux chercheurs d'ajouter facilement des hyperliens persistants dans leurs articles. A suivre...

mercredi 2 juillet 2008

Powerset racheté par Miccrosoft

Je parlais récemment du développement prometteur des moteurs de recherche basés sur le web sémantique. Un marché qui a connu un coup d'accélérateur dernièrement avec le lancement de la version publique de Powerset.

Or, on apprend ce matin dans ce billet de Techcrunch que Powerset (un moteur de recherche pour Wikipedia, et qui inclut la base de données Freebase) est racheté par Microsoft__ - une rumeur qui circulait depuis un certain temps dans la Silicon Valley, à vrai dire.

J'étais assez sceptique dans mon article des Echos sur le caractère réellement sémantique de Powerset, et de l'avancée réelle de ces moteurs de recherche, ce qui avait d'ailleurs provoqué l'ire de certains blogueurs spécialisés sur le sujet. En tous cas, Microsoft qui y travaille, toue comme, très certainement, Yahoo ! et Google, c'est à suivre de près...

jeudi 5 juin 2008

Ces moteurs de recherche qui préfigurent le Web sémantique (Les Echos)

Pour chercher avec pertinence, le Web sémantique oeuvre sur l'accessibilité des documents du réseau. Si derrière l'expression se cachent des enjeux importants et peut-être une évolution majeure de l'Internet, aujourd'hui, le « Web sémantique » constitue encore une incantation... A l'image de Powerset, en fait un moteur de recherche en langage naturel, basé sur Wikipedia. J'y ai consacré une enquête parue dans Les Echos d'aujourd'hui, consultable (en accès libre à partir de demain), avec aussi ce focus sur l'état de la recherche européenne sur le sujet.