Où le « moteur de connaissances » de Wolfram peut avoir l'avantage

Ce lundi, j'ai eu la chance de rencontrer des chercheurs de Wolfram Research, à Champaign, IL, qui mettent frénétiquement la touche finale à Wolfram Alpha , le nouveau moteur de connaissance informatique du physicien Stephen Wolfram .





Ce moteur est censé être mis en service dans deux ou trois semaines ; avec lui, vous pourrez entrer GDP Germany Japan et obtenir non pas une liste de pages Web, mais des graphiques comparatifs sur la production économique de ces deux pays. Ou vous pouvez entrer GATACTTCA et trouver les taches sur le génome humain où cette séquence apparaît.

Tout le monde chez Wolfram Research a caractérisé le nouveau moteur comme quelque chose de complémentaire à, et non en concurrence avec, Google. (En bref : Google utilise des moyens élaborés pour vous trouver les bonnes pages Web, tandis que Wolfram amasse des bases de données et déploie une myriade d'équations pour calculer les réponses pour vous.)

Mais cette dynamique pacifique a changé hier quand Google a annoncé un service de traitement de données à part entière, alors même que Wolfram donnait un démo de son nouvel outil au Berkman Center for Internet and Society de Harvard . Avec le nouveau service Google - qui démarre de manière limitée, avec des données du recensement et du Bureau of Labor Statistics des États-Unis - vous pouvez faire des choses comme entrer le chômage à New York et obtenir un graphique historique de ce taux, et cliquer pour comparer le taux des autres États et des États-Unis



Wolfram m'a dit la semaine dernière que le cofondateur de Google, Sergey Brin, fait partie des titans de la technologie pour lesquels il a personnellement fait la démonstration d'Alpha. Nous ne saurons peut-être jamais si cela a conduit à des exhortations internes de Brin ; Google a déclaré hier que sa technologie provenait de l'acquisition par Google en 2007 de Analyseur de tendance . Mais il semble clair qu'une nouvelle guerre de recherche est en cours : pour commander des données structurées et organiser des données à partir de nouvelles sources pour les rendre plus utiles aux chercheurs.

Disons que vous voulez connaître les informations caloriques et nutritionnelles d'une recette que vous préparez pour votre famille. Si vous entrez 2 tasses de farine, 2 œufs, 2 tasses de lait dans Wolfram Alpha, cela vous donnera une étiquette nutritionnelle qui reflète les valeurs combinées de ces aliments (après vous avoir d'abord demandé de spécifier lequel des différents types de lait vous utilisez) . Et si une normalisation des unités était nécessaire, elle l'aura déjà fait. Si vous entrez des termes de recherche similaires dans Google, vous obtiendrez une liste de recettes et de sites Web sur la nutrition. Utile, certes, mais à vous de faire défiler pour trouver les bonnes données, puis de sortir la calculatrice. C'est un exemple aussi bon que n'importe quelle valeur potentielle de Wolfram Alpha, en supposant que le lancement se passe bien. Mais cela ne veut pas dire que Google n'exploitera pas les mêmes bases de données du département américain de l'Agriculture et proposera quelque chose de similaire.

Alors, Google sera-t-il en mesure d'égaler la spécialité de Wolfram ? Dans les cabines Wolfram Alpha, des dizaines de personnes s'efforcent de préparer des milliers d'ensembles de données et travaillent sur des problèmes tels que déterminer laquelle des nombreuses significations du boisseau un utilisateur pourrait rechercher. Ils saisissent des informations sur les motifs de carrelage et le tableau périodique des éléments. Ce sont les mêmes personnes qui développent Wolfram's Mathématique logiciel, qui est généralement considéré comme l'outil logiciel de mathématiques et de sciences le plus complet qui existe.



Voici comment le cofondateur de Wolfram, Theodore Gray, m'a dit : Une partie du défi consistait à trouver l'éventail de personnes capables de couvrir ces choses jusqu'au niveau de détail nécessaire. La société de logiciels moyenne n'a pas l'étendue et la profondeur des personnes pour être en mesure de couvrir le sujet. Les sociétés de logiciels auront un tas de majors CS [informatique]. Ils ne connaissent pas la chimie, la physique, les matériaux, l'économie, la science alimentaire – tous les petits domaines différents.

Que cela se traduise par un outil utilisable et un modèle commercial évolutif est une autre question. Le succès dépendra également de l'utilité de l'interface en langage naturel de Wolfram, que ses chercheurs personnalisent. Nous en saurons plus après le lancement.

Mais du côté de Google, le succès dépendra également de l'étendue et de la profondeur de ses fonctionnalités de recherche de données. Comme Google lui-même l'a dit dans son 2007 article de blog annoncer l'acquisition de Trendalyzer, Recueillir des données et créer des statistiques utiles est un travail ardu qui passe souvent inaperçu. Et jusqu'à présent, Google limite ses nouveaux efforts pour saisir des données publiques, qui incluent des statistiques sur les prix des cookies, les émissions de CO2, la fréquence de l'asthme, les taux d'obtention du diplôme d'études secondaires, les salaires des boulangers, le nombre d'incendies de forêt, et la liste est longue.



Wolfram dit qu'il octroie également des licences à des sources privées, et il m'a dit la semaine dernière qu'il n'était pas intéressé par la vente d'Alpha : j'aime construire des trucs. Avec Mathematica, je suis actuellement en année 23. Ce projet sera également un projet de plusieurs décennies, et je vais faire ce projet. Je ne l'ai pas fait pour le retourner.

Restez à l'écoute.

cacher