Mot-clé - Commande vocale

Fil des billets

dimanche 20 avril 2014

Apple, Google... et Amazon. Pourquoi la voix (et le contrôle vocal des devices) est "the next big thing"

04666700-photo-apple-iphone-4s-siri-shot-1.jpg

"Voix, j'ai besoin de shampoing Klorane, du gel douche habituel, de ma crème de jour Avène, et d'une nouvelle pierre ponce". Demain, vous clamerez cela en sortant de la douche, (presque) en retard avant de partir au boulot, pour être sûr que la commande soit passée le jour même auprès de ce géant du e-commerce où vous faites désormais presque toutes vos courses domestiques. Science-fiction ? Cela aura lieu dans un futur proche. En ce moment, je suis un peu obsédée par les récits d'anticipation, comme celui-ci que j'ai écrit pour Stratégies, où, pour notre numéro spécial Innovation et objets connectés, j'ai imaginé "24 heures dans la vie ordinaire d'un homme connecté" (donc entouré d'objets connectés) en 2025 (l'article est encore en accès abonnés me semble-t-il, sorry d'avance si, simple non-abonné ;) vous butez sur cet obstacle à la lecture).

La dernière annonce par Amazon, il y a quelques jours, est une petite bombe. Le géant tentaculaire du e-commerce a annoncé le lancement de Amazon Dash, un petit appareil aux allures de télécommande, qui combine un scanner de code-barres, un micro et un haut-parleur : un outil vertigineux pour le shopping. Concrètement, il vous suffit de scanner un produit pour le commander. Mais, comme le relate Wired dans cet excellent article, la réelle killer app de Dash réside dans son option Voix: dites à voix haute ce que vous voulez et Dash intègrera l'article dans votre chariot virtuel. Dash compile les éléments à acheter (pain, lessive...) dictés ou scannés et conçoit une liste de courses à valider depuis un équipement connecté (smartphone, tablette ou PC). Certes, l'outil est réservé pour l'instant aux clients de son supermarché en ligne AmazonFresh, seulement dans le sud de la Californie, à San Francisco (terres d'élection des geeks) et à Seattle (là où est le siège social d'Amazon). Mais il révolutionne la manière d'acheter en ligne - et l'avenir du e-commerce. Mais aussi, notre mode d'interaction avec ces appareils high-tech de plus en plus omniprésents.

Wired cite également cette étude (voir aussi ce billet par son analyste) publiée il y a quelques jours par Forrester Research, qui parie sur le potentiel des interfaces commandées par la voix, qui vont nous permettre d'interagir - de plus en plus - avec nos appareils électroniques. Après tout, on y est déjà un peu : comme j'en parlais dans cette enquête il y a (déjà !) deux ans, par la grâce de l'intelligence artificielle, on peut déjà piloter certains outils par la voix.

5162_cortana-le-futur-siri-de-microsoft-inspire-d-un-personnage-de-halo.jpg

Cortana, personnage de "Halo" et OS intelligent de Microsoft

La première innovation de rupture, fin 2011, avait résidé dans L' iPhone et Siri, son assistant personnel à commande vocale, ou encore la Kinect de Microsoft pilotable à la voix et au geste... Tout comme les Google glass sont pilotables par la voix. Et Microsoft, à son tour, vient tout juste de lancer son assistant vocal, Cortana. Le nom de l'assistant, en tout cas, devrait ravir les fans de Halo, le jeu de devenu propriété de la firme de Redmond. Cortana est le nom d'un personnage de la série. Caractéristique : l'OS Cortana est une intelligence artificielle qui sait "apprendre".

Siri est une semi-déception: encore trop imparfait, trop étrange (vous vous voyez donner des ordres à Siri dans le métro ?), il est peu entré dans les usages, tout comme Google et le récent Cortana. Ils demeurent des nouveautés, plutôt que des vrais outils. Mais avec le nouveau joujou d'Amazon, la commande vocale est rattachée à quelque chose de potentiellement addictif : le shopping. Le shopping va entraîner les consommateurs à utiliser la voix plutôt que les écrans parce qu'il offre un usage accessible, facile, dit en substance McQuirey. Au passage, la voix offre à Amazon - et au consommateur - un pipeline encore plus direct (et compulsif) que tout téléphone ou appli mobile ne le pourrait.

On imagine les promesses pour les marques et les e-commerçants : Voix et toutes les interfaces vocales du futur seront ainsi connectées à notre voix - soit nos émotions. Par la voix, les ordinateurs du futur pourront comprendre la sémantique du discours humain.

Et ce n'est que le début : au-delà de Siri, pour l'analyste James McQuivey, bientôt, nous aurons un microphone dans chaque pièce de nos maisons. L'interface vocale (baptisée "Vox" par Forrester) nous permettra d'interagir avec nos appareils par la voix. Dans la lignée de ce que préfigure Dash, nous aurons des micros connectés (25 dollars pièce maximum) dans la maison qui libèreront le contrôle vocal de tout device. A la différence de Siri, les plateformes de contrôle vocal de demain seront branchées en permanence: elles écouteront en permanence. "Bien meilleur marché que placer des caméras ou d'autres détecteurs dans la maison, les micros peuvent faire beaucoup d choses: identifier qui est dans la maison, si tout le monde va bien, en plus de fournir un accès vocal à la commande de vos appareils où que vous soyiez", imagine-t-il.

Paradoxalement, dans notre vie numérique, la voix, la commande vocale, prendra bientôt de plus en plus de place. Après tout, on voit déjà bon nombre de personnes sembler parler à elles-mêmes dans la rue ou les transports en commun, parfois les yeux rivés sur l'écran de leur smartphone, jusqu'à ce que l'on comprenne, avec leurs discrets écouteurs blancs, qu'elles sont en train de téléphoner... J'en parlais déjà dans ce billet, le film (dystopie?) d'anticipation de Spike Jonze, Her, imagine un monde où les gens (très) seuls conversent avec leurs OS dotés d'intelligence artificielle hyper élaborés. Au passage, comme dans d'autres films de science-fiction (comme IA de Steven Spielberg), dans ce film, les ordinateurs ne se pilotent plus par des claviers ou des souris, mais par les gestes et par la voix.

Il y a déjà le géant américain Nuance qui travaille sur des assistants vocaux. Et le puissant consortium américain Hypervoice, qui s'intéresse "au futur de la voix". Tout comme les Français Acapela Group, Voxygen, Creawavestudios...

dimanche 12 février 2012

"Siri (Angie/ Vlingo), commande-moi une pizza..."

dave-2001-space-odyssey-hal-9000-sad-hill-news.jpg

Zapper d'une chaîne à l'autre sur son téléviseur, lancer une recherche de fichier Word sur son ordinateur, émettre un appel, dicter et envoyer un e-mail, commander une pizza... Juste par la voix, en quelque sorte en passant un ordre à son téléviseur, son ordinateur ou son smartphone, sans toucher un clavier ou même effleurer un écran. J'en parlais en fin d'année dernière, et en début d'année dans cette enquête pour Stratégies, la commande vocale est une des innovations les plus importantes de ces derniers mois, au point qu'elle pourrait révolutionner nos usages, notre rapport aux machines ces prochaines années. Une nouvelle révolution, après celle du tactile, initiée avec le premier iPhone, et du pilotage par la gestuelle, lancé avec la Kinect de Microsoft. Concrètement, elle permet de donner des instructions à une machine par la voix, étant parfois couplée à la reconnaissance de mouvements.

blade_runner.jpg

Le téléviseur à agrandisseur intégré piloté par commande vocale dans Blade Runner, Ridley Scott, 1982

Une technologie qui pourrait, à moyen terme, entraîner la disparition des claviers, télécommandes et joysticks, ces interfaces et outils qui permettent d'interagir avec une machine. Cette image de l'ordinateur sans clavier ni souris, fantasme classique des films de science-fiction (on en a une vision fugace dans Blade Runner de Ridley Scott, ou encore dans IA - Intelligence Artificielle de Steven Spielberg), pourrait bientôt devenir réalité...

C'est Apple qui a rendu désirable cette étrange pratique, avec une des dernières petites bombes (à retardement) concoctées par Steve Jobs avant son décès: Siri, implanté sur l'iPhone 4S en octobre dernier, qui permet à l'utilisateur de "dialoguer" en langage naturel – autrement dit par phrases entières – pour lui demander d'effectuer toutes sortes de tâches. Apple a rendu cette nouvelle pratique "désirable" auprès du consommateur lambda à forcé de spots publicitaires, mettant bien en scène, et de manière très rassurante, comment cet outil pouvait lui faciliter le quotidien.

Preuve que ce système de commande vocale se popularise - pour l'instant - sur ce segment très précis des smartphones, les autres constructeurs sont en train de dégainer, les uns après les autres, leurs propres applications de commande vocale, sur leurs AppStores. Certes, Google a tiré le premier, avant Apple, avec Vlingo pour Android, proposé en France en septembre dernier.

Google travaillerait sur un service Siri-like, sous le nom de code "Majel". L'éditeur de logiciels de reconnaissance vocale Nuance, qui a lancé en juillet 2011, aux US Dragon Go, une application pour iPhone dotée d'une technologie de recherche en langage naturel, annonçait fin décembre dernier le rachat de Vlingo. Enfin, la start-up française xBrainsoft, que j'évoque dans mon enquête, annonçait cette semaine aux TechDays de Microsoft le lancement de son propre assistant vocal, Angie, disponible sur le marketplace du Windows Phone. Un kit de développement permettra aux geeks développer leur propre agent conversationnel.

Du téléphone aux ordinateurs, téléviseurs et consoles de jeux, il n'y a qu'un pas. Côté jeux d'abord: depuis le 7 décembre dernier, une mise à jour de la Kinect de Microsoft permet de piloter la console de jeux Xbox 360 par la voix. Certes, cela reste aléatoire, il faut prononcer des mots-clés (titres de jeux, rubriques du menu...), impossible d'émettre une demande en langage naturel. Mais c'est déjà un début. La commande vocale pourrait aussi remplacer la télécommande des téléviseurs. Il se murmure que Steve Jobs en a équipé la future Apple TV, annoncée pour fin 2012. En janvier, le constructeur sud-coréen dévoilait au CES de Las Vegas une nouvelle version de sa télécommande LG Magic Motion, dotée d'un micro.

Par la même occasion, la société Vlingo annonçait elle aussi lancer cette année un assistant personnel à commande vocale pour téléviseur. "Vous pouvez commander votre téléviseur, votre décodeur ou votre câble, tout en restant assis sur votre canapé, avec le simple contrôle de votre voix. Votre télé vous répondra avec son programme d'assistance vocale virtuelle: demandez ce que vous voulez et l'assitant cherchera ce que vous souhaitez. C'est comme le Siri d'Apple mais en mieux, pour votre téléviseur", expliquait alors Chris Barnett, vice-président de la start-up, annonçant des partenariats avec plusieurs constructeurs.

La semaine dernière encore, c'est le sud-coréen Sansung qui annonçait le lancement d'une nouvelle télécommande de Samsung (elle n'apparaîtra qu'avec les Smart TV qui sortiront dans le courant de l'année) à commande vocale.

RENOIR

Nao / Aldebaran Robotics

Bien sûr, rien ne dit que cette innovation de rupture entrera dans les usages. C'est socialement assez incongru de parler à son téléphone en permanence - imaginez la scène de chacun donnant des ordres à son téléphone dans le métro... Mais le phénomène est troublant. C'est la première fois que des constructeurs industrialisent des procédés permettant de donner des ordres à une machine, voire d'interagir avec elle. Ce sont les premières interfaces dotées d'intelligence artificielle - des capacités intellectuelles comparables à celles des êtres humains, telles que la mémorisation, l'apprentissage, et la capacité à imiter certains comportements humains. Une brèche est ouverte...

jeudi 22 décembre 2011

7 tendances technologiques, innovations so 2012 (et au-delà...)

En cette fin d'année, on n'échappe pas aux best-of, bêtisiers et autres rétrospectives. En technologies, on a l'impression que tout va toujours plus vite, une tendance, un produit chasse l'autre - le netbook serait déjà en voie de devenir ''out''. Même si une innovation de rupture ne s'impose pas toujours dans le temps, puisqu'elle ne trouve sa raison d'être que lorsqu'elle entre dans les usages.

On a vu cette année se confirmer un fait inédit: les produits technologiques sont un des rares secteurs technologiques en croissance continue, dopé par l’attrait du même grand public pour des joujoux pointus : Microsoft avec sa Kinect (et Nintendo avec sa Wii) ont élargi leur public-au-delà des gamers, Apple a rendu utiles des gadgets, de l'iPhone à l'iPad... Des produits simples, d'usage intuitif, qui rendent l'innovation technologique moins effrayante, on parle alors d'affordance. Quelles innovations technologiques, quels usages vont s'imposer en 2012 - voire au-delà ?

Après le tactile, la révolution de la commande vocale

On a connu la révolution du tactile, que préfigurait la table Microsoft Surface, popularisée par Apple avec l'iPhone. L'an dernier, Microsoft a instauré la commande gestuelle avec la Kinect, et pour la première fois, la possibilité d'interagir avec des contenus par le geste, à distance. Les usages pourraient s'étendre au-delà du jeu vidéo vidéo: jusqu'à la musique, au secteur médical... Comme il montrait dans ce spot TV prospectif diffusé fin novembre.

Cette année, on a vu apparaître le premier assistant vocal, qui obéit à la voix... Siri, intégré à l'iPhone 4S, sorti en novembre dernier, permet à l'utilisateur de "dialoguer" avec l'iPhone, en langage naturel, pour lui demander par exemple le temps qu'il fait à tel endroit, de noter un rendez-vous demain à 15h, ou d'envoyer un SMS ou un mail dicté à un de ses contacts. Le téléphone fournit une réponse orale et écrite, et exécute les ordres. 2videmment, des précedents existaient, mais - c'est bien là le génie d'Apple - il a rendu cette technologie "désirable", concrète, auprès du grand public, comme le soulignait ce papier de L'Expansion.

La bataille des assistants vocaux pourrait bien s'ouvrir en 2012: cette semaine, le géant Nuance (éditeur de l'app' Dragon Notes) a annoncé le rachat de Vlingo... la principale solution concurrente de Siri, qui existe sous Android. Google préparerait lui aussi une solution concurrente, Majel. Plusieurs start-ups, dont en France, préparent aussi des Siri-like. J'y reviendrai bientôt, ici et ailleurs ;) La rumeur court à toute vitesse sur le Net, Siri serait implémenté sur la première TV d'Apple, la future iTV. Le pilotage vocal à distance, grand fantasme des films de science-fiction, pourrait bientôt entrer dans les usages.

Frontières brouillées entre mondes mobile et numérique

Les perspectives sont assez vertigineuses, dans un univers où le mobile devient une passerelle entre le monde réel et le monde numérique, et au consommateur d'interagir avec son environnement direct, comme le souligne Thomas Husson, de Forrester, dans cette très bonne tribune.

Il faut s'attendre à de plus en plus de campagnes autour des code-barres mobiles et de la réalité augmentée (avec toujours autant de "hype" pour une technologie qui mettra plusieurs années à voir le jour). Le NFC s'inscrit dans cette tendance et va enfin décoller avec plusieurs dizaines de millions de terminaux vendus en 2011. Le marché français devrait atteindre environ le million de terminaux d'ici la fin de l'année mais il y a encore fort à faire pour inscrire les usages dans le quotidien... (...)

La notion même de "mobilité" évolue. Sans rouvrir le débat "les tablettes sont-elles vraiment mobiles?", il n'y a pas de doute que la floraison de tablettes annoncées à Las Vegas et la multiplication des terminaux connectés brouillent les frontières traditionnelles entre les environnements PC et mobiles. La différence majeure est que seules les téléphones se vendent par centaines de millions et tiennent dans la poche de leurs utilisateurs.

La biométrie, une norme...

une_owni.jpg

Une d'Owni, vendredi 23 décembre

Après plusieurs années de bataille, un premier projet (du doux nom d'"Ines", Indentité nationale sécurisée) lancé en 2003, rétorqué entre autres par le Forum des droits sur l'Internet en 2005, la carte d'identité biométrique va voir le jour en 2012. Et instaurer la lecture de nos empreintes digitales (voire plus...) comme élément d'identification.

L'Assemblée nationale a adopté, la nuit du mardi 13 au mercredi 14 décembre, la proposition de loi "contre l'usurpation d'identité", déposée par les sénateurs UMP Jean-René Lecerf et Michel Houel, qui instaure la carte d'identité biométrique. Dotée de deux puces électroniques, l'une contiendra les données sur l'identité (état civil, empreintes digitales, photographie...), l'autre, facultative, servira de signature électronique sur Internet pour des échanges commerciaux et administratifs. Un article restait en débat: quelle architecture donner au fichier centralisé qui recueillera les éléments d'état civil et les données biométriques? La Cnil (Commission nationale de l'informatique et des libertés) avait récemment émis un avis d'alerte sur le stockage des données en un seul et même fichier géant.

... Et la vie privée, un luxe

lLes médias sociaux: jamais on y a autant partagé d'éléments de sa vie privée – et accepté de céder l'utilisation de nos données personnelles aux entreprises. Même si on a l'impression d'être dans des espaces protégés, où l'on partage des contenus avec des cercles d'amis, tels les «cercles» de Google+. Facebook, Twitter et YouTube permettent de partager en un clic un texte ou une vidéo avec les internautes. Et de rendre publique l'info la plus intime, puis la médiatiser.

Cela est vrai, pour l'instant, pour les people. Mais il est déjà possible de retransmettre en direct, de partager. Précurseur, Jacques Attali l'écrivait il y a quelques années sur son blog : à ses yeux, la vie privée, l'intimité et l'anonymat seront un luxe qu'il faudra payer pour conserver. Déjà, des nettoyeurs du Net" proposent leurs services payants pour purger vos traces numériques, référencées sur des moteurs de recherche comme Google.

"Bioluddisme"

Ce néologisme, apparu dans le roman de science-fictionGoogle Démocratie, met en scène un nouveau combat, celui des "bioluddistes" opposés au tout-technologique. "Nous serons tellement submergés par les technologies qu'il y aura forcément des clivages entre pro et antitechno", m"expliquait David Angevin, son o-auteur. Aujourd'hui, l'impact éventuel sur la santé des ondes émises par les téléphones mobiles et les réseaux Wifi est devenu le cheval de bataille d'associations comme Robins des toits.

Des particuliers "électrosensible"» aux ondes, regroupés au sein de l'association Une terre pour les EHS (électrohypersensibilité), demandent la création de "zones blanches", des portions de territoire non exposées. Le 6 mai 2011, le Conseil de l'Europe adoptait une résolution en ce sens. Une première.

3D or not ?

Avatar avait, semble-t-il, installé la 3D au cinéma. Cette année, Steven Spielberg s'y est mis pour sortir son adaptation de Tintin, en version blockbuster familial. Martin Scorsese vient de sortir Hugo Cabret, magnifique récit couleurs sépia qui remonte jusque Louis Lumière... Mais la 3D va-t-elle s'imposer durablement sur les écrans, grands et petits ? Le sujet a fait débat cette année, entre les résultats mitigés de films à gros budgets, des adaptations trop rapides de films en 3D... Ce qui n'empêche pas certains de ressortir leurs succès d'antan en 3D: vous n'échapperez pas à la Saga Star Wars en 3D, qui ressort en salles à partir de février 2012.

Et, dans les foyers, les équipements 3D (téléviseurs, camescopes, premiers smartphones...) à écrans 3D ne séduisent que quelques initiés. Mais une fois encore, l'industrie du X pourrait venir au secours de la 3D : Canal+ va diffuser, courant janvier, une production Marc Dorcel en 3D (à titre de test".

Toujours plus social...

Quels sont les premiers réseaux sociaux ? Facebook bien sûr... Mais aussi Instagram (15 millions de membres), à première vue simple appli iPhone qui permet de donner une touche vinage à ses photos, et réseau social - lequel a pour particularité de ne rassembler que des utilisateurs d'iPhone. Pas sûr que les réseaux sociaux vous se multiplier, mais ils vont se concentrer par usages: réseaux sociaux généralistes (Facebook), de microblogging - où le partage en temps réel d'infos prime sur une utilisation de plus en plus complexe d'un Facebook (Tumblr, qui a connu un retour en force cette année, Twitter, autre grand gagnant de 2011, qui s'est imposé auprès des médias lors de l'affaire DSK), professionnels (LinkedIn, Viadeo)...