{"id":1698,"date":"2020-05-21T09:00:15","date_gmt":"2020-05-21T07:00:15","guid":{"rendered":"https:\/\/blog.talentoteca.es\/?p=1698"},"modified":"2020-05-21T11:13:06","modified_gmt":"2020-05-21T09:13:06","slug":"interfaces-de-voz-han-venido-para-quedarse","status":"publish","type":"post","link":"https:\/\/blog2.talentoteca.es\/blog\/interfaces-de-voz-han-venido-para-quedarse\/","title":{"rendered":"Las interfaces de voz: Han venido para quedarse"},"content":{"rendered":"\n<p>La ciencia ficci\u00f3n no ha ayudado al ser humano en la generaci\u00f3n de expectativas frente al uso de tecnolog\u00eda basada en Inteligencia Artificial. Numerosos son los ejemplos de ficci\u00f3n en los que podemos comunicarnos de manera fluida y natural con un sistema e, incluso, crear relaciones. Aunque la realidad dista a\u00fan mucho de la ficci\u00f3n, s\u00ed sabemos que las interfaces de voz han venido para quedarse.<\/p>\n\n\n\n<p>En la actualidad, las interfaces son tanto un canal de comunicaci\u00f3n con la tecnolog\u00eda, como sistemas que usan t\u00e9cnicas de \u201cInteligencia Artificial Conversacional\u201d. Las interfaces de voz como canal, suponen un cambio de paradigma, m\u00e1s all\u00e1 de las webs y las apps m\u00f3viles. Acercan servicios y productos a m\u00e1s personas y nos permiten establecer nuevas <strong>relaciones personalizadas en cualquier modo<\/strong> (texto, voz, visual), <strong>momento<\/strong> (en el coche, en casa) <strong>y situaci\u00f3n<\/strong> (mientras conduces o cocinas).&nbsp;<\/p>\n\n\n\n<p>Las m\u00e1s extendidas hoy viven en <strong>los asistentes virtuales de las grandes compa\u00f1\u00edas como Google<\/strong> (Google Assistant), <strong>Apple<\/strong> (Siri) <strong>o Amazon<\/strong> (Amazon Alexa).&nbsp; Algunos de estos asistentes nos permiten extender sus funcionalidades poniendo nuestros servicios a disposici\u00f3n de los usuarios de los asistentes. Pero tambi\u00e9n podemos crear nuestro propio asistente (como ha hecho Telef\u00f3nica con Aura) o a\u00f1adir voz a canales (web, m\u00f3vil) ya existentes.&nbsp;<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">\u00bfEs &#8220;inteligente&#8221; un asistente de voz?<\/h4>\n\n\n\n<p>Otro tema es l<strong>a \u201cinteligencia\u201d de una interfaz de voz.<\/strong> Si analizamos qu\u00e9 pasos realiza esta para entendernos y respondernos, vemos que requiere de algoritmos creados para realizar cinco tareas muy concretas y complejas: reconocer nuestra voz (ASR) y transcribirla, entender la sem\u00e1ntica de nuestra frase (NLU), decidir qu\u00e9 acci\u00f3n realizar en base al contexto de la conversaci\u00f3n y quienes somos (DM), generar una respuesta textual (RG) y, por \u00faltimo, sintetizar esta respuesta textual a una respuesta por voz (TTS).&nbsp;<\/p>\n\n\n\n<div class=\"wp-block-image\"><figure class=\"aligncenter is-resized\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/blog.talentoteca.es\/wp-content\/uploads\/2020\/05\/Imagen-1.png\" alt=\"Interfaces de voz\" class=\"wp-image-1750\" width=\"395\" height=\"229\" srcset=\"https:\/\/blog2.talentoteca.es\/blog\/wp-content\/uploads\/2020\/05\/Imagen-1.png 436w, https:\/\/blog2.talentoteca.es\/blog\/wp-content\/uploads\/2020\/05\/Imagen-1-300x174.png 300w\" sizes=\"auto, (max-width: 395px) 100vw, 395px\" \/><figcaption>@nieves_as<\/figcaption><\/figure><\/div>\n\n\n\n<p>Las tareas son complejas y se pueden dar problemas que resulten en un \u201cfallo\u201d. El ejemplo m\u00e1s claro se da con el ruido. Imaginaos lo dif\u00edcil que ser\u00e1 para una interfaz de voz reconocer lo que decimos si hay ruido. Tambi\u00e9n puede haber problemas de comprensi\u00f3n, p\u00e9rdidas de contexto, etc. Las interfaces de voz son hoy sistemas que han de recuperarse frente a este tipo de fallos del proceso para hacer que el usuario cumpla su objetivo a trav\u00e9s de la conversaci\u00f3n.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">\u00bfC\u00f3mo ser\u00e1n ma\u00f1ana?<\/h4>\n\n\n\n<p>La tecnolog\u00eda avanza muy r\u00e1pido lo que nos permite mejorar la manera de obtener algoritmos y modelos de los que usa una interfaz. Estos avances van encaminados a hacer de las interfaces algo mucho m\u00e1s natural e intuitivo para que el usuario no tenga que aprender a comunicarse con la interfaz.&nbsp;<\/p>\n\n\n\n<p>Por ejemplo, asistentes capaces de entender preguntas encadenadas (<em>\u00bfqui\u00e9n fue Leonardo da Vinci?.. \u00bfy d\u00f3nde naci\u00f3?<\/em>), utilizar voces naturales (como la de un reportero de noticias, o la de Samuel L. Jackson), expresar emociones o efectos como susurros en la voz (e incluso entenderlos), permitirnos pedir varias cosas en una misma petici\u00f3n y personalizar la experiencia para cada usuario.&nbsp;<\/p>\n\n\n\n<p><strong>Vamos hacia un futuro cercano<\/strong> donde Alexa encadenar\u00e1 diferentes aplicaciones para ayudarnos a planear una noche de cine y restaurante. Donde Google nos ayudar\u00e1 con las citas de restaurantes y peluquer\u00edas, haciendo de intermediario entre el local y nosotros. Donde podremos interactuar por voz en otras realidades (virtual, mixta y aumentada). Donde tendremos asistentes personales.<\/p>\n\n\n\n<p>No se si el futuro ser\u00e1 como lo que hemos visto en la ciencia ficci\u00f3n, lo que s\u00ed s\u00e9 es que las interfaces de voz han venido para quedarse.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Nieves \u00c1balos, fundadora y Chief Productor Officer en Monoceros Labs, nos cuenta c\u00f3mo las interfaces de voz han venido para quedarse.<\/p>\n","protected":false},"author":38,"featured_media":1702,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"om_disable_all_campaigns":false,"_exactmetrics_skip_tracking":false,"_exactmetrics_sitenote_active":false,"_exactmetrics_sitenote_note":"","_exactmetrics_sitenote_category":0,"_uf_show_specific_survey":0,"_uf_disable_surveys":false,"footnotes":""},"categories":[104],"tags":[],"class_list":["post-1698","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-actualidad-profesional"],"aioseo_notices":[],"wps_subtitle":"","_links":{"self":[{"href":"https:\/\/blog2.talentoteca.es\/blog\/wp-json\/wp\/v2\/posts\/1698","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blog2.talentoteca.es\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blog2.talentoteca.es\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blog2.talentoteca.es\/blog\/wp-json\/wp\/v2\/users\/38"}],"replies":[{"embeddable":true,"href":"https:\/\/blog2.talentoteca.es\/blog\/wp-json\/wp\/v2\/comments?post=1698"}],"version-history":[{"count":6,"href":"https:\/\/blog2.talentoteca.es\/blog\/wp-json\/wp\/v2\/posts\/1698\/revisions"}],"predecessor-version":[{"id":1751,"href":"https:\/\/blog2.talentoteca.es\/blog\/wp-json\/wp\/v2\/posts\/1698\/revisions\/1751"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/blog2.talentoteca.es\/blog\/wp-json\/wp\/v2\/media\/1702"}],"wp:attachment":[{"href":"https:\/\/blog2.talentoteca.es\/blog\/wp-json\/wp\/v2\/media?parent=1698"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blog2.talentoteca.es\/blog\/wp-json\/wp\/v2\/categories?post=1698"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blog2.talentoteca.es\/blog\/wp-json\/wp\/v2\/tags?post=1698"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}