Ricardo Baeza-Yates: las fronteras de la Search Technology

El universo de tecnologías de  búsqueda en la red es el centro de la ingente e innovadora actividad científica y tecnológica que lidera dirigiendo los Yahoo! Research Labs de Barcelona, Santiago de Chile y Haifa.

El chileno Ricardo Baeza-Yates, es científico de la computación y Vicepresidente de Investigación para Europa y Latinoamérica de Yahoo! Research y su vida profesional navega constantemente entre estos tres lugares del planeta y la primera avenida de Sunnyvale, justo en el extremo sur de la Bahía de San Francisco en California, que es donde tiene su cuartel general Yahoo!, la exitosa compañía basada en Internet que fundaron en enero de 1994, dos estudiantes de postgrado de la Universidad de Stanford, Jerry Yang y David Filo.

Ricardo Baeza-Yates, en Valencia (Foto: Adolfo Plasencia)

Nos hemos encontrado en Valencia y no nos veíamos físicamente desde la gran Conferencia WWW2009 del XX Aniversario de la Web. Rápidamente actualizamos detalles. Iremos de lo general a lo particular.

Le pregunto si, en su opinión, hay un antes y después de Internet para la humanidad. “Ahora es, -contesta-, con la 2.0, la segunda versión de la Web, cuando todo el mundo tiene la posibilidad de aportar su contenido a la red. Yo creo que el de la Web 2.0 es un término válido. Y aún mas interesante es la Web 3.0 que podría ser el cómo aprovechar lo que la gente hace en la Internet para construir la Web del futuro, que sería una meta-Web. Para hacerse una idea de lo que Internet significa para la humanidad, la imprenta sería una buena metáfora, porque permitió difundir el conocimiento en su época a través del papel. Eso ahora lo tenemos mucho mas aumentado con la Web. La imprenta permitió que algunos publicaran. La Web permite que todos los que están conectados publiquen. Y ya estamos hablando de un tercio de la humanidad. Eso es fundamental”. Como es un científico informático, le pregunto si él cree que la revolución digital es horizontal, es decir, si afecta a todo tipo de actividad intelectual humana.“Sí , -afirma rotundo-, de hecho cuando estaban inventando Internet no se proponía inventar lo que hoy conocemos por Internet, sino resolver algunos problemas quizá mas pedestres, como el del intercambio de datos. Después, vino el correo electrónico y lo mas importante llegó con la Web porque permitió que toda la gente pudieran usar esa plataforma tecnológica. Lo mas interesante es cómo cosas que no fueron diseñadas para lo que son hoy en día tienen mas éxito que cualquier previsión que hubieran hecho sus creadores”.

Entramos en la cuestión de cómo hemos de combinar en nuestra vida lo global y lo local. Ricardo opina: “Eso es una decisión personal. Yo creo que hay personas que prefieren ser globales, sin ninguna parte ‘local’; y otras, deciden ser solamente ‘locales’ y vivir solamente en una comunidad con un entorno físico mucho mas restringido. Lo que ocurre es que, como tú dices, ahora la tecnología hace que la mayor parte de las personas combinen en su vida una parte con lo ‘local’ con otra con lo ‘global’. Y ¿dónde estas tú es ese espectro entre lo completamente local y lo hiperglobal? Pues, esa es tu decisión personal”. ¿Y tu crees, Ricardo, que esto es generacional?, -le pregunto-. “Sí, -responde-. es un tema generacional y va a ser un gran cambio cultural. Creo que todas las personas que han nacido ya con Internet son en parte globales porque esto ya esta en su aprendizaje”. ¿No piensas, -le digo-, que muchas veces se debería hablar de ‘datos’ cuando de hablan de ‘información’ y de ella, cuando hablan de ‘conocimiento’?. “La Web esta llena de datos,- asegura-, pero solo cuando les das uso y tienen una utilidad para ti, es cuando son ‘información’. Antes no lo eran. No es una cosa intrínseca, depende para que la quieras usar”.

En la imagen, de izquierda a derecha: Rich Riley, director de Yahoo! Europa; Yerry Yang, cofundador de Yahoo! y Ricardo Baeza-Yates, en una visita de los dos primeros al laboratorio de Yahoo! Research de Barcelona, que dirige Ricardo.

[ampliar foto+]

Paso a hablarle de su trabajo y especialidad. De las tecnologías de búsqueda, -le pregunto-, ¿como podemos explicar lo decisivas que son para personas y empresas las ‘search technologies que estáis investigando en los laboratorios de Yahoo!Research que tú diriges?. “Creo que se puede explicar de muchas maneras, pero puedo hacerlo con una metáfora que me gusta mucho: la geografía. No podríamos entender el mundo sin un mapa con continentes, países, ciudades. Sin el mapa no podríamos entender la complejidad de donde vivimos. Pues los buscadores son como el ‘mapa’ de la Web. Pero son un mapa abstracto, en el sentido que hay mas de 200 millones de sitios Web en el mundo. Cada persona conoce muy pocos. Algunos le van a ser útiles durante su vida, y la única forma de llegar a ellos es a través de un buscador, que es como un mapa implícito. Sin ellos nunca los vamos a conocer: La Web existe porque están los buscadores. Sin ellos una Web gigantesca como la actual seria inútil”.

Pregunto ahora a Ricardo Baeza-Yates: ¿Cómo puede ayudar la investigación que hacéis en un gigante tecnológico como Yahoo! a nuestras empresas que en su inmensa mayor parte son PYMES o microempresas?. “Yahoo!, –afirma-, se define como una empresa que está para servir en la Web. No es una compañía que vende software, pero sí lo crea en su tecnología y servicios, en su gran mayoría gratuitos, ya que nuestro modelo de negocio basado en publicidad permite eso. Todo esos servicios forman parte de un ecosistema de la Web, que permite que muchas compañías generen trabajo. Nosotros creemos que mejorando esa tecnología mejoramos ese ecosistema, con lo que estamos permitiendo que emerjan nueva oportunidades para que pequeñas empresas hagan un emprendimiento y creen nuevas ideas para la Web. Una razón por la que nosotros publicamos todo es porque creemos que hay que hacer investigación abierta, porque así creemos que se mejora y enriquece ese ecosistema. De esa manera facilitamos también que otras personas sepan cuáles con los problemas importantes de la red y construyan con nosotros es Internet del futuro. La escala es muy grande porque disponemos datos que proporcionan mas de  600 millones de personas y recolectamos cada día unos 15 terabytes de datos de cosas que hace la gente en nuestros sitios de la Web. La otra razón importante de porque lo hacemos así, es porque la única manera de medir verdaderamente la calidad de lo que hacemos es medirlo con el resto del mundo”,

Pido a Ricardo, finalmente, que nos ilustre brevemente sobre en qué dirección va hacia el futuro Yahoo! Research Labs y por tanto las search technologies: “El siguiente desafío va en dirección la ‘experiencia de usuario’;  cómo se mide la user engagement (satisfacción del usuario) concreta, estudiar tu contexto para darte (predictivamente) lo que tu preferirás en dicho contexto. Es un inmenso mundo de investigación que no trata sólo de tecnología, sino también de sociología, psicología y de economía”.

Este diálogo fue publicado en el Suplemento INNOVADORES EM, el 22 de noviembre de 2010 (pág.7)

Monday, December 6th, 2010

Movimiento Linked Open Data

Fue en el gran Congreso del XX  Aniversario de la Web, el WWW2009, en el que nos reunimos miles de personas para celebrar con su creador Tim Berners-Lee el 20 aniversario de la invención de la Web, cuando empecé a comprender lo que significaba de verdad la dimensión de algo grande que nos llevará hacia la verdadera Web 3.0, la Web Semántica. A Tim no le gustan estas denominaciones y prefiere referirse en relación a la Web del futuro más próximo como Grafo Global Gigante (GGG). En síntesis, según al explicación del inventor de la Web, el Grafo Global Gigante se refiere al espacio de interacción entre el funcionamiento social de la gente en red y la Web semántica. La palabra Graph hace referencia a GGG (Giant Global Graph), como sustituto del término Semantic Web, para denotar las relaciones sociales (redes sociales) surgidas en la web. Net y Web han formado el Graph a niveles diferentes: Net conecta computadores, Web conecta documentos, y Graph conecta personas. Pero fue la explicación de Tim Berners-Lee sobre el Linked Open Data Movement la que se adelantó al gigantesco efecto de las grandes expectativas para las empresas que los nuevos estándares del W3C que él lidera  iban a producir al materializarse las aplicaciones en una Web crecientemente semántica cuando al tecnología avanzada por los ‘mashup’ (integradores de datos útiles procedentes de diferentes lugares de la red que se presentan dotados de sentido en una interfaz web multimedia) son ya realidad, como por ejemplo los mashup de Google Maps que se presentan, por ejemplo cuando buscamos un restaurante en Google Maps y nos da como resultado un rectángulo ‘pinchado’ sobre el mapa de Google con dirección, foto de fachada,  el teléfono, Web y geolocalización integradas.

Tim Berners-Lee impartiendo la conferencia inaugural en el WWW2009Madrid . En la última línea de esta pantalla de su presentación puede leerse: “Linked Open Data movement”. (Foto: A. Plasencia)

Los ‘mashup’ son solo un pequeño ejemplo. En otro gráfico de su conferencia, Tim nos mostró un esquema  básico de “The Link Open Data dataset cloud” (La nube de la vinculación de los datos abiertos), y advirtió que debíamos pensar en el Open Linked Data como en un ‘movimiento’, para defender abierta esa tecnología que ya permite vincular y cruzar de forma instantánea e inteligente ingentes estructuras de datos que integrados alcanzan un sentido y valor extraordinarios: datos  de multimedia, geográficos, de publicaciones, de contenidos generados por el usuario, de los que poseen los gobiernos y las administraciones públicas sobre los ciudadanos y de las ciencias de la vida. Hay muchísimos datos datos que en realidad los produce la actividad de los ciudadanos de la sociedad conectada deberían permanecer libre y abiertos (excepto los que fueran datos sensibles), para que cualquiera o cualquier empresa pudiera innovar creando aplicaciones útiles y abiertas. Así se cumpliría el proposito que expresaron Tim Berners-Lee y Vinton Cerf en la IV Sesión del IGF con su afirmación: “Creemos que internet debe ser un lugar abierto donde nadie tenga que pedir a ninguna instancia permiso para innovar”.

Ampliar este gráfico +

El Linked Open  Data Movement defiende que estos datos –excepto los sensibles- deben ser abiertos y tratados como un patrimonio universal y estar a disposición de cualquier internauta o desarrollador que los quiera usar abiertos para cualquier innovación que se le ocurra. Comprendimos que el defender Open Link Data es una  cuestión tan decisiva como la Neutralidad y la Interoperabilidad de la Red ya que ‘todo los bits fueron creados iguales’. Las expectativas del Linked Open Data Cloud movement son gigantescas. Cataluña ya ha movido ficha y hace pocos días ha puesto en marcha su proyecto “Dades Oberts Gen Cat” que ya esta en la Web. Los primero ejemplos prácticos son espectaculares: la interfaz que ha creado un desarrollador ingles (Oliver G. O’Brien) de uso en tiempo real de uso público de bicicletas en ciudades de todo el mundo es una de ellas (incluye ciudades de España como Zaragoza, Valencia, Gerona, Barcelona y Sevilla). Entra en el Bike Share Map Cities que ha creado Oliver G. O’Brien y no te arrepentirás. Comprobarás la potencia que puede tener el Open Link Data movement

Imagen de la interfaz interactiva de los Bike Share Map, para la ciudad de Valencia (hay otras 14 ciudades ya en la aplicación)

Saturday, November 20th, 2010

La Conferencia del 20 aniversario de la WWW, es en Madrid!

El verano pasado estuvo en Valencia en la inauguración de una multitudinaria Campus Party Tim Berners-Lee. Un científico de la computación que, con la colaboración de su colega de entonces en el CERN Robert Cailliau , ahora hace 2o años, tuvo la osadía de proponer a sus jefes del CERN en febrero de 1989 una propuesta -“vaga, pero excitante“, según quedó anotado en la portada por su jefe directo en el CERN- que haría historia. Ese fue el nacimiento de la World Wide Web.

tim-y-adolfo

Tim Berners-Lee y Adolfo Plasencia en la Campus Party 2008 de Valencia. (Foto N. Olmos)

En esa Campus Party, tuve por fin el privilegio de concer a Tim Berners-Lee personalmente, y mi sorpresa fué mayúscula ya que nos anunció en Valencia en julio de 2008, que la gran Conferencia del 20 aniversario de la Web del W3C… se iba a celebrar del 20 al 24 de Abril de 2009…¡en Madrid!, … Y nos pidió en Valencia que colaborásemos al máximo para difundirla.  Me tomé en serio las palabras de Tim. Y decidí poner todo de mi parte y mi modesta capacidad para divulgar al máximo esta, -repito-, histórica Conferencia. Y aquí estamos, con la Conferencia WWW 2009 a punto de comenzar.

Como ya conozco a mi país, seguramente, de esta conferencia se hablará durante años, pero después-. Yo, por mi parte, pienso disfrutarla desde el primer día. ¡No es para menos!

Asi que, atentos a la web, a la blogosfera y todo el que que tenga ocasión, que acuda al Palacio de Congresos de Madrid. Aviso: debe antes informarse antes, ya que ésta Conferencia es un evento cientifico de trabajo de altísimo nivel y no esta destinada, como tal, para el público en general, pero sí habra ocasión de escuchar allí o a través de los medios las reflexiones de gente que va a participar y que es historia viva de la tecnología.

banerwww09

En la World Wide Web Conference 2009 se van a reunir los responsables principales, tecnólogos, organismos empresariales y de estandarización, que estan desde hace años dando forma al presente y también a los mecanismos que definirán el futuro próximo de la Web. La WWW2009 es la 18 edición de las Conferencias que organiza Comité Internacional de la World Wide Web Conference (IW3C2)(IW3C2) desde 1994. Es un evento anual ha desempeñado en las últimas dos décadas un papel fundamental, por su poder de convocatoria, para reunir a grandes pioneros de la comunidad científica internacional relacionada con Internet para que presenten, compartan, debatan e investiguen cómo y cuáles debes ser los mejores mecanismos para estructurar y desarrollar el futuro de la World Wide Web. Un futuro que ya esta ligado al de 1.000 millones de personas y seguramente también al nuestro.

Solo por ver juntos en un mismo debate (El 20th Anniversary Panel), a:

Sir Tim Berners-Lee
* Robert Cailliau
* Vinton Cerf – Google Vice President and Chief Internet Evangelist
* Dale Dougherty – O’Reilly Vice President
* Mike Shaver – Mozilla Vice President

Solo por este debate, ya vale la pena la Conferencia.

Pero quiero, como ciudadano digital e internauta de mi país, agradecer a Juan Quemada, Gonzalo León y a Joan Vinyes los tres científicos españoles cuyos esfuerzos que, seguramente, han sido los mas han tenido que ver con el que esta gran Conferencia se celebre en Madrid y en España. Y también al gran Tim Berners-Lee, agradecerle el venir el año pasado hasta mi ciudad, Valencia, para darnos la noticia en persona. Gracias.

Que además haya una presencia tan destacada -de la que hablaremos-, en el panel citado y en el programa de la Conferencia de personalidades que se han caracterizado claramente por formar parte del movimiento de ‘apertura’ de la red, me sugiere prometedores resultados de la Conferencia.

Seguiremos informando en este blog en próximos días. Hay muchas sopresas para estos días sobre: Dale Dougherty; Vinton Cerf; feevy… y muchas cosas mas… ¡atentos a esta pantalla!

Sunday, April 19th, 2009