Web profunda / Deep Web

Acabo de recibir la comunicación  de Call of  Papers de la WWW2012 conferencia mundial de la WWW, que cada dos años organiza el W3C (World Wide Wide Consortim) que en 2012 se celebra en Lyon, Francia. Como en cada anuncio de este tipo, lo primero que hice fue buscar la lista de los ‘Scientific topic’s. Que para mí son tradicionalmente una via avanzada que indica por qué caminos probables va a venir el futuro de la Web. Recuerdo perfectamente cómo hace años, esa lista de ‘topics’ la veía  como una línea de ‘bengalas’ conceptuales que señalaban el futuro de las tecnologías de la web, hasta el punto que, cada vez en menor tiempo, he visto emerger en esta conferencia nuevos estándares que años después se convertían en tecnologías funcionado en Internet y poco después en modelos de negocio que han acabado que hoy son las empresas innovadoras en la red. De una forma palmaria a los pocos años presentar en la WWW Conference toda una generación de nuevos estándares para el código informático y la arquitectura de la web, surgieron multitud de aplicaciones de la Web convertidas en lo que explica la formulación de Tim O’Reilly de la Web 2.0. En pocos años los estándares facilitaron  la creación de empresas,  aplicaciones y servicios  que usan ciento de millones de personas debido a la gigantesca escala de la red de hoy, desde Panoramio, Flickr, You Tube, los blogs, Facebook o twitter, que es la manifestación mas clara del nuevo Internet de tiempo real.

Como dice mi amigo Leopoldo Amigo, aunque no nos fijemos en ello, todo lo que funciona, lo que suena, lo que leemos, lo que usamos, siempre ha sido pensado antes. El pensamiento siempre es anterior a las obras, sean logros artísticos, científicas o tecnológicos. Todo es fruto de una vanguardia de pensamiento que siempre va pro delante aunque los que usamos y disfrutamos las cosas o las creaciones, aunque nosotros actuemos como si todo se generase a sí mismo por generación espontánea. No hay generación espontánea. Coincido con Leopoldo en que el pensamiento, la investigación y sus búsquedas van muy por delante de la techné. Los scientific topics de las W3 Conference nos pueden dar pistas sobre nuevos caminos a aplicaciones y nuevos modelos de negocios y servicios basado en la Web. En el ‘universo’ de la arquitectura de Internet esto es especialmente evidente. La conexión entre el mundo científico, y la diseminación de sus nuevos estándares  (los de el W3C son abiertos) y la emergencia de nuevos modelos de negocio y empresas concretas de portentosa realidad están una relación causa-efecto diáfana y se ha producido, asombrosamente, a plena luz ante nuestros asombrado ojos en los últimos diez años. Uno de los tópics que me han interesado mas de la WWW2012 es el llamado “Deep Web” (Web profunda), -que no es nuevo, pero esta ahora en ‘el foco’-. Tiene que ver con  partes valiosas de información de Internet a la que no acceden los buscadores actuales (Google incluido) porque, como me ha explicado mi también amigo Ricardo Baeza-Yates, aun no son capaces de entender por completo la semántica de los documentos que hay en esa parte de la red. ¿Y en que sección esta el topicdeep web’? pues en la de ‘Information Extraction and Natural Language Processing’. Vaya, qué casualidad. Hace pocos días se presentó el esperadísimo iPhone4S, que ya incluye un ‘revolucionario sistema de lenguaje natural’. Dicen que nada es casualidad en tecnología.

A los emprendedores y a las empresas innovadoras que buscan la emergencia de nuevas oportunidades y mercados, les conviene estar atentos a los ‘scientific topics’ de la WWW, dada la inmediatez casi milagrosa, comparada con época anteriores, con que se trasladan los avance científicos sobre la Web al campo de las empresas de internet, que funcionan en Beta Perpetua , inmediatez de la que los Yahoo! Labs son uno de los mejores ejemplos. Los conceptos avanzados en la lista de scientific topics son ahora como  ‘caminos de bengalas’ del pensamiento científico e investigador que les marcará caminos que llevan a lo mejor del futuro inmediato. Todo lo que usamos ha sido pensado antes por alguien cuya mente ya iba muy por delante, como dice Leopoldo.

………………….

Este artículo se publicó como una columna en la página 4 del Suplemento Innovadores del diario El Mundo, el 3 de octubre de 2010.

Saturday, October 29th, 2011

Ricardo Baeza-Yates: las fronteras de la Search Technology

El universo de tecnologías de  búsqueda en la red es el centro de la ingente e innovadora actividad científica y tecnológica que lidera dirigiendo los Yahoo! Research Labs de Barcelona, Santiago de Chile y Haifa.

El chileno Ricardo Baeza-Yates, es científico de la computación y Vicepresidente de Investigación para Europa y Latinoamérica de Yahoo! Research y su vida profesional navega constantemente entre estos tres lugares del planeta y la primera avenida de Sunnyvale, justo en el extremo sur de la Bahía de San Francisco en California, que es donde tiene su cuartel general Yahoo!, la exitosa compañía basada en Internet que fundaron en enero de 1994, dos estudiantes de postgrado de la Universidad de Stanford, Jerry Yang y David Filo.

Ricardo Baeza-Yates, en Valencia (Foto: Adolfo Plasencia)

Nos hemos encontrado en Valencia y no nos veíamos físicamente desde la gran Conferencia WWW2009 del XX Aniversario de la Web. Rápidamente actualizamos detalles. Iremos de lo general a lo particular.

Le pregunto si, en su opinión, hay un antes y después de Internet para la humanidad. “Ahora es, -contesta-, con la 2.0, la segunda versión de la Web, cuando todo el mundo tiene la posibilidad de aportar su contenido a la red. Yo creo que el de la Web 2.0 es un término válido. Y aún mas interesante es la Web 3.0 que podría ser el cómo aprovechar lo que la gente hace en la Internet para construir la Web del futuro, que sería una meta-Web. Para hacerse una idea de lo que Internet significa para la humanidad, la imprenta sería una buena metáfora, porque permitió difundir el conocimiento en su época a través del papel. Eso ahora lo tenemos mucho mas aumentado con la Web. La imprenta permitió que algunos publicaran. La Web permite que todos los que están conectados publiquen. Y ya estamos hablando de un tercio de la humanidad. Eso es fundamental”. Como es un científico informático, le pregunto si él cree que la revolución digital es horizontal, es decir, si afecta a todo tipo de actividad intelectual humana.“Sí , -afirma rotundo-, de hecho cuando estaban inventando Internet no se proponía inventar lo que hoy conocemos por Internet, sino resolver algunos problemas quizá mas pedestres, como el del intercambio de datos. Después, vino el correo electrónico y lo mas importante llegó con la Web porque permitió que toda la gente pudieran usar esa plataforma tecnológica. Lo mas interesante es cómo cosas que no fueron diseñadas para lo que son hoy en día tienen mas éxito que cualquier previsión que hubieran hecho sus creadores”.

Entramos en la cuestión de cómo hemos de combinar en nuestra vida lo global y lo local. Ricardo opina: “Eso es una decisión personal. Yo creo que hay personas que prefieren ser globales, sin ninguna parte ‘local’; y otras, deciden ser solamente ‘locales’ y vivir solamente en una comunidad con un entorno físico mucho mas restringido. Lo que ocurre es que, como tú dices, ahora la tecnología hace que la mayor parte de las personas combinen en su vida una parte con lo ‘local’ con otra con lo ‘global’. Y ¿dónde estas tú es ese espectro entre lo completamente local y lo hiperglobal? Pues, esa es tu decisión personal”. ¿Y tu crees, Ricardo, que esto es generacional?, -le pregunto-. “Sí, -responde-. es un tema generacional y va a ser un gran cambio cultural. Creo que todas las personas que han nacido ya con Internet son en parte globales porque esto ya esta en su aprendizaje”. ¿No piensas, -le digo-, que muchas veces se debería hablar de ‘datos’ cuando de hablan de ‘información’ y de ella, cuando hablan de ‘conocimiento’?. “La Web esta llena de datos,- asegura-, pero solo cuando les das uso y tienen una utilidad para ti, es cuando son ‘información’. Antes no lo eran. No es una cosa intrínseca, depende para que la quieras usar”.

En la imagen, de izquierda a derecha: Rich Riley, director de Yahoo! Europa; Yerry Yang, cofundador de Yahoo! y Ricardo Baeza-Yates, en una visita de los dos primeros al laboratorio de Yahoo! Research de Barcelona, que dirige Ricardo.

[ampliar foto+]

Paso a hablarle de su trabajo y especialidad. De las tecnologías de búsqueda, -le pregunto-, ¿como podemos explicar lo decisivas que son para personas y empresas las ‘search technologies que estáis investigando en los laboratorios de Yahoo!Research que tú diriges?. “Creo que se puede explicar de muchas maneras, pero puedo hacerlo con una metáfora que me gusta mucho: la geografía. No podríamos entender el mundo sin un mapa con continentes, países, ciudades. Sin el mapa no podríamos entender la complejidad de donde vivimos. Pues los buscadores son como el ‘mapa’ de la Web. Pero son un mapa abstracto, en el sentido que hay mas de 200 millones de sitios Web en el mundo. Cada persona conoce muy pocos. Algunos le van a ser útiles durante su vida, y la única forma de llegar a ellos es a través de un buscador, que es como un mapa implícito. Sin ellos nunca los vamos a conocer: La Web existe porque están los buscadores. Sin ellos una Web gigantesca como la actual seria inútil”.

Pregunto ahora a Ricardo Baeza-Yates: ¿Cómo puede ayudar la investigación que hacéis en un gigante tecnológico como Yahoo! a nuestras empresas que en su inmensa mayor parte son PYMES o microempresas?. “Yahoo!, –afirma-, se define como una empresa que está para servir en la Web. No es una compañía que vende software, pero sí lo crea en su tecnología y servicios, en su gran mayoría gratuitos, ya que nuestro modelo de negocio basado en publicidad permite eso. Todo esos servicios forman parte de un ecosistema de la Web, que permite que muchas compañías generen trabajo. Nosotros creemos que mejorando esa tecnología mejoramos ese ecosistema, con lo que estamos permitiendo que emerjan nueva oportunidades para que pequeñas empresas hagan un emprendimiento y creen nuevas ideas para la Web. Una razón por la que nosotros publicamos todo es porque creemos que hay que hacer investigación abierta, porque así creemos que se mejora y enriquece ese ecosistema. De esa manera facilitamos también que otras personas sepan cuáles con los problemas importantes de la red y construyan con nosotros es Internet del futuro. La escala es muy grande porque disponemos datos que proporcionan mas de  600 millones de personas y recolectamos cada día unos 15 terabytes de datos de cosas que hace la gente en nuestros sitios de la Web. La otra razón importante de porque lo hacemos así, es porque la única manera de medir verdaderamente la calidad de lo que hacemos es medirlo con el resto del mundo”,

Pido a Ricardo, finalmente, que nos ilustre brevemente sobre en qué dirección va hacia el futuro Yahoo! Research Labs y por tanto las search technologies: “El siguiente desafío va en dirección la ‘experiencia de usuario’;  cómo se mide la user engagement (satisfacción del usuario) concreta, estudiar tu contexto para darte (predictivamente) lo que tu preferirás en dicho contexto. Es un inmenso mundo de investigación que no trata sólo de tecnología, sino también de sociología, psicología y de economía”.

Este diálogo fue publicado en el Suplemento INNOVADORES EM, el 22 de noviembre de 2010 (pág.7)

Monday, December 6th, 2010

Explorando las fronteras del universo de las búsquedas en la Red

El crecimiento exponecial de la cantidad de datos disponibles on-line (la humanidad produce mas datos cada año que en su últimos 5.00 años de historia) hace imprescindible usar herramientas cada vez mas poderosas, y mas precisas y mas rápidas para encontrar y gestionar los datos y al información que necesitamos y además separar lo que es relevante para nosotros de lo que no lo es.

Por ellos la investigación sobre ‘Search’ o búsquedas es una de los génereos tecnológicos mas importantes hoy y lo va a ser cada día mas.

Y las herramientas de búsqueda va a ser esenciales sen el Internet de las Cosasy en al ‘Internet semántica’ (Web Semántica) que añadirán al manejo, la búsqueda y la gestión de la relevancia de la información varios grados mas de complejidad sobre lo que hoy usamos.

Incluyo aquí dos ejemplos de la importancia creciente del rtema de las búsquedas:

Primero, el Gráfico de la Cronología de las Tecnologías de Búsqueda y sus protagonistas en las dos últimas décadas, creado por el “Information artist” Jess Bachman

pro otro parte, Google acaba de lanzar una nueva aplicación para búsqueda móvil llamada Search History. Con ella los usuarios pueden conseguir que disponer de su sesiones de conexión con las búsquedas guardadas, favoritos, editar y acceder desde móvil o de escritorio a través de la búsqueda realizada.

Y mas abajo, el reportaje de Tecnópolis TV titulado  ‘Explorando las fronteras del universo de las búsquedas: Yahoo! Research y Yahoo! Labs” que inclye un diálogo en profunidad con Ricardo Baeza-Yates, director de los Laboratorios en Barcelona, Tel Aviv y Santiago de Chile de Yahoo! Research

Cronología de las Tecnologías de Busqueda

Search Engine History.

Infographic by the PPC Blog.com

……………………………………………………………………………………………………………………………………

‘Explorando las fronteras del universo de las búsquedas: Yahoo! Research y Yahoo! Labs

En el vídeo, emitido por Tecnópolis UPTV se incluye diálogo en profunidad con Ricardo Baeza-Yates que aporta su reflexión sobre la relación entre la tecnología digital y datos, información, conocimiento y sabiduría. Y también sobre conceptos como tagging, desambiguación (técnicas para eliminar ambigüedades de significado en una palabra polisémica), habilidades multiproceso (multitasking), la preservación digital o sobre las tecnologías de búsqueda (search engines) masiva que manejan en los laboratorios de YAHOO! RESEARCH en Barcelona, Santiago de Chile y Haifa (Israel), que Ricardo  lidera y donde estan trabajando en este campo de vanguardia y en cuya estrucura de invetigación manejan datos de mas de 500 millones de personas. También explican sus investigaciones dos miembros de su equipo del Grupo Multimedia de YAHOO! RESEARCH en Barcelona: el líder del grupo Roelof Van Zwol y el ingeniero de investigación Lluís Garcia Pueyo.

Para ir al programa y ver el video clickear en el gráfico:


Wednesday, August 4th, 2010

  • SOBRE ESTE BLOG

  • Nube Semántica

    Adolfo Plasencia Amazon Añadir etiqueta nueva Cloud computing Computación en la nube conocimiento abierto Cory Doctorow Creative Commons Dale Dougherty Economía de las ideas emprendedor Enrique Dans GGG Giant Global Graph Google Hal Abelson Innovación INNOVADORES Internet Internet de las Cosas Javier Echeverría Jeff Bezos John Perry Barlow Lawrence Lessig Massachusetts Institute of Technology MIT Pablo Jarillo-Herrero PYMES Redes sociales Ricardo Baeza-Yates Richard Stallman Software como servicio software libre Steve Jobs Suplemento Innovadores Tagging Tim Berners-Lee Tim O'Reilly Tim O’Reilly Ubuntu Vinton Cerf Web 2.0 Wikipedia WWW2009 Yahoo! App Economy (1)
    Apple (2)
    Artesanía (1)
    Biónica (1)
    Biotecnología (1)
    Cibercultura (33)
    ciberengaño (1)
    Ciberespacio (11)
    Ciencia (15)
    Ciencias de la Computación (3)
    Cine (3)
    Comercio electrónico (6)
    conocimiento abierto (11)
    Creative Commons (5)
    Cultura (14)
    Cultura digital (28)
    Diseño (1)
    e-Commerce (5)
    Economía (19)
    Educación (11)
    Empresas (25)
    Empresas sociales (1)
    Física (2)
    flash mob (1)
    flashmob (1)
    Gamification (2)
    Gaming (2)
    Genómica (1)
    Hardware libre (1)
    Hidrogeología (1)
    Hiperlocal (1)
    Howard Rheingold (2)
    Informática (4)
    innovación (6)
    Interfaz Cerebro-Máquina (1)
    Internet (13)
    Microempresas (1)
    MIT (5)
    Mundos virtuales (2)
    nanomáquinas (2)
    nanorobots (1)
    Nanotecnología (2)
    netneutrality (4)
    Neutralidad (3)
    neutrality (1)
    Neutrality network (2)
    OLPC (2)
    Open Hardware (1)
    Phishing (1)
    Princeton (1)
    red (5)
    Redes Sociales (6)
    SEO (1)
    Serendipity (1)
    Snack Culture (1)
    Sociedad (6)
    Software libre (5)
    Startup (2)
    Steve Jobs (1)
    Tecnología (24)
    Tecnologías de búsqueda (5)
    Tecnologías de la Salud (4)
    Transporte (1)
    TV (2)
    Uncategorized (14)
    Web 2.0 (16)
    Web social (14)
    Wikipedia (2)
    WWW (14)

    WP Cumulus Flash tag cloud by Roy Tanck and Luke Morton requires Flash Player 9 or better.

  • March 2017
    M T W T F S S
    « Oct    
     12345
    6789101112
    13141516171819
    20212223242526
    2728293031  
  • Twitter ADOLFO PLASENCIA


  • Artículos destacados de este blog

  • Facebook

  • Linkedin

  • MIS LINKS FAVORITOS

  • Mis VideoBlogs favoritos

  • Meta

  • Fotos Flickr Adolfo

    Vinton Cerf y Adolfo Plasencia

    Adolfo Plasencia y Jimmy Wales

    Rodney Brooks

    Michail Bletsas

    Alvaro Pascual Leone

    John Perry Barlow en el Powerful Ideas Summit

    Tim OReilly entrevistado en Tecnópolis UP TV

    Richard Stallman entrevistado por Adolfo Plasencia

    Henry Jenkins y Adolfo Plasencia

    Hiroshi Ishii y James Patten en Tecnópolis de UP TV

    More Photos