martes, abril 29, 2008

El futuro de búsqueda de imágenes de Google

Dos científicos de Google prestentaron un trabajo en la World Wide Web Conference celebrada en Beijing la semana pasada que describe su visión del futuro de la búsqueda de imágenes.

La nueva tecnología de búsqueda de imágenes no se limita indexar texto relacionado con una imagen para determinar lo que hay en ella, sino que Google pretende utilizar ordenadores para analizar el contenido de las fotos y, a continuación, usar esa información, ordenada por categorías, con las consultas de palabras clave. Es decir, se trata de algo similar al PageRank pero para imágenes.

Hoy en día, cuando hablamos de búsquedas, todos damos por hecho que nos referimos a búsquedas de texto. Y cuando buscamos imágenes, vídeos y contenidos de audio, la única información que los motores de búsqueda utilizan para realizar esas búsquedas es el texto asociado a dichos archivos.

Hasta ahora, Google y otras compañías han invertido grandes esfuerzos en mejorar los metadatos que se refieren al contenido enriquecido. Un ejemplo, es el Image Labeler game de Google, que utiliza el trabajo humano para etiquetar las imágenes adecuadamente. Se trata de un enfoque innovador, pero que sigue estando limitado a la capacidad de descripción de la persona que etiqueta los archivos.

En cambio, una vez que los ordenadores puedan analizar el contenido de otros tipos de archivos con la misma facilidad que los de texto, surgirá toda una nueva dimensión de búsquedas. Los humanos ya no necesitarán realizar la ardua tarea de describir lo que aparece en estos tipos de archivos y el contenido dejará de ser invisible en Internet.

Según Yushi Jing y Shumeet Baluja, de Google, la compañía ya está preparada ahora para ver más allá del texto. En su trabajo, los científicos hablan de sus esfuerzos por aplicar un puntero software de reconocimiento de imágenes para averiguar lo que aparece en una imagen. Sus experimentos para llegar realmente al contenido de las imágenes en sí “muestra avances significativos, en cuanto a relevancia y satisfacción de los usuarios, en comparación con los resultados más recientes de las búsquedas de imágenes de Google”.

Google está observando las características visuales de imágenes populares para luego determinar una clasificación basada en similaridades entre las imágenes.

Fuente: TechCrunch

Etiquetas:

miércoles, noviembre 28, 2007

Como incrementar el page rank de Google

Google es, con diferencia, el motor de búsquedas más importante de Internet y si logramos que nuestra Web alcanza las primeras posiciones de sus resultados, probablemente lo haga también en le resto de buscadores. Para alcanzar las primeras posiciones en sus resultados hay que incrementar la popularidad del sitio a través de buenos contenidos, además de entender cómo mide Google dicha popularidad. La semana pasada Entireweb publicó un interesante resúmen de buenas prácticas a seguir para aumentar tu pagerank.

La popularidad de enlace se define como el número de sitios que enlazan a tu sitio. Los motores de búsqueda utilizan esto para determinar la importancia de un sitio: cuantos más sitios enlacen a él, más importante se considerará y mayor será su ranking.

Pero el número de enlaces a un sitio no es la única variable utilizada para medir su popularidad; el motor de búsqueda analiza también la importancia de los enlaces con respecto al tema de tu sitio. Por ejemplo, si un sitio Web que vende vitaminas tiene 4.000 enlaces desde otros sitios al suyo, pero el origen de la mayoría de los enlaces son sitios que no tienen nada que ver con las vitaminas, el motor de búsqueda tendrá eso en cuenta y su puntuación de popularidad no será muy buena.

De ese modo, es posible que un sitio Web con un número de enlaces entrantes relativamente pequeño, pero de calidad, tenga un ranking mayor que otro con muchos enlaces entrantes irrelevantes. Por otra parte, si intentas utilizar páginas de intercambio de enlaces, no solo dañarás tu ranking, sino que tu sitio podría ser eliminado permanentemente de los listados de los buscadores. En la última actualización de page rank de Google, webs que participan en las llamadas granjas de enlaces han sido especialmente castigadas.

Una vez entendido el concepto de popularidad de enlace y cómo funciona es necesario saber concretamente cómo lo calcula Google.

Uno de los factores que utiliza Google en su algoritmo sigue siendo el número total de sitios que enlazan a tu Web: cuantos más enlaces mayor puntuación. Sin embargo, el algoritmo de Google también mide la calidad de dichos enlaces y la relación que éstos tengan con tu sitio Web.

Google da también una puntuación más elevada si el enlace procede de una Web cuyo contenido está relacionado con tus palabras clave. La puntuación obtenida será aún mayor si el texto del hipervínculo que apunta a nuestro sitio coincide con una de nuestras palabras clave.

Otro factor utilizado por Google es la diversidad de palabras clave de los sitios que enlazan al tuyo siempre y cuando tenga relación con el tema de tu sitio web. Por ejemplo, si tienes un sitio que vende coches de segunda mano y todos los enlaces que apuntan a tu sitio provienen de Webs descritas únicamente por la palabra “coche de segundo mano”, a Google le parecerá raro. Para obtener una mejor puntuación, lo ideal sería que los enlaces viniesen de sitios con una variedad de palabras clave relacionadas con coches: viajar, transporte, coches, automóvil, neumáticos, conducir etc etc.

Como bien dice el autor del artículo de Entireweb, no es fácil incrementar la popularidad de un sitio, pero una vez que entendido el modo de cálculo de Google puede resultar más fácil trazar un plan.

Etiquetas:

jueves, junio 07, 2007

Google y Ask.com ofrecen las búsquedas más seguras

Según un artículo publicado esta semana en Computer Bussiness online, una investigación realizada por McAfee afirma que Google y Ask.com han mejorado la seguridad en sus resultados de búsqueda durante el último año, mientras que los resultados de Yahoo y Microsoft se han vuelto más peligrosos.

El servicio SiteAdvisor de McAfee presentó un informe que analizaba el número de páginas Web peligrosas que devolvían entre sus resultados los cinco buscadores principales en mayo del 2007, comparando los resultados con los de mayo del 2006.

El estudio observó que el 4% de los resultados de las búsquedas de Google, Yahoo, Microsoft, AOL y Ask llevaban a páginas Web "peligrosas", lo que indica una mejora de un punto con respecto al año anterior.

Esta mejora se debe a una limpieza en los resultados de búsquedas patrocinados de Google y Ask (que utiliza la publicidad de Google), pero con el lastre de unos resultados menos seguros de Microsoft y Yahoo. AOL resultó ser el motor de búsqueda más seguro.

En cualquier caso, la definición de McAfee de "peligroso" es bastante amplia, e incluye sitios que recurren a un elevado envío legal de publicidad por medio de correo electrónico o ventanas emergentes; algo realmente molesto, pero que no supone una verdadera amenaza para la seguridad.

Excluyendo estas categorías de bajo riesgo, que McAfee clasifica con el color "amarillo", el porcentaje de sitios de mayor riesgo (es decir, los de color "rojo"), que intentan instalar adware, enviar spam o modificar las preferencias del usuario, constituye tan solo un modesto 1,87%.

Fuente: Computer Business Online

Etiquetas: