Durate el último mes se ha sentido una creciente ola de cabreo contra el pulmón de acero de Google: su buscador. ¿Quiénes son esos chalados que se quejan del todopoderoso Google?
¿Quiénes son esos chalados que se quejan de Google?
En Erasmusu.com, nuestro proyecto, más del 70% de las visitas nos llegan desde Google… ¡y muy contentos que estamos de ello! Nadie en su sano juicio mordería la mano que le da de comer, pero yo voy a arriesgarme.
Durante el último mes se ha sentido una creciente ola de cabreo contra el pulmón de acero de Google: su buscador. Yo también estoy descontento. Necesitamos un nuevo (y mejorado) Google, y cada vez más, salta a la vista.

En este artículo voy a hablar de los motivos que han hecho que varios portales expresen su descontento sobre las deficiencias del algoritmo de Google, así de cómo los spammers y creadores de contenido basura se están aprovechando de sus vulnerabilidades. También hablaré sobre qué se podría hacer para mejorar el todopoderoso buscador de Google, con diversas ideas que he ido viendo en otras opiniones del tema, porque no son pocos los que hablan del buscador de Google en las últimas semanas.
Acualización: En los comentarios, nos comenta @julio un nuevo artículo de Techcrunch en respuesta a nuevos cambios en el algoritmo publicados por Google: Google apunta a las granjas de contenido con grandes cambios en su algoritmo: Google ha hecho una gran revisión de su algoritmo de búsqueda hoy, según la compañía. Y si bien no se cita a nadie en particular, está claro que los grandes perdedores son las granjas de contenido y los productores de contenido-spam que han tenido vía libre absoluta en Google durante el último par de años.
Existe un clima de fastidio hacia el buscador de Google
Es normal que una compañía tan grande como Google cometa pequeños fallos. Pero cuando hablamos de su buscador, todos nos ponemos alerta. ¿A qué chalado se le va a ocurrir criticar el mejor buscador del mundo?
¿Acaso está fallando el algoritmo de Google? Pues parece que como mínimo está fallando en dos temas claves:
1. ¿Pero cómo es que aparece ese antes que yo?
Siempre hemos oído que el contenido duplicado es algo que a Google no le hace demasiada gracia, por dicho motivo, si tienes un blog muy conocido, como es el caso de Coding Horror lo último que esperas es que otras páginas que copian tu contenido aparezcan primero en las búsquedas de Google. ¡Por encima de ti que escribiste primero dicho contenido y es original tuyo! El problema es que es justo lo que está ocurriendo.
Codinghorror: Problemas en la casa de Google: “A lo largo de mi investigación tuve dudas persistentes que estábamos viendo serias grietas en los cimientos de la búsqueda algorítmica de la casa que construyó Google. Pero tenía miedo de escribir un artículo sobre el tema por temor a que me acusaran de ser un chiflado incompetente.”
2. Un buscador deja de tener gracia si no encuentras lo que buscas
¿No crees?
Allá por 1999, la primera vez que probé Google me quedé completamente flipado. Era mágico. Aquello que buscabas aparecería delante de ti cual paloma sacada de chistera. Pero hoy en día, si por ejemplo quieres comprar un lavavajillas y te da por buscar en Google, lo que vas a encontrar casi seguro es spam… montañas de spam.

El problema es que el contenido en Internet está creciendo exponencialmente y la gran mayoría es contenido basura. Dicho contenido “zombie” es creado, en el mejor de los casos, por empresas sin escrúpulos, o directamente por crawlers automatizados que simplemente copian y pegan de otros lados. Estos indeseables saben cómo manipular los sistemas de clasificación de páginas de Google para lograr que sus sitios aparezcan en la parte superior de los resultados de búsqueda. Y a Google no le da tiempo ni a enterarse.
Paul Kedrosky: Lavavajillas, y cómo Google se come su propia cola: “Google se ha convertido en una serpiente que consume a placer la cola de sus propias palabras clave. Los creadores de contenido basura sólo tiene que identificar algunas palabras que aparecen en las búsquedas rentables (como aparatos tecnológicos, vino, videojuegos, lecciones de kayak, etc), y escribir contenidos basura de forma barata y con regularidad sobre ellas, y ya está. En la web, nadie descubrirá que eres un creador de contenido zombie.”
¿Por qué falla Google? ¿Qué vulnerabilidades explotan los spammers?
Las hay de varios tipos, y algunos listillos las explotan todas a la vez:
1. Las granjas de contenido basura
Si lo piensas, es fácil. Sólo tienes que identificar aquellas palabras clave que aparecen en las búsquedas rentables (vino, aparatos tecnológicos, videojuegos, viajes, etc), y escribir contenidos basura y con regularidad sobre ellas. Luego, puedes utilizar al mismo Google para sacar provecho de ello (colocando publicidad de Google Adsense), o bien realizar acuerdos directos con las marcas. Es lo que se conoce como el “fast food content“. Los chicos de Techcrunch confiesan estar acojonados con él.
Techcrunch: El fin del contenido escrito a mano: “Así que… ¿qué es lo que realmente me asusta? Es el aumento del contenido basura que seguramente, con el tiempo, destruirá al contenido hecho a mano de hoy en día. Es el aumento de los contenidos baratos y desechables en una escala masiva, con los que nos alimentan a la fuerza los portales y motores de búsqueda.”
Como ejemplo tenemos la campaña de AOL en su campaña de “Toyota”. O compañías como Demand Media y Answers.com.
Demand Media está pagando lo mínimo de lo mínimo a un ejército de escritores y personas que graban vídeos para conseguir publicar “4000 vídeos y artículos” diariamente, basándose únicamente en lo que está de moda en los motores de búsqueda. Exprimen el jugo del SEO hacia este contenido, que es creado de la forma más rápida y barata posible, y rezan por tener tráfico. Y parece que les va muy bien. El valor de la compañía está estimado en $1.600 millones. Sí, has leído bien.
Estos modelos crean competitividad en la creación de muchos contenidos basura, pero es el tipo de competitividad que no favorece al futuro lector. Todo el que pasa tiempo y dedica esfuerzo a crear buen contenido es empujado lenta y irremisiblemente fuera del negocio. Aún no estamos en ese punto, pero podría llegar. Y puede que llegue muy pronto, estate preparado.
Techcrunch: Olvídate de lo que es justo o injusto, lo correcto o incorrecto. Esto simplemente está sucediendo. Todo está cambiando, y todos tenemos que adaptarnos o enfrentarnos a las consecuencias. Los contenidos elaborados a mano van a morir. ¡Viva el contenido “Fast Food”! Está aquí para quedarse.
En opinión de muchos, Google debería despertar. Actualmente, la “cantidad” aún manda en Internet, y la “calidad” es cada vez más difícil de encontrar.
Esto podría ser muy contraproducente para Google, y hacer que cada vez más, la gente se sindique a los contenidos que le interesan (tanto por RSS como a través de sus contactos de Twitter o Facebook) o directamente busquen en portales como Menéame o Reddit las cosas más interesantes.
Todos esperamos que en el futuro Google mejore, y encuentre una forma efectiva de premiar el contenido de calidad por encima del contenido basura, porque actualmente lo que está ocurriendo es que Google está siendo violado por las granjas de contenido.
2. Contenido duplicado que posiciona por encima del original
La forma de ganar dinero sucio con esto es la misma que en el punto anterior. Pero aquí aún tienen la cara más dura. No generan contenido propio, ni malo ni bueno… simplemente lo copian y pegan de otros lados. ¡Y anda si no hay contenido para copiar en internet!
De esta forma surgen los agregadores de contenido. Algunos lo hacen de forma tan bien equilibrada que son difíciles de detectar. Es el caso de la red Informifi en las que tienen varios portales, alrededor de temáticas concretas, como Sportifi, en las que todo el contenido no son más que resúmenes de otros artículos con link al artículo original.

Por lo menos, gracias a ese link, el artículo final debería ganar reputación y aparecer por encima en las búsquedas. ¿No? Esa es la teoría, pero como ya hemos comentado, Google la pifia en ocasiones posicionando peor el contenido de la página original que el contenido duplicado.
En ocasiones estas webs de contenido duplicado no intentan generar dinero mediante publicidad, sino que son utilizadas como web lanzadera de enlaces hacia otras webs a las que quieren mejorar su PageRank. Si muchas webs con contenido copiado o contenido basura, que hablan sobre lavavajillas, enlazan hacia cierta empresa de lavavajillas, esta puede ver incrementado su posicionamiento orgánico, y por supuesto, sus ingresos.
Además, los más caraduras de los scrapers directamente no colocan un link de vuelta al contenido. Simplemente copian y pegan.
Wikipedia: Una web scraper es es una web de spam que copia todo su contenido de otros sitios web mediante web scraping. El objetivo de la creación de un sitio de estas características puede ser el cobro de ingresos por publicidad o la manipulación de los rankings de búsqueda mediante la creación de enlaces a otros sitios para mejorar su posicionamiento.
Algunos de estos agregadores de contenido lo tienen todo estupendamente automatizado, de forma que una única persona podría simplemente verificar que el sistema no la ha “liado parda” (por ejemplo copiando algo que no debería haber copiado). Y para despistar a Google ofrecen numerosas fichas autogeneradas, búsquedas de vídeos y fotos relacionadas, en cada artículo que crea el sistema, mamando de diversas fuentes. Todo automático.
Todo esto no sería un problema si en muchos casos estas webs no alcanzaran, mediante prácticas poco legítimas, mejor posicionamiento que los artículos originales. Y el culpable de que esto ocurra no deja de ser otro que el mismísimo Google.
3. Posicionamiento de productos por encima de la competencia mediante compra de backlinks
El sueño de todo vendedor en Internet, que todos tus productos se posicionen los primeros en las búsquedas. JC Penney (me niego a ponerles un backlink) lo consiguió. ¿Cómo lo hizo?
Durante meses, JC Penny le hizo la pirula a Google, consiguiendo los mejores resultados para cientos de productos muy lucrativos. Google lo descubrió recientemente y les cortó el grifo, pero mientras tanto se forraron literalmente de dinero.
La forma de conseguir esto fue relativamente sencilla: pagaron a otras páginas para que colocaran links hacia productos de JC Penny, escalando de esta forma su posicionamiento en buscadores por encima de todos sus competidores.
Esta es una clara “vulnerabilidad” de PageRank, uno de los medidores que usa Google para posicionar una página mejor que otras: el PR de una página será mayor o menor dependiendo del número de links de otras páginas hacia ella, y sobre todo, del PR de las páginas que tienen dichos links.
¿Cómo podría mejorar el buscador de Google?
No es fácil. Si no ya lo habrían hecho.
Según Vanessa Fox, que trabajaba en el pasado luchando contra el spam en Google, el reto más complicado al que se enfrenta Google es encontrar el equilibrio entre detectar contenido duplicado, granjas y spammers al mismo tiempo que se minimizan los daños colaterales. Es decir, para cada medida que Google toma contra los spammers, el problema es que dicha medida podría afectar por error a webs de contenido legítimo.
Por el momento parece que Google prefiere enfrentarse a multitud de contenido duplicado y a la ira de los que crean contenido original, antes que enfrentarse a los enfados de portales que pudieran ser injustamente baneados por no tener bien calibrados sus algoritmos.

Aún así hay cosas que me sorprenden. ¿Tan difícil es poner primero en una búsqueda al que tiene el contenido original? Debe serlo. Supongo que el mero hecho de detectar contenido duplicado ya es complicado de por sí. No el algoritmo en sí, sino llevarlo a la escala brutal de parseo de contenido a la que se enfrenta Google.
Tener que comparar cada nuevo contenido, con otros contenidos ya indexados, para detectar si es duplicado o no, debe ser una tarea monumental como para pegarle fuego al Amazonas con el calor que desprenderían las CPUs de Google. Pero bueno, para eso son los “chicos listos” de Google, ¿no? Esperemos que espabilen.
Algunas ideas sobre cómo podría mejorar Google
- Google debería detectar de forma eficiente el contenido duplicado, y enterrarlo en las profundidades abisales de Internet. El contenido original debería aparecer siempre por encima. Google, ¿qué tal si compras CopyScape? Igual os vendría muy bien.
- Google debería encontrar alguna forma de premiar la calidad frente a la cantidad. El PageRank ya no es suficiente. Empresas como Demand Media no deberían estar donde están, y blogs con contenidos de alta calidad deberían tener mayor visibilidad.
- Google debería detectar de manera más eficiente casos de compra y venta de backlinks, o páginas que indexan rápida y sospechosamente de un mes para otro por un ingente incremento de links hacia ellas. De esta forma se evitarían casos como el citado anteriormente de JC Penny.
- Google debería buscar de forma más eficiente ciertos items. Por ejemplo, productos. Si yo estoy buscando cierto producto y pongo la palabra clave “comprar”, debería aparecerme dicho producto, en su versión más económica (o no) dependiendo de lo que yo seleccione. Google está a años luz de esto, abrumado por páginas y más páginas de spam, y casi pondría la mano en el fuego a que Groupon y Facebook se lo van a merendar en cuanto a recomendación social de productos se refiere.
El que no llora no mama
Sí, hacer un buscador es muy complicado, pero en Silicon Valley están acostumbrados a hacer cosas difíciles. El problema adicional que hay hoy en día, como comentan en Techcrunch, es que existe una percepción de que Google es intocable. Cuando una firma de capital riesgo piensa en invertir en un nuevo buscador no lo ven como una opción viable, así que simplemente apenas hay nuevas iniciativas.
Aún así, existen algunas startups como Gogobot o Blekko que apuntan maneras.
El tiempo pondrá las cosas en su sitio y Google espabilará (o no) para ofrecernos un mejor servicio. Porque, desde mi punta de vista, salta a la vista que el buscador de Google debe mejorar.
Personas clave en este artículo
1. Matt Cutts

Techcrunch: “Es un momento embarazoso para Google, no uno para celebrar. Realmente desearía que nuestros algoritmos u otros procesos hubieran cogido esto mucho más rápido, definitivamente no hay nada que celebrar. El spam es un problema difícil, y aún no estamos donde quiero que lleguemos. Tenemos algunas cosas listas a punto de salir, pero vamos a seguir trabajando en las granjas de contenido y el spam, hasta encontrar mejores formas de resolver el problema.”
2. Vanesa Fox
Experta en optimización de motores de búsqueda y ex-trabajadora de Google.

SearchEngineLand: “Ten cuidado cuando contrates una empresa de SEO. Lo que realmente necesitas es una empresa que te ayude a mejorar tu página web y el contenido que hay en ella. Si la empresa de SEO no te da detalles acerca de cómo va a hacer las cosas, ve con ojo, desconfía.”
8 lecturas que no debes perderte sobre las deficiencias de Google como buscador

1. Techcrunch: Necesitamos desesperadamente un nuevo (y mejor) Google
El problema es que el contenido en Internet está creciendo de manera exponencial y la gran mayoría de este contenido es spam. Este es creado por empresas sin escrúpulos que saben cómo manipular los sistemas de clasificación de páginas de Google para lograr que sus sitios aparezcan en la parte superior de los resultados de búsqueda. Al visitar estos sitios, te llevan a los sitios web de otras empresas que quieren vender sus productos. (A los spammers se les paga por cada clic.) …ir al artículo.
2. Broadstuff: Sobre la creciente ineficacia de Google
La preparación para la Navidad y Año Nuevo requiere la investigación de una serie de bienes de consumo para comprar, que por supuesto significaba utilizar Google para buscar para ellos y sus calificaciones de exámenes. Pero este año realmente me impactó lo mal que los sistemas de Google se han difundido, como típicamente nada en la página 1 de los resultados de la búsqueda era una forma de spam SEO – más típicamente un sitio que en realidad no se vende nada, sólo hace referencia a otros sitios (a menudo haciendo la misma cosa), mientras que algunos anuncios de deslizamiento (sin duda se vende como “relevantes”).

Google es como un monocultivo, y por lo tanto los parásitos tienen un gran impacto una vez que se han adaptado a él – sobre todo si Google ha “perdido la guerra”. Si la búsqueda es más heterogénea, a los spammers les resultaría más costoso para todos los sitios de estafa. Ese es un argumento muy interesante con respecto al nivel de dominio de mercado de Google… ir al artículo.
3. Techcrunch: La búsqueda aún apesta
Sí, la búsqueda es muy difícil. Pero el Silicon Valley es realmente bueno en hacer cosas difíciles. El verdadero problema es que hay una percepción de que Google es intocable en la búsqueda. Cuando una firma de capital riesgo ve el lanzamiento de un nuevo servicio de búsqueda, todo lo que puedo pensar es la catástrofe que ocurrió en Cuil. Y dado que las firmas de capital riesgo son las personas con mayor aversión a los riesgos en Silicon Valley, los dinero simplemente no fluye…ir al artículo
4. Paul Kedrosky: Lavavajillas, y cómo Google se come su propia cola
Google se ha convertido en una serpiente que consume a placer la cola de sus propias palabras clave. Los creadores de contenido basura sólo tiene que identificar algunas palabras que aparecen en las búsquedas rentables (como aparatos tecnológicos, vino, videojuegos, lecciones de kayak, etc), y escribir contenidos basura de forma barata y con regularidad sobre ellas, y ya está. En la web, nadie descubrirá que eres un creador de contenido “zombie”.
El resultado, sin embargo, es horrible. Páginas y páginas de resultados de Google que no son más que, prácticamente, publicidad disfrazada de artículos de dudosa calidad, originales o hechos con trozos de otros artículos. Me hace pensaren los oscuros días de 1999, antes de que Google llegara, cuando la búsqueda se había convertido en gran medida inútil, con resultados completamente llenos de spam y de información desordenada… ir al artículo.
5. Coding Horror: Problemas en la casa de Google
A lo largo de mi investigación tuve dudas persistentes que estábamos viendo serias grietas en los cimientos de la búsqueda algorítmica de la casa que construyó Google. Pero tenía miedo de escribir un artículo sobre el tema por temor a que me acusaran de ser un chiflado incompetente. No me sentía cómodo aireando esa opinión a los cuatro vientos, porque pensaba que debíamos estar haciendo algo obviamente erróneo. Es algo a lo que tendemos a pensar con frecuencia. La gravedad no puede estar equivocada. Simplemente es que somos torpes… ¿no?

No puedo dejar de notar que no somos el único sitio que tiene problemas graves con los resultados de búsqueda de Google en los últimos meses. De hecho, el ritmo del tambor de deterioro de la calidad de búsqueda de Google ha sido casi ensordecedor en los últimos tiempos… ir al artículo.
6. Manolo’s Shoe Blog: Google, Google, ¿Por qué has abandonado a “The Manolo”
“Manolo’s Shoe Blog”, un blog sobre zapatos, muestra una serie de ejemplos de cómo búsquedas en Google ofrecen primeros resultados a otras webs que copian su contenido, en vez de aparecer ellos los primeros…ir al artículo
7. ReadWriteWeb: ¿Cómo produce Demand Media 4000 piezas de contenido al día?
En agosto hicimos una review sobre Demand Media, uno de los mayores productores de contenido en la Web hoy en día. Wired Magazine recientemente comparó su negocio de contenidos con la producción en serie de Henry Ford aplicada a los coches. Demand Media produce actualmente 4.000 nuevas piezas de contenido al día. Es más, cada día está sindicando más y más contenido a los medios de comunicación fuera de su propia red de sitios web verticales. En otras palabras, la Demand Media se está convirtiendo en una fábrica de producción de contenidos para sitios de terceros, como Yahoo…ir al artículo
8. New York Times: (Sobre JC Penny) Los pequeños y sucios secretos de los buscadores
La compañía superó a millones de sitios, y no sólo en la búsqueda de vestidos, ropa de cama y resto de sus productos propios. Durante meses, estuvo en la cima para búsquedas como “vaqueros”, “decoración del hogar”, “muebles ” y decenas de otras palabras y frases, desde la insulsa y genérica “manteles” hasta la extraña y específica “cortinas de encaje”…ir al artículo
Te sugerimos otras entradas relacionadas...
No hay entradas relacionadas para esta publicación.
¿Necesitas desarrollar un proyecto web o para móviles? ¡Estamos disponibles!

Cokidoo, los creadores de Ontuts, desarrollamos proyectos tecnológicos centrados en redes sociales y aplicaciones web, aplicaciones móviles y consultoría web y bases de datos.
Somos jóvenes, inquietos, versátiles, apasionados por la innovación y enfocados en las nuevas tecnologías. Con Ontuts tratamos de compartir nuestro conocimiento adquirido en los distintos proyectos, ayudando a la comunidad y mostrando nuestra capacidad tecnológica.
Si necesitas un presupuesto sin compromiso, estamos disponibles, no dudes en contactar con nosotros.



Comentarios en esta publicación (32 comentarios)
¿Te ha gustado esta publicación? ¡Puedes compartir tu opinión con todos nosotros! Simplemente pincha aquí mismo.