Si escribes contenido original día tras día, ya eres consciente del hecho de que tus mensajes terminarán en un montón de sitios de SPAM en pocos días, a veces incluso en pocos minutos. Algunos usuarios incluso señalaron que el sitio con contenido robado superaba en rango al original. Es muy frustrante como propietario de un sitio web ver que alguien está robando tu contenido sin permiso, monetizándolo, superándote en SERPs, y robando tu audiencia. El Raspado de Contenido es un gran problema en estos días considerando que es tan fácil para alguien robar su contenido. En este artículo, cubriremos qué es el raspado de contenido de blogs, cómo atrapar raspadores de contenido, cómo tratar con raspadores de contenido, cómo puede reducir y prevenir el raspado de contenido, cómo aprovechar el raspado de contenido, cómo hacer dinero con los raspadores de contenido, y si el raspado de contenido es siempre bueno.
¿Qué es el Raspado de Contenido de Blogs?
El raspado de contenido de blogs es un acto que normalmente se realiza con scripts que extraen contenido de numerosas fuentes y lo arrastran a un sitio. Es tan fácil ahora que cualquiera puede instalar un sitio de WordPress, poner un tema libre o comercial, e instalar algunos plugins que irán y rasparán el contenido de los blogs seleccionados, para que pueda ser publicado en su sitio.
¿Por qué están robando mi contenido?
Algunos de nuestros usuarios nos han preguntado por qué están robando mi contenido. La respuesta simple es porque usted es IMPRESIONANTE. La verdad es que estos raspadores de contenido tienen motivos ocultos. A continuación se presentan algunas razones por las que alguien podría raspar su contenido:
- Comisión de afiliados – Hay algunos vendedores de afiliados sucios por ahí que sólo quiere explotar el sistema para hacer unos pocos dólares extra. Ellos usarán su contenido y el contenido de otros para traer tráfico a su sitio a través del motor de búsqueda. Estos sitios suelen estar dirigidos a un nicho específico, por lo que tienen productos relacionados que están promocionando.
- Generación de clientes potenciales – A menudo vemos a abogados y agentes inmobiliarios haciendo esto. Quieren parecer líderes de la industria en sus pequeñas comunidades. No tienen el ancho de banda para producir contenido de calidad, por lo que salen y raspan el contenido de otras fuentes. A veces, ni siquiera se dan cuenta de esto porque están pagando a una escoria $30 al mes para añadir contenido y ayudarles a obtener un mejor SEO. Ya nos hemos encontrado con bastantes de ellos en el pasado.
- Ingresos por publicidad – Algunas personas sólo quieren crear un «hub» de conocimiento. Una ventanilla única para los usuarios de un nicho específico. Si tuviera un centavo por cada vez que alguien ha hecho esto con nuestro contenido, entonces tendríamos unos pocos cientos de centavos. A menudo notamos que el contenido de nuestro sitio está siendo raspado. El raspador siempre responde, lo hacía por el bien de la comunidad. Excepto que el sitio está lleno de anuncios.
Estas son sólo algunas de las razones por las que alguien robaría su contenido.
Cómo atrapar los raspadores de contenido?
La captura de rascadores de contenido es una tarea tediosa y puede llevar mucho tiempo. Hay algunas maneras que usted puede utilizar para atrapar raspadores de contenido.
Buscar en Google con los títulos de su mensaje
Sí, eso es tan doloroso como suena. Este método probablemente no vale la pena, especialmente si está escribiendo sobre un tema muy popular.
Trackbacks
Si agregas enlaces internos en tus mensajes, notarás un trackback si un sitio roba tu contenido. De esta manera es más o menos el raspador que le dice que están raspando su contenido. Si está usando Akismet, entonces muchos de estos trackbacks aparecerán en la carpeta SPAM. Una vez más, esto sólo funcionará si tienes enlaces internos en tus mensajes.
Herramientas para webmasters de Google
Si utiliza las herramientas para webmasters de Google, es probable que conozca los enlaces a la página de su sitio. Si busca en «Tráfico», verá una página que dice Enlaces a su sitio. Lo más probable es que sus raspadores estén entre los mejores. Tendrán cientos si no miles de enlaces a tus páginas (considerando que tienes enlaces internos).
Usos poco comunes de FeedBurner
Si has configurado Feedburner para tu blog de WordPress, entonces puedes ver algunos usos poco comunes. En la pestaña Analizar bajo Estadísticas de alimentación, verá «Usos no comunes». Allí verá una lista de sitios.
Cómo tratar con los Raspadores de Contenido
Hay pocos enfoques que la gente toma cuando se trata de rascadores de contenido. El Enfoque de No hacer nada, Matarlos a todos, Aprovechar el enfoque de ellos.
El enfoque de no hacer nada
Este es, con mucho, el enfoque más fácil que puede adoptar. Por lo general, los bloggers más populares recomendarían esto porque toma MUCHO tiempo luchar contra los raspadores. Este enfoque simplemente recomienda que «en lugar de luchar contra ellos, dediques tu tiempo a producir contenidos de mayor calidad y a divertirte». Ahora obviamente si es un blog conocido como Smashing Magazine, CSS-Tricks, Problogger, u otros, entonces no tienen que preocuparse por ello. Son sitios de autoridad a los ojos de Google.
Sin embargo, durante la actualización de Panda, sabemos que algunos sitios buenos fueron marcados como rascadores porque google pensó que sus rascadores eran contenido original. Así que este enfoque no siempre es el mejor en nuestra opinión.
Matarlos a todos Aproximación
Es exactamente lo contrario del «Enfoque de no hacer nada». En este enfoque, simplemente póngase en contacto con el raspador y pídale que retire el contenido. Si se niegan a hacerlo o simplemente no responden a sus solicitudes, entonces usted presenta una DMCA (Digital Millennium Copyright Act) con su anfitrión. Según nuestra experiencia, la mayoría de los sitios web de scraping no disponen de un formulario de contacto. Si lo hacen, entonces utilícenlo. Si no tienen el formulario de contacto, entonces usted necesita hacer una Búsqueda Whois.
Puede ver la información de contacto en el contacto administrativo. Normalmente el contacto administrativo y técnico es el mismo. El whois también muestra el registrador de dominios. La mayoría de las empresas de alojamiento web y registradores de dominios más conocidas disponen de formularios DMCA o correos electrónicos. Usted puede ver que esta persona específica está con Hostgator debido a sus servidores de nombre. HostGator tiene un formulario para quejas DMCA. Si el servidor de nombres es algo así como ns1.theirdomain.com, entonces tienes que profundizar haciendo búsquedas inversas de IP y buscando IPs.
También puede utilizar un servicio de terceros para DMCA.com para las demoliciones.
Jeff Starr en su artículo sugiere que deberías bloquear las IPs del tipo malo. Acceda a sus registros para su dirección IP, y luego bloquéela con algo como esto en su archivo root.htaccess:
1Negar desde 123.456.789
También puede redirigirlos a una fuente ficticia haciendo algo como esto:
12RewriteCond %{REMOTE_ADDR} 123.456.789. RewriteRule .* http://dummyfeed.com/feed[R,L]
Puedes ser muy creativo aquí, como sugiere Jeff. Envíalos a fuentes de texto realmente grandes llenas de Lorem Ipsum. Puedes enviarles algunas imágenes desagradables de cosas malas. También puede enviarlos de vuelta a su propio servidor causando un bucle infinito que bloqueará su sitio.
El último enfoque que tomamos es aprovecharnos de ellos.
Cómo aprovechar los rascadores de contenido
Este es nuestro enfoque de tratar con los rascadores de contenido, y resulta bastante bien. Esto ayuda a nuestro SEO así como también nos ayuda a ganar dinero extra. La mayoría de los raspadores utilizan su RSS Feed para robar su contenido. Así que estas son algunas de las cosas que puedes hacer:
- Enlace Interno – Necesita interconectar el CRAP fuera de sus mensajes. Con la función de Enlace Interno en WordPress 3.1, ahora es más fácil que nunca. Cuando usted tiene enlaces internos en su artículo, le ayuda a aumentar las vistas de página y reducir la tasa de rebote en su propio sitio. En segundo lugar, le consigue backlinks de la gente que está robando su contenido. Por último, te permite robar su audiencia. Si eres un blogger talentoso, entonces entiendes el arte de los enlaces internos. Usted tiene que colocar sus enlaces en palabras clave interesantes. Haga que sea tentador para el usuario hacer clic en él. Si haces eso, entonces la audiencia del raspador también hará clic en él. Así de fácil, tomaste a un visitante de su sitio y los trajiste de vuelta a donde deberían haber estado en primer lugar.
- Auto Link Keywords with Affiliate Links – Hay algunos plugins como Ninja Affiliate y SEO Smart Links que reemplazarán automáticamente las palabras clave asignadas con enlaces de afiliados. Por ejemplo: HostGator, StudioPress, MaxCDN, Gravity Forms <<< Todo esto será reemplazado automáticamente por enlaces de afiliados cuando este post salga en vivo.
- Sea creativo con RSS Footer – Puede utilizar el RSS Footer o WordPress SEO by Yoast Plugin para añadir elementos personalizados a su RSS Footer. Usted puede agregar casi cualquier cosa que desee aquí. Conocemos a algunas personas que les gusta promocionar sus propios productos a sus lectores RSS. Así que añadirán banners. Adivina qué, ahora esos banners también aparecerán en el sitio web de estos scraper. En nuestro caso, siempre añadimos una pequeña cláusula de exención de responsabilidad en la parte inferior de nuestros mensajes en nuestros canales RSS. Se lee simplemente como «How to Put Your WordPress Site in Read Only State for Site Migrations and Maintenance is a post from: AprenderWP which is not allowed to be copied on other sites». Al hacer esto, obtenemos un enlace al artículo original del sitio de scraper que permite que google y otros motores de búsqueda sepan que somos la autoridad. También permite que sus usuarios sepan que el sitio está robando nuestro contenido. Si eres bueno con los códigos, entonces puedes volverte loco. Por ejemplo, añadir mensajes relacionados sólo para sus lectores RSS, y un montón de otras cosas. Echa un vistazo a nuestra guía para manipular completamente tu feed RSS de WordPress.
Cómo puede reducir el raspado del contenido del blog y posiblemente prevenirlo
Teniendo en cuenta si usted toma nuestro enfoque de un montón de enlaces internos, la adición de enlaces de afiliados, banners rss y tales posibilidades son que usted reducirá el raspado de contenido a una buena medida. Si usted toma la sugerencia de Jeff Starr de redirigir los rascadores de contenido, eso también detendrá esos rascadores. Aparte de lo que hemos compartido anteriormente, hay algunos otros trucos que puedes usar.
Feed RSS Completo vs. Resumen
Ha habido un debate en la comunidad de bloggers sobre si tener un feed RSS completo o un feed RSS resumido. No vamos a entrar en muchos detalles sobre ese debate, sin embargo, uno de los PROS de tener un Resumen Sólo RSS es que se evita el raspado de contenido. Puedes cambiar la configuración yendo a tu panel de administración de WordPress y yendo a Configuración » Lectura. A continuación, cambie la configuración para cada artículo en una presentación de feeds: Resumen.
Nota: Tenemos el feed completo porque nos preocupamos más por nuestros lectores RSS que por los spammers.
Trackback SPAM
Trackbacks y Pingbacks definitivamente tenían grandes usos, sin embargo, ahora están siendo constantemente abusados. A menudo los temas muestran trackbacks y pingbacks debajo o entre los comentarios. Esto le da al spammer un incentivo para raspar su sitio y enviar trackbacks. Si por error lo aprueba, entonces ellos obtienen un vínculo de retroceso y lo mencionan en su sitio. He aquí cómo puedes desactivar Trackbacks en todas las publicaciones futuras. Aquí hay un artículo que te mostrará cómo deshabilitar trackbacks y pings en los posts existentes de WordPress también.
¿Es bueno el raspado de contenido?
Puede serlo. Si usted ve que está ganando dinero con el sitio del raspador, entonces seguro que puede serlo. Si usted ve mucho tráfico desde el sitio de un raspador, entonces puede serlo. En la mayoría de los casos, sin embargo, no lo es. Siempre debes intentar que te quiten el contenido. Pero te darás cuenta de que a medida que tu blog crece, es casi imposible hacer un seguimiento de todos los raspadores de contenido. Todavía enviamos quejas a la DMCA, sin embargo sabemos que hay toneladas de otros sitios que están robando nuestro contenido y que no podemos seguirles el ritmo.
¿Cuáles son tus pensamientos? ¿Utiliza algún otro mecanismo para evitar el raspado del contenido? Me encantaría escuchar tus pensamientos.
Deja una respuesta