{"id":697,"date":"2018-01-27T04:20:56","date_gmt":"2018-01-27T08:20:56","guid":{"rendered":"https:\/\/tecnojupiter.net\/?p=697"},"modified":"2023-05-26T08:36:27","modified_gmt":"2023-05-26T12:36:27","slug":"bloquear-user-agent-htaccess-rewritecond","status":"publish","type":"post","link":"https:\/\/tecnojupiter.test\/bloquear-user-agent-htaccess-rewritecond\/","title":{"rendered":"Bloquea todas las peticiones de User-Agent (bots) a trav\u00e9s\u00a0de Rewrite…"},"content":{"rendered":"
\n
\"Bloquear<\/figure><\/div>\n\n\n

Como mencionaba en otro post existen m\u00e1s de un Millon de User-Agent y el n\u00famero tal vez seguir\u00e1 aumentando, es casi imposible bloquearlos a todos y no todos pasaran por tu web, pero existen bots que forman parte de una lista negra de \u00abMalos Bots\u00bb.<\/p>\n\n\n\n

Estos son bots que se identifican como da\u00f1inos o al menos no \u00fatiles para el uso real de un sitio web.<\/p>\n\n\n\n

Hay dos razones para bloquear a estos User-Agent<\/h2>\n\n\n\n

La raz\u00f3n numero uno, demasiados bots innecesarios pueden poner una carga real en el servidor, sobre todo si tu web esta alojada en un servidor compartido, haciendo que el sitio web se ralentice para los usuarios reales.<\/p>\n\n\n\n

Estos bots malos no respetan las entradas en el archivo robots.txt<\/a><\/strong> y rastrean incluso las p\u00e1ginas bloqueadas. Esto puede significar un gran n\u00famero de p\u00e1ginas adicionales que se rastrean, lo que genera a\u00fan m\u00e1s carga en el servidor.<\/p>\n\n\n\n

Y lo ideal es mantener la carga del servidor lo m\u00e1s baja posible para no tener problemas con nuestro proveedor de alojamiento.<\/p>\n\n\n\n

La otra raz\u00f3n para bloquear estos bots es que est\u00e1n recolectando datos con fines nefastos, algunos son \u00abraspadores\u00bb que recopilan el contenido de un sitio web con el fin de reutilizarlo de forma ilegal en otro sitio, otros est\u00e1n buscando ciertos archivos o complementos en su sitio que se sabe que son inseguros para atacarlo luego, etc.<\/p>\n\n\n\n

Hay que mencionar, adem\u00e1s que estas listas negras son creadas y mantenidas por especialistas en seguridad que han hecho pruebas en los diferentes robots para determinar<\/strong> cu\u00e1les son leg\u00edtimos \/ beneficiosos y cu\u00e1les son malos bots<\/strong>.<\/p>\n\n\n\n

Este art\u00edculo supone que ya est\u00e1 familiarizado con la funcionalidad b\u00e1sica de WordPress y con la edici\u00f3n de ficheros en su hosting.<\/div>\n\n\n\n

Bloquea peticiones de User-agent indeseables<\/h2>\n\n\n\n
# denegar user-agent\nRewriteEngine On \nRewriteCond %{HTTP_USER_AGENT} CazoodleBot [NC,OR]\nRewriteCond %{HTTP_USER_AGENT} ^ChinaClaw [NC,OR]\nRewriteCond %{HTTP_USER_AGENT} ^Java [NC,OR]\nRewriteCond %{HTTP_USER_AGENT} ^Jakarta [NC,OR]\nRewriteCond %{HTTP_USER_AGENT} ^JetCar [NC,OR]\nRewriteCond %{HTTP_USER_AGENT} ^Zeus\nRewriteCond %{HTTP_USER_AGENT} libwww [NC,OR]\nRewriteCond %{HTTP_USER_AGENT} ^PeoplePal [NC,OR]\nRewriteCond %{HTTP_USER_AGENT} libwww-perl.* [NC,OR]\nRewriteCond %{HTTP_USER_AGENT} ^PHPCrawl [NC,OR]\nRewriteCond %{HTTP_USER_AGENT} ^WWWOFFLE [NC,OR]\nRewriteCond %{HTTP_USER_AGENT} ^Zend_Http_Client [NC,OR]\nRewriteCond %{HTTP_USER_AGENT} ZyBorg [NC]\nRewriteRule ^.*$ - [F]<\/pre>\n\n\n\n

El c\u00f3digo funciona de la siguiente manera, Apache hace una llamada RewriteEngine<\/strong><\/code> y toma la lista de condiciones RewriteCond%<\/strong><\/code> detecta f\u00e1cilmente los User-Agent escritos en el .htaccess<\/code> y les aplica la regla F<\/a> (Forbidden) que significa Prohibido y ^.*$<\/strong> que indica \u00abtodo\u00bb, toda la cadena.<\/p>\n\n\n\n

Ten en cuenta que la lista anterior esta mezclada aleatoriamente por razones de mantenimiento y tama\u00f1o, solo esta un porci\u00f3n peque\u00f1a de la lista pero puedes verla completa en Cloudup<\/a>.<\/p>\n\n\n\n

Puedes mantener el archivo actualizado si debes bloquear nuevos bots solo edita tu .htaccess en la linea correspondiente y agrega el nuevo User-Agent que causa problema en tu sitio web.<\/p>\n","protected":false},"excerpt":{"rendered":"

En este post te hablo de la importancia de bloquear algunos user-agent (bots), que pasan por nuestra web y como bloquearlos a trav\u00e9s\u00a0de RewriteCond…<\/p>\n","protected":false},"author":1,"featured_media":740,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_seopress_robots_primary_cat":"","_editorskit_title_hidden":false,"_editorskit_reading_time":0,"_editorskit_is_block_options_detached":false,"_editorskit_block_options_position":"{}","_kad_post_transparent":"","_kad_post_title":"","_kad_post_layout":"","_kad_post_sidebar_id":"","_kad_post_content_style":"","_kad_post_vertical_padding":"","_kad_post_feature":"","_kad_post_feature_position":"","_kad_post_header":false,"_kad_post_footer":false,"footnotes":""},"categories":[4],"tags":[23,18],"_links":{"self":[{"href":"https:\/\/tecnojupiter.test\/wp-json\/wp\/v2\/posts\/697"}],"collection":[{"href":"https:\/\/tecnojupiter.test\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/tecnojupiter.test\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/tecnojupiter.test\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/tecnojupiter.test\/wp-json\/wp\/v2\/comments?post=697"}],"version-history":[{"count":1,"href":"https:\/\/tecnojupiter.test\/wp-json\/wp\/v2\/posts\/697\/revisions"}],"predecessor-version":[{"id":2940,"href":"https:\/\/tecnojupiter.test\/wp-json\/wp\/v2\/posts\/697\/revisions\/2940"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/tecnojupiter.test\/wp-json\/wp\/v2\/media\/740"}],"wp:attachment":[{"href":"https:\/\/tecnojupiter.test\/wp-json\/wp\/v2\/media?parent=697"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/tecnojupiter.test\/wp-json\/wp\/v2\/categories?post=697"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/tecnojupiter.test\/wp-json\/wp\/v2\/tags?post=697"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}