{"id":625,"date":"2018-01-19T13:23:06","date_gmt":"2018-01-19T17:23:06","guid":{"rendered":"https:\/\/tecnojupiter.net\/?p=625"},"modified":"2023-04-11T16:53:00","modified_gmt":"2023-04-11T20:53:00","slug":"crear-archivo-robots-txt-wordpress","status":"publish","type":"post","link":"https:\/\/tecnojupiter.test\/crear-archivo-robots-txt-wordpress\/","title":{"rendered":"C\u00f3mo crear el archivo robots.txt para tu web en WordPress"},"content":{"rendered":"
Todos los buscadores por mencionar los m\u00e1s conocidos c\u00f3mo Google<\/strong>, Bing<\/strong>, Yahoo<\/strong>, utilizan un programa que a diario va indexando millones de sitios web buscando todo tipo de contenido de acuerdo al tipo de bot la mayor\u00eda se encarga de indexar por ejemplo; contenido nuevo escrito en tu web, im\u00e1genes y enlaces.<\/p>\n\n\n\n A este software se le denomina de diferentes formas como bot, robots, ara\u00f1a, crawler, etc. En el caso de Google, su robot principal se le conoce como Googlebot.<\/p>\n\n\n\n Índice de contenido<\/p> Un archivo de esta naturaleza en tan necesario porque uno de tus objetivos es mejorar tu posici\u00f3n SEO en los motores de b\u00fasqueda<\/a>, dependiendo de la tem\u00e1tica de tu sitio web, este facilita la indexaci\u00f3n indic\u00e1ndole a los bots que es lo que no deben rastrear.<\/p>\n\n\n\n Hay que mencionar, adem\u00e1s que si enviaste la url del Sitemap.xml<\/strong> de tu sitio a Google y Bing o a cualquier otro motor de b\u00fasqueda para que empiecen a indexar tu contenido, no es necesario que indiques la url en el fichero robots.<\/p>\n\n\n\n Si la indicas cualquier bot puede tener acceso a el y ver lo que quieres indexar, puede que te interese que otros buscadores no tan famosos como (Google o Yahoo) accedan a el, si quieres que eso pase puedes indicarle la URL del sitemap en este archivo para facilitarles la tarea, ya depende de tus objetivos.<\/p>\n\n\n\n Adem\u00e1s el fichero robots.txt te permite denegar o permitir el acceso a determinados bots o impedir que alg\u00fan contenido de ciertas carpetas sea indexado.<\/p>\n\n\n\n Cuando un bot llegue a tu web este comprobara si existe el archivo robots.txt, y si ese es el caso, seguir\u00e1 las instrucciones que ah\u00ed se le indiquen para analizar la informaci\u00f3n, si bien ese el funcionamiento general de la mayor\u00eda de los bot, hay que tener en cuenta que no todos respetaran esas reglas.<\/p>\n\n\n\n Como todos sabemos hay personas que se dedican a fines pocos \u00e9ticos como el SPAM, etc., muchos de ellos utilizan sus propios bots para captar cualquier tipo de informaci\u00f3n de una web y darle un mal uso, salt\u00e1ndose cualquier regla escrita en el fichero robots.txt<\/a>.<\/p>\n\n\n\n Por eso es importante no colocar informaci\u00f3n comprometedora en el archivo robots y proteger la informaci\u00f3n privada con contrase\u00f1as que sean lo suficientemente seguras.<\/p>\n\n\n\n Tengo que mencionarte adem\u00e1s para que tengas una idea que no solo hay 5 bots, existen m\u00e1s de un Mill\u00f3n de bot (ara\u00f1as) que cada d\u00eda est\u00e1n indexando todo tipo de informaci\u00f3n y el n\u00famero quiz\u00e1s seguir\u00e1 aumentando, es casi imposible bloquearlos a todos y no todos pasaran por tu web.<\/p>\n\n\n\n Pero creando un archivo robots.txt podr\u00e1s establecer reglas que permitan l\u00edmites para esos bots para que no afecten el SEO de la web y a su vez evitar que los recursos del servidor no se vean comprometidos por \u201cexceso de visitas\u201d, ya que algunos bots consumen muchos recursos<\/strong>.<\/p>\n\n\n\n Crear el archivo robots.txt es sumamente f\u00e1cil y son 3 las maneras en la que lo puedes crear:<\/p>\n\n\n\n Accediendo al cPanel<\/strong> ubicando la categor\u00eda ARCHIVOS,<\/strong> luego hacemos clic en la opci\u00f3n Administrador de archivos.<\/strong><\/p>\n\n\n Nos ubicamos en la carpeta ra\u00edz o directorio ra\u00edz de nuestro sitio web y hacemos clic en la opci\u00f3n +Archivo<\/strong> para crear un archivo nuevo, se abre la ventana y escribimos el nombre robots<\/strong> y la extensi\u00f3n de formato final que es .txt <\/strong>luego clic en el bot\u00f3n \u00abCreate New File<\/strong>\u00ab.<\/p>\n\n\n Escribimos:<\/p>\n\n\n\n User-agent: * Que es el fichero m\u00e1s simple de robots para WordPress y guardamos los cambios.<\/p>\n\n\n Donde;<\/p>\n\n\n\n User-agent: *<\/strong> (Indicamos que estas reglas son aplicables a todos los buscadores<\/em>). Abriendo un nuevo archivo en el editor de texto y gu\u00e1rdandolo con el nombre robots.txt. Solo tendr\u00e1s que subirlo al directorio ra\u00edz de tu web a trav\u00e9s del cPanel o cualquier medio que uses.<\/p>\n\n\n\n Si tienes instalado y activo el plugin Yoast SEO, tambi\u00e9n puedes crear el archivo robots solo debes ir a la secci\u00f3n de \u201cHerramientas<\/strong>\u201d > \u201cEditor de archivos<\/strong>\u201d y crear tu archivo robots.txt.<\/p>\n\n\n\n En la imagen anterior es referencia de ejemplo ya que no existe un robots.txt perfecto porque todo depende de las necesidades de tu web<\/strong>.<\/p>\n\n\n\n Y no quiero indicarte que coloques las t\u00edpicas lineas que encuentras en otros sitios web como por ejemplo:<\/p>\n\n\n\n User-agent: * Que puedan da\u00f1ar tu estrategia de SEO<\/strong>.<\/p>\n\n\n\n Mencione anteriormente que las lineas m\u00e1s comunes del fichero robots que te encontrabas en un sitio web WordPress eran:<\/p>\n\n\n\n User-agent: * Sin embargo ya esas lineas no son necesarias, porque WordPress ya les esta aplicando Noindex<\/strong> mediante encabezado HTTP de X-Robots-Tag<\/strong> al directorio \/wp-admin\/admin-ajax.php.<\/p>\n\n\n\n Puedes mirarlo por ti mismo haciendo uso de la consola de herramientas de Google Chrome en el panel de administraci\u00f3n de WordPress<\/strong>. Haciendo clic derecho con el mouse en Inspeccionar<\/strong> y luego clic en la pesta\u00f1a Network<\/strong>.<\/p>\n\n\n Como puedes observar esta indic\u00e1ndole a los motores de b\u00fasqueda que no rastreen o indexen la p\u00e1gina, archivo o directorio particular.<\/p>\n\n\n\n A\u00fan as\u00ed si deseas seguir usando la directivas puedes hacerlo, pero no tiene sentido que sigas us\u00e1ndola.<\/p>\n\n\n\n Para saber si tienes el archivo robots creado solo tendr\u00e1s que escribir \/robots.txt<\/strong> al final de tu dominio. Por ejemplo: www.tudominio.net\/robots.txt<\/p>\n\n\n\n Se recomienda no incluir en un fichero robots.txt m\u00e1s de 100 l\u00edneas de Disallow<\/strong>.<\/p>\n\n\n\n La regla Disallow se utiliza cuando se quiera bloquear carpetas completas.<\/p>\n\n\n\n Si es s\u00f3lo una p\u00e1gina suelta, las etiquetas meta \u00abnoindex\u00bb son m\u00e1s eficaces.<\/p>\n\n\n\n\u00bfPor qu\u00e9 es tan necesario crear un archivo robots.txt en WordPress?<\/span><\/h2>\n\n\n\n
C\u00f3mo crear el archivo robots.txt en WordPress<\/span><\/h2>\n\n\n\n
#1 – Utilizando el editor de texto del hosting:<\/strong><\/span><\/h3>\n\n\n\n
<\/figure><\/div>\n\n\n
<\/figure><\/div>\n\n\n
Ya creado el robots.txt este aparecer\u00e1 en la carpeta ra\u00edz hacemos clic derecho en el y luego clic en la opci\u00f3n \u00abEdit<\/strong>\u00bb para agregar los comandos y par\u00e1metros.<\/p>\n\n\n<\/figure><\/div>\n\n\n
Disallow: \/wp-admin\/
Allow: \/wp-admin\/admin-ajax.php<\/p>\n\n\n\n<\/figure><\/div>\n\n\n
Disallow:<\/strong> (Indicamos que no indexe o denegamos el acceso a la carpeta o directorio que indiquemos).
Allow:<\/strong> (Se utiliza para permitir el acceso a un directorio especifico que se haya bloqueado con Disallow).<\/p>\n\n\n\n#2 – Con tu editor de texto preferido bien sea el bloc de notas de Windows, Notepad++<\/a>, etc.<\/span><\/h3>\n\n\n\n
#3 – Utilizando el Plugins para SEO Yoast<\/span><\/h3>\n\n\n\n
Allow: \/wp-admin\/admin-ajax.php
Disallow: \/wp-admin\/
Disallow: \/wp-login
Allow: \/wp-content\/uploads\/*
Allow: \/wp-content\/*.js
Allow: \/wp-content\/*.css
Allow: \/wp-includes\/*.js
Allow: \/wp-includes\/*.css
Disallow: \/tag\/*\/page\/
Disallow: \/tag\/*\/feed\/
Disallow: \/page\/
Disallow: \/comments\/
Disallow: \/xmlrpc.php
Disallow: \/cgi-bin
Disallow: \/author
Disallow: \/*replytocom=
Disallow: \/wp-content\/plugins\/
Disallow: \/wp-content\/themes\/
Disallow: \/wp-includes\/<\/p>\n\n\n\n
Disallow: \/wp-admin\/
Allow: \/wp-admin\/admin-ajax.php<\/p>\n\n\n\nConclusi\u00f3n<\/span><\/h2>\n\n\n\n