lunes, 21 de diciembre de 2009

Buscar patrones (palabras) en multiples documentos.GREP.

Con buscar patrones, en este caso, me refiero, por ejemplo en ver en una carpeta donde tenemos 1000 documentos, en cuales (y dónde) sale la palabra "jamón", por ejemplo.
Para esto vamos a usar la herramienta Cygwin, que sirve para utilizar comando linux de consola desde Windows.
Bueno simplemente buscandola por su nombre, se descarga gratuitamente y se ejecuta normal, como cualquier aplicacion windows.
No saldrá una consola, tecleamos "cd c:" + enter, y luego "cd nombre_carpeta_contenedora" + enter, y suponiendo que la carpeta donde queremos realizar la búsqueda esté en C: y se llame "carpeta_contenedora", ya no hay que navegar más.
Ahora una vez aquí, tendremos que escribir esto :

GREP -i -w "patron_busqueda" doc_*>salida.txt

Ahora por pasos:
GREP --> es la herramienta de búsqueda que usamos

-i --> es un parametro opcional, para que no diferencia entre mayúsculas y minúsculas

-w --> otro parámetro opcional, para que busque sólo las ocurrencias exactas de la palabra, no subcadenas

Nota: existen muchos otros parametro útiles para esta herramienta.

"patron_busqueda" --> en un uso sencillo, es la palabra entrecomillada que queremos buscar, aqui tambien se pueden usar todo tipo de expresiones regulares.

doc_* -->esto quiere decir que haría la búsqueda en todos los archivos que empiecen por doc_ (es un ejemplo, se podria poner lo que convenga)

>salida.txt --> esto es para que cree un documento que se llamara "salida.txt" o como queramos poner, donde pondrá el nombre del documento en el que se ha encontrado, dos puntos y la frase en la que se a encontrado.

No hay comentarios:

Publicar un comentario