Cómo eliminar datos redundantes en Linux con Fdupes

A nadie le gustan los archivos duplicados. Ocupan espacio innecesario en un sistema y estorban. Afortunadamente, en Linux, hay una manera de eliminar datos redundantes y limpiar archivos duplicados, usando Fdupes.

Instalar Fdupes

La herramienta Fdupes es una de las mejores herramientas de deduplicación de línea de comandos en la plataforma Linux. Cuando se ejecuta, puede escanear cualquier directorio en busca de archivos duplicados, detectar su ubicación exacta y convertir los duplicados en enlaces simbólicos, tanto enlaces físicos como enlaces blandos. Lo mejor de todo es que al convertir los duplicados en enlaces del sistema, reduce el espacio y mantiene los archivos intactos en la misma ubicación.

Fdupes es fácil de instalar y tiene mucho soporte dentro de la mayoría de las distribuciones de Linux que existen. De hecho, incluso FreeBSD tiene el software disponible. Para que el software funcione, inicie una terminal e ingrese los comandos que corresponden a su sistema operativo Linux.

Ubuntu

sudo apt install fdupes

Debian

sudo apt-get install fdupes

Arch Linux

Fdupes está en Arch Linux, a través del repositorio «Comunidad». Lamentablemente, el repositorio «Comunidad» no está configurado de forma predeterminada. Para instalar este programa, primero deberá editar el archivo Pacman.conf.

  Cómo cambiar automáticamente el nombre de los archivos multimedia en Linux con FileBot

Para editar el archivo de configuración, ábralo en el editor de texto Nano.

sudo nano /etc/pacman.conf

En el archivo de configuración, elimine «#» de delante de todo lo relacionado con «Comunidad». Tenga en cuenta que todos los «#» deben desaparecer o el repositorio no funcionará. Cuando haya terminado, guárdelo con Ctrl + O y salga con Ctrl + X.

Sincroniza el nuevo repositorio de la comunidad con Pacman.

sudo pacman -Syy

Ahora que la fuente de software de la «Comunidad» se ha sincronizado correctamente, Arch Linux tiene acceso completo a ella. Termine el proceso instalando la aplicación Fdupes a través del administrador de paquetes.

sudo pacman -S fdupes

Fedora

sudo dnf install fdupes

OpenSUSE

sudo zypper install fdupes

Escanear en busca de duplicados

Antes de que Fdupes pueda eliminar archivos redundantes, necesita saber dónde están. Para encontrar los archivos, deberá utilizar el modificador r. Con el interruptor r, podrá buscar en todas las carpetas de su PC con Linux, junto con cada subcarpeta, haciendo que la búsqueda de duplicados sea mucho, mucho más rápida.

Siga las instrucciones a continuación para aprender cómo encontrar y eliminar archivos duplicados en varias ubicaciones en su PC con Linux.

Duplicados en la carpeta de inicio

Uno de los principales lugares donde los usuarios almacenan archivos es / home /. La razón por la que esta carpeta contiene toneladas de archivos es que todo lo que hace un usuario en Linux se coloca aquí. Como resultado, los archivos se acumulan con el tiempo y, a menudo, se acumulan duplicados. Para encontrar estos duplicados, abra una terminal y apunte fdupes a su carpeta de inicio.

  Cómo configurar un software RAID en Linux

fdupes -r ~/

o, para escanear a otro usuario en su PC, que no haya iniciado sesión actualmente, haga:

fdupes -r /home/username/

Después de ejecutar el escaneo, la herramienta devolverá una lista completa de duplicados que encuentre en el directorio de inicio. Para guardar esta información, canalice la salida a un archivo en la carpeta Documentos.

fdupes -r ~/ >> ~/Documents/fdupes-scan-home.txt

o

fdupes -r /home/username/ >> ~/Documents/fdupes-scan-home-user.txt

Duplicados en el sistema de archivos raíz

Fdupes tiene la capacidad de escanear cualquier ubicación, y no solo la carpeta de inicio. Si está tratando de encontrar archivos duplicados en el sistema de archivos raíz de su PC con Linux, esto es lo que debe hacer.

En una terminal, cambie el shell de un usuario normal a la cuenta de root. Cambiar de una cuenta tradicional a Root permitirá que la aplicación Fdupes escanee en ubicaciones que están fuera de los límites de una configuración normal.

sudo -s

o

su -

Como root, escanee el sistema de archivos raíz usando Fdupes.

fdupes -r /

Alternativamente, escanee una ubicación específica, en lugar de todo el sistema Root con:

fdupes -r /location/on/your/pc

¿Necesita exportar los resultados del escaneo a un archivo para más adelante? Ejecute este comando.

fdupes -r / >> /home/username/Documents/fdupes-scan.txt

o

fdupes -r /location/on/your/pc >> /home/username/Documents/fdupes-scan.txt

Eliminar datos redundantes

La exploración de archivos duplicados es una parte fundamental para eliminar los datos redundantes. El siguiente paso es lidiar con los resultados y eliminar las redundancias. Afortunadamente, deshacerse de los datos redundantes es increíblemente rápido. Lo mejor de todo es que no es necesario eliminar nada, ya que Fdupes admite el intercambio de archivos reales con enlaces simbólicos.

  Cómo acceder de forma remota a una PC con Linux desde un navegador con DWService

Hay dos tipos de deduplicaciones que admite Fdupes: enlaces físicos y enlaces flexibles. Para obtener los mejores resultados, recomendamos utilizar enlaces físicos, ya que no se distinguen de los archivos reales. Sin embargo, los enlaces simbólicos suaves también funcionan. Para deduplicar, haga lo siguiente en una terminal.

Nota: ¡No reemplace los datos duplicados en todo el sistema a menos que comprenda los riesgos que pueden ocurrir!

Reemplazo de enlace duro

fdupes -rH /home/username/

o, para duplicados en todo el sistema:

sudo -s
fdupes -rH /root/file/location

Reemplazo de enlace suave

fdupes -rS /home/username/

o, para todo el sistema:

fdupes -rS /root/file/location