Eliminar filas duplicadas de datos en Excel

Cuando se trabaja con grandes cantidades de datos, eliminar o limpiar registros duplicados puede ser mucho trabajo. Excel simplifica esta tarea. A continuación se presentan dos posibles escenarios y soluciones para optimizar sus hojas de cálculo.

Cuando se trabaja con grandes cantidades de datos, eliminar o limpiar registros duplicados puede ser mucho trabajo. Excel simplifica esta tarea. A continuación se presentan dos posibles escenarios y soluciones para optimizar sus hojas de cálculo.

Nota : la información de este artículo se aplica a Excel 2019, Excel 2016, Excel 2013, Excel 2010 y Excel 2007.

Eliminar registros de datos duplicados en Excel

Los programas de hojas de cálculo como Excel a menudo se usan como bases de datos para cosas como inventarios de piezas, registros de ventas y listas de correo.

Las bases de datos en Excel se componen de tablas de datos que se organizan en filas de datos llamadas registros. En un registro, los datos en cada celda o campo en la fila están relacionados, como el nombre, la dirección y el número de teléfono de una empresa.

Un problema común que ocurre cuando una base de datos crece en tamaño es la posibilidad de registros duplicados o filas de datos. Esta duplicación ocurre cuando:

  • Registros completos se ingresan en la base de datos más de una vez. Esto da como resultado dos o más registros idénticos
  • Varios registros tienen uno o más campos, como un nombre y una dirección, que contienen los mismos datos.

Los registros duplicados causan problemas. Un problema de ejemplo es que un registro duplicado puede enviar múltiples copias de documentos a la misma persona cuando la información de la base de datos se utiliza en una combinación de correspondencia. Para evitar problemas, busque y elimine registros duplicados regularmente.

Es fácil seleccionar registros duplicados en una muestra pequeña como la de la imagen de arriba. Pero cuando las tablas de datos contienen cientos o miles de registros, se hace difícil seleccionar registros duplicados, especialmente registros parcialmente coincidentes.

Para facilitar la realización de esta tarea, Excel tiene una herramienta de datos integrada llamada Eliminar duplicados. Eliminar duplicados busca y elimina registros idénticos y parcialmente coincidentes.

Cuando utiliza Eliminar duplicados, los registros idénticos y parcialmente coincidentes deben tratarse por separado. Esto se debe a que el cuadro de diálogo Eliminar duplicados muestra los nombres de campo para la tabla de datos seleccionada y usted elige qué campos incluir en la búsqueda de registros coincidentes:

  • Para registros idénticos, busque todos los campos. Deje marcas de verificación junto a todos los nombres de columna o campo.
  • Para registros que coinciden parcialmente, deje marcas de verificación junto a los campos que se van a hacer coincidir.

Nombres de campo frente a letras de columna

La herramienta Eliminar duplicados consta de un cuadro de diálogo donde puede elegir qué campos coincidentes buscar seleccionando el campo o los nombres de columna deseados.

La información que muestra el cuadro de diálogo, ya sea nombres de campo o letras de columna, depende de si sus datos contienen una fila de encabezados o encabezados, en la parte superior de la tabla de datos como se ve en la imagen de arriba.

Si sus datos tienen encabezados, coloque una marca de verificación junto a Mis datos tienen encabezados. Esto hace que Excel muestre los nombres en esta fila como nombres de campo en el cuadro de diálogo.

Si sus datos no tienen una fila de encabezado, el cuadro de diálogo muestra las letras de columna apropiadas para el rango de datos seleccionado.

Rango contiguo de datos

Para que la herramienta Eliminar duplicados funcione correctamente, la tabla de datos debe ser un rango contiguo de datos. La tabla de datos no debe contener filas, columnas y, si es posible, ninguna celda vacía.

No tener espacios en blanco dentro de una tabla de datos es una buena práctica cuando se trata de la gestión de datos y no solo cuando se buscan datos duplicados. Las otras herramientas de datos de Excel, como la clasificación y el filtrado, funcionan mejor cuando la tabla de datos es un rango contiguo de datos.

Ejemplo de eliminar registros de datos duplicados

En la imagen de arriba, la tabla de datos contiene dos registros idénticos para A. Thompson y dos registros parcialmente coincidentes para R. Holt. En el ejemplo, todos los campos coinciden excepto el número de estudiante.

Los pasos enumerados a continuación detallan cómo utilizar la herramienta Eliminar datos duplicados para:

  • Elimine el segundo de dos registros idénticos para A. Thompson.
  • Elimine el segundo registro parcialmente coincidente para R. Holt.

Abra el cuadro de diálogo Eliminar duplicados

  1. Seleccione una celda que contenga datos en la base de datos de muestra.
  2. Seleccione la pestaña Datos .
  3. Seleccione Eliminar duplicados para resaltar todos los datos en la tabla de datos y abrir el cuadro de diálogo Eliminar duplicados.

Esto es lo que encontrará en el cuadro de diálogo Eliminar duplicados:

  • El cuadro de diálogo Eliminar duplicados muestra todos los encabezados de columna o nombres de campo de la muestra de datos.
  • Las marcas de verificación junto a los nombres de los campos indican qué columnas coincidirá con Excel cuando busque registros duplicados
  • Cuando se abre el cuadro de diálogo, se seleccionan todos los nombres de campo.

Encuentra registros idénticos

Este ejemplo de tutorial busca registros idénticos. Seleccione todos los encabezados de columna y seleccione Aceptar.

Aquí está el resultado:

  • El cuadro de diálogo se cierra y se reemplaza por el mensaje: 1 valores duplicados encontrados y eliminados; Quedan 7 valores únicos .
  • La fila que contiene el registro duplicado de A. Thompson se elimina de la base de datos
  • Hay dos registros parcialmente coincidentes para R. Holt porque no todos los campos coinciden. El número de estudiante para los dos registros difiere. Excel considera que cada registro es un registro de datos único.

Buscar y eliminar registros que coinciden parcialmente con Eliminar duplicados

Marque un campo a la vez

En el ejemplo anterior, Excel eliminó los registros de datos que coinciden exactamente con los campos de datos seleccionados. Para encontrar registros de datos parcialmente coincidentes, elimine la marca de verificación de un solo campo a la vez, como se muestra en los pasos a continuación.

Las búsquedas posteriores de registros que coincidan en todos los campos, excepto el nombre, la edad o el programa, eliminan todas las combinaciones posibles para registros que coinciden parcialmente.

Encuentra registros parcialmente coincidentes

  1. Seleccione una celda que contenga datos en la tabla de datos, si es necesario.
  2. Seleccione Datos .
  3. Seleccione Eliminar duplicados para resaltar todos los datos en la tabla de datos y abrir el cuadro de diálogo Eliminar duplicados.
  4. Se seleccionan todos los nombres de campo o encabezados de columna para la tabla de datos.
  5. Para buscar y eliminar registros que no coinciden en todos los campos, elimine la marca de verificación junto a los nombres de campo que desea que Excel ignore.
  6. Para este ejemplo, elimine la marca de verificación junto al encabezado de la columna ID de estudiante.
  7. Excel busca y elimina registros que tienen datos coincidentes en los campos Apellido, Inicial y Programa.
  8. Seleccione Aceptar .
  9. El cuadro de diálogo se cierra y se reemplaza por el mensaje: 1 valores duplicados encontrados y eliminados; Quedan 6 valores únicos .
  10. La fila que contiene el segundo registro de R. Holt con el ID de estudiante de ST348-252 se elimina de la base de datos.
  11. Seleccione Aceptar para cerrar el cuadro de mensaje.

La tabla de datos de ejemplo ahora está libre de todos los datos duplicados.

Rate article
labsfabs.com
Add a comment