컴퓨터/엑셀 강좌

엑셀 중급 07 중복값 찾기 제거

NYGD 2021. 8. 26.

안녕하세요 NYGD입니다.

오늘은 중복 값 처리에 대해서 알아봅시다.

 

먼저 중복 값이 왜 발생하는 걸까요?

이유야 다양하게 있겠죠?

예를 들면 지금 제가 일하는 곳에서 있었던.. 

인보이스를 중복해서 발행한다던지...

아니면 여러 데이터들을 마구 잡이로 막 긁어 와서 정리를 해야 한다든지

등등등... 

 

데이터들은 중복이 발생하면 데이터의 의미가 많이 사라 집니다.

그래서 그런 중복 값들을 없애주는 작업을 해야 하죠

 

만약 우리가 적은 데이터에서 중복 값을 찾아내서 없애야 한다면

시간만 좀 내면 금방 찾아내겠지만.. 

데이터들이 많아지기 시작하면 눈알이 빠지는 작업이 되겠죠?

 

저도 지금 중복 인보이스 발행 때문에.. 중복된 데이터들을 찾고 있습니다.

 

제가 이 중복 값을 해결할 때 썼었던 내용들을 좀 다뤄 보고자 합니다.

 

엑셀 중복 값을 다룰 때는 기본적으로 아셔야 할 게 있습니다.

그것은 바로 

띄어쓰기, 스페이스, 공백입니다.

 

이게 무슨 말인고 하니 

"NYGD" VS "NYGD "

"NY GD" VS "NYGD"

위처럼 셀안에 데이터에 공백이 포함이 되어있으면

엑셀은 두 값이 다르다 라고 인식을 하게 됩니다.

 

만약에 본인이 직접 데이터를 작성하고 그 작성한 데이터를 가공하신다면

이 공백, 또는 띄어쓰기를 하나로 통합하셔야 합니다.

예를 들면 

나는 NYGD를 다 붙여서 공백 없이 쓰겠다 하면

데이터를 입력하실 때 똑같이 NYGD로 공백 없이 쭉~~~ 쓰셔야 합니다.

 

만약 다른 데서 긁어온 데이터라면.. 어쩔 수 없습니다.

막일로 찾아야 합니다. 다른 방법이 없어요..

 

위 내용을 인식하시고 

 

보통 다른 데서 중복 값 제거를 알려드릴 때 "중복된 항목 제거"에 

대해서 많이 알려드리는데 

중복된 항목 제거

저는 "중복된 항목 제거"라는 기능은 잘 쓰지 않습니다.

 

이유는 즉슨

저 기능으로 데이터를 지워버리면 어떤 데이터가 지워졌는지

어떤 데이터가 중복이었는지 확인이 잘 안 됩니다.

그리고 지워졌긴 한데... 제대로 되었나? 하는 생각도 들고요

(왜냐면 첨에 알려드렸던 띄어쓰기 때문이죠...)

저 기능을 쓰고 다시 또 컨펌을 해야 하기 때문에... 이 기능은 잘 쓰지 않습니다.

 

 

반응형

 

  

그럼 제가 하는 방법을 알려드리겠습니다.

 

1. 중복 값을 찾아야 하는 열 옆에 복사열을 하나 더 만든다.

이 말이 무엇인고 하니 

먼저 예를 하나 들어 드리겠습니다.

중복 값 찾아야 할 데이터

위 데이터에서 우리는 이름이라는 열에 있는 중복 값들을 찾아야 한다고 생각해 봅시다.

이름 열 옆에 임의로 똑같은 열을 하나 더 만듭니다.

옆에 열을 하나더 만듬

위 사진처럼 말이죠

 

방법A열 선택하셔서 복사 B1셀 선택 하셔서 붙여 넣기 하시면 됩니다.

 

이 작업을 하는 이유는 원래 데이터에서 우리는 공백을 제거하려고 임의로 하나 더 만듭니다.

위에서 제가 말했던 것처럼 공백이 있으면 "김 과장" VS "김 과 장"은 다른 단어이기 때문에 

현재 중복 검사를 하셔도 똑같은걸 거를 수가 없습니다.

 

제가 임의로 만든 B열에서 모든 공백을 제거하고 중복을 제거하는 거죠

그러고 나서 복사했던 열은 지우고 원래 A열에 있던 열만 남기는 겁니다.

 

그러면 그냥 A열에서 진행하면 되지 왜 굳이 B를 만드냐 하시는데 

원래 있던 데이터에서 공백을 지워 버리면 의미가 없어져 버리는 상황도 있기 때문입니다.

 

예를 들면 영문으로 제가 Lee mihyun을 원래 A열에 놔뒀다가 

원본 데이터의 공백을 건드려 버리면 나중에 Leemihyun의 중복 값을 없애 버린 후 

이 데이터가 뭘 의미하는 거지? 하는 수가 생기기 때문입니다.

항상 데이터를 수정하실 땐 원본은 건드시지 마시고 꼭 저장해놓으시길 바랍니다.

 

2. 복사된 열을 선택 후 Ctrl + H 그리고 공백을 제거해 줍니다.

복사된 열이 생성되면 그 열을 전체 선택을 해줍니다.

열 머리글에 마우스를 가져다 대시면 아래 화살표가 나오는데 그때 클릭 한번 해주시면 됩니다.

B열 선택

그리고 Ctrl + H를 눌러줍니다. (Replace 단축키)

이 기능은 내가 원하는 특정 단어를 다른 단어로 replace 즉 교체해주는 기능을 합니다.

 

먼저 단축키를 누르면 아래와 같이 창이 하나 뜰 텐데 

빨간 네모를 클릭하셔서 : 스페이스바를 한번 클릭해줍니다. (띄어쓰기 공백을 넣는 겁니다)

파란 네모를 클릭하셔서 : 네모 안의 내용을 다 지워 줍니다. (delete) 

그리고 Replace All 전체 바꾸기를 클릭하시면 됩니다.

replace

 

위에서 제가 한 행동의 뜻이 뭐냐면

이봐 엑셀!  스페이스 (공백)을 찾아서 다 지워줘 라는 말을 엑셀에게 한 것입니다.

 

그러고 나시면 아래와 같이 모든 공백을 다 지운 열이 하나 생기게 됩니다.

모든 공백 제거

 

3. 데이터에 필터를 입힌다.

그러고 나서 데이터에 필터를 입힙니다.

 

이전 시간에 했었죠 필터 입히는 방법 

모르시면 아래 링크 참조

https://nygd.tistory.com/entry/%EC%97%91%EC%85%80-%EC%A4%91%EA%B8%8905-%ED%95%84%ED%84%B0-%EC%98%A4%EB%A6%84-%EB%82%B4%EB%A6%BC%EC%B0%A8%EC%88%9C-%EC%A0%95%EB%A0%AC?category=915769 

 

엑셀 중급 05 필터 / 오름 내림차순 정렬

안녕하세요 NYGD입니다. 오늘은 정렬과 필터에 대해서 알아 봅시다. 많은 데이터들을 작성하고 다루고 하다보면 꼭 우리는 정렬을 할필요가 생깁니다. 예를들면... 내가 가지고 있는 데이터들을

nygd.tistory.com

 

4. 오름차순으로 정렬한다

여기선 오름차순이든 내림 차순이든.. 정렬을 합니다.

공백을 제거해서 많은 중복들을 지우지만 그래도 혹시 남아있을지 모를 

중복 데이터들 때문이죠.... (오타 라든지, 콤마, 마침표 등등등.. 이 있을 수 있으니까요)

정렬하는 법도 지난 시간에 알려 드렸습니다.

 

5. 조건부 서식에서 중복 값을 선택한다.

이 작업을 다 한 다음 Home 탭에 있는 조건부 서식에 있는 중복 값을 선택해 줍니다.

 

그러고 나시면 아래와 같이 중복 값들이 빨간색으로 나오신 것들 보실 수 있습니다.

그런 다음에 하나씩 지워 주시면 됩니다.

중복값 찾기

 

중복 값을 다 지우시면 그 이후에 저희가 만들었던 B열을 삭제해 주시면 되겠습니다.

 

감사합니다!! 

중복 값에서 해방됩시다!!!!!

댓글