close
文、菜鳥編
分析數據的首要條件就是資料來源要準確,因此處理資料的重複就相當重要。今天就以一個例子來說明在Excel中,要如何處理資料重複問題。
狀況:
水果學校新學期開始,需票選出班長、副班長、風紀股長與衛生股長擔任人員。果子老師請學生推薦心中適合的人選並訂定了一些規則。
一、不可推薦自己。
二、每個人只能填寫一次,如重複填寫以第一次為主。
三、班級幹部人選推薦不可以重複,如重複則視為無效。
四、如學生都未出現在推薦名單中,下學期就為幹部人選口袋名單,給予學習的機會。
PART1、移除重複填寫資料
透過「移除重複項」可以把重複的資料給移除掉。這邊方便大家了解這功能,下面先把重複填寫的學生給標示出來。選取A欄名單資料,透過使用格式化條件設定中「重複的值」將重複名單標示出來。
開啟資料工具列中的「移除重複項」工具。因為目的是要移除重複填寫資料,所以只要選定「人員」就好。就可以把第二筆,也就是第9列香蕉同學重複填寫的資料給移除。
PART2、移除重複人員推薦
以下圖來說,香蕉同學重複推薦龍眼擔任班長與風紀股長,所以此筆資料是無效的(看來香蕉應該是個問題人物,都沒在看規則的)。但千萬別亂罵人家香蕉,這可是要拘役20天喔(可Google查詢)。
這邊使用公式來判斷同一列中是否有重複的內容。會使用到COUNTA、COUNTIF、IF、SUMPRODUCT。對這些函數不了解的,可以參考之前介紹的文章。
► Excel應用-除了SUM,你還會哪些加總?
► Excel中你知道那些判斷的函數嗎(上)
► Excel中你知道那些判斷的函數嗎(下)
儲存格G2 = IF(SUMPRODUCT(COUNTIF(B2:E2,B2:E2))>COUNTA(B2:E2),"V","")
COUNTA(B2:E2):計算出列中含有資料的總數,以這邊案例結果就是4。
SUMPRODUCT(COUNTIF(A2:D2,A2:D2)):可將COUNTIF陣列的計算加總
所以當SUMPRODUCT計算出來結果大於4就表示列中有重複的內容。
這邊可以看到,除了香蕉之外,山竹同學也重覆推薦了名單。
把不符合的資料移除,如果資料龐大,可透過篩選,將內容為”V”的列出來後刪除。
PART3、使用樞紐分析統計結果
樞紐分析表也是可以將重複資料移除的一種方式,這邊的案例也正好可以用來統計各幹部的票數。
結果出爐,由蘋果擔任班長、番茄為副班長、水梨為風紀股長及擔任衛生股長的西瓜。
PART4、找出未重複的資料
前面的介紹都是找出重複值,而這次要找出未重複的值。一樣透過格式化條件就可以做到。只是這次是透過「新增規則」來操作。
類型選擇「只格式化唯一獲重複的值」。
檸檬與荔枝就是下一學期的口袋人選。
總結:
這次的例子可以了解到篩選重複資料、移除重複資料、統計及找出唯一值。面對不同的資料結構操作當然也會有點不同,但是觀念都是大同小異。
如果你覺得這篇文章很實用,也別忘了分享給你的親友們喔!
►推薦課程:Excel財務試算表應用
延伸閱讀
官方網站:http://www.lccnet.com.tw
FB粉絲團:https://www.facebook.com/lccnetzone
菜鳥救星:https://www.facebook.com/greensn0w
文章標籤
全站熱搜
留言列表