商品リストや名簿など大量のデータを扱う場合、スプレッドシートの重複に色付けするのがおすすめ。色付けする事で重複したセルを見つけやすくなります。
例えば、リストの一覧に同じ人の名前が複数あれば、重複として削除する必要があるかも知れません。あるいは、リスト内の重複していないデータだけを抽出したい時もあります。
いずれにしても、大量のデータを目視でチェックするのは非効率なうえ、見落としの心配もあります。
そこで今回紹介するのが、条件付き書式や関数、データクリーンアップといった機能です。作業効率が上がるだけでなく、チェックの精度も良くなります。
データ表を扱うのは自分だけとは限りません。見落としを防ぐためだけでなく、第三者でも重複に気付けるようにしておけば安心です。
この記事ではスプレッドシートの重複データについて以下の方法を解説しています。
- スプレッドシートの重複に色付け
- スプレッドシートの重複削除
- スプレッドシートの重複をチェック
- 重複の抽出
- 重複のカウント
この記事の目次
スプレッドシートの重複に色付け
スプレッドシートの重複に色付けするメリットは、重複データを視覚的に見付けやすく出来る事。重複セルに色が付いたり、文字が強調されていると便利です。
重複したセルへの色付けは、条件付き書式を使う方法が簡単なのでご紹介します。
- 重複を見つけたいデータの範囲を設定
- 重複か判別するための条件を設定
- 見つけた重複セルに色付けする設定
条件付き書式を選択
画面上部にあるメニュー「表示形式」から「条件付き書式」を選択します。
重複チェックする範囲を選択
まずは重複のチェックをしたい範囲を設定していきます。
- 重複を調べたいデータ範囲を選択。後述する【書式ルール】が適用される範囲。
- ドラッグでデータ範囲を選ぶか、範囲を直接入力します。重複を2列からチェックするなど、別の範囲を追加して複数列にする事も可能。離れた範囲を複数選択する場合、1列ごとに設定するのがポイントです。
この段階ですでに背景色が付いていますが、後で変更するので気にしなくて大丈夫です。
書式設定の条件でカスタム数式
セルの書式設定の条件で【カスタム数式】を選ぶと関数を設定出来る様になります。
カスタム数式を設定する
❶COUNTIF関数を設定
簡単にではありますが、COUNTIF関数の解説をします。COUNTIF関数は、指定した検索範囲内で条件に一致する要素の個数を返します。検索条件は1つです。
今回のCOUNTIF関数では、さらに見つかったデータが1つ以上ある物(「>1」)を返す設定をしています。つまり重複ですね。
=COUNTIF(検索範囲,検索条件)>1
=countif($A$1:$A$16,A1)>1
引数 | 説明 |
---|---|
検索範囲 | 検索条件の検証対象となる範囲。今回なら$A$1:$A$16が対象です。 |
検索条件 | 検索範囲への条件。検索範囲の1行目を設定します。今回なら「A1」です。 |
COUNTIF関数に設定する「検索範囲」とは、関数が検証する為に見ている範囲。一方、条件書式で最初に選択した「範囲に適用」はその名の通り条件が適用される範囲です。条件に合っていても適用の範囲外なら色付けされません。
❷書式設定のスタイル
条件に合致したセルの見た目を変更出来ます。セルの背景色や文字を太字にするなど自由にカスタマイズして下さい。
書式設置の条件を追加する
条件の変更や書式設定のスタイルを変更したい場合は条件を追加する事も出来ます。
どの様に条件分けするかはデータ次第です。カスタム数式だけでなく、他のルールの設定や見た目の変更も出来ます。
複数の条件を設定している場合は上に並んでいるものから適用されます。ドラッグで順番を入れ替える事も出来ますし、不要な条件設定は削除する事も可能です。
スプレッドシートの重複を削除
スプレッドシートの重複を削除する方法をご紹介します。スプレッドシートにはデータクリーンアップという機能があり、設定画面から条件に合わせて重複を簡単に削除できます。
更に重複していない一意のデータや空白セルなどを集計データとして見る機能も有ります。
データクリーンアップでは重複が見つかったセルの行や列ごと削除します。
重複を削除する前の元データを残す必要が無い場合は関数より便利です。
- クリーンアップの候補
- 重複データを一括で削除したり、重複の集計を見る事が出来ます。
- 重複を削除
- チェック項目から重複データを選んで削除する事が出来ます。
クリーンアップを使って重複の削除
ここではクリーンアップの2つの機能を使った削除方法を解説していきます。
❶クリーンアップの候補
重複セルや行番号などもと共に重複の削除候補が一覧表示されます。この機能では重複が見つかったセルの存在する行が丸ごと削除されます。
ボタンを押すと、削除された行や列の分だけ詰められます。
重複で削除される行には打ち消し線が入っています。
重複で削除した後のデータ数や、中身の無い空セルなどもカウントされています。
❷重複を削除
まず最初に、値を含むセルの範囲を選択しておきます。
データクリーンアップから【重複を削除】を選択します。
含める行列やデータ内のヘッダーの有無を選択します。今回はヘッダーが有るのでチェックを入れて【重複を削除】ボタンを押すと削除されます。
重複で見つかったデータは先に出現した方のデータが残り、削除した行列分だけ詰められます。
スプレッドシートの重複をチェック
重複データを削除する以外にも、見つけた重複データのチェックをする事もあります。例えば、重複データをカウントしたり、重複していないデータだけを抽出してまとめるといった作業です。
それぞれ便利な関数があるのでご紹介します。簡単なので使ってみてくださいね。
- 重複をカウント – COUNTIF関数を使う
- 重複以外を抽出 – UNIQUE関数を使う
重複をカウント
重複をカウントするにはCOUNTIF関数を使います。条件付き書式で使った時は重複の判別に使いましたが、今回は重複の数をカウントして返します。
- 重複のカウント数を表示したいセルを選び、関数を入力します。
- 関数を入力したセルをドラッグすれば簡単に設定を複製出来ます。
前述した条件付き書式の時とは違い、検索範囲内で重複したデータの個数をセルに表示します。データが1以上であれば重複していると確認できる訳です。
=COUNTIF(検索範囲,検索条件)
=countif(A:A,A2)
引数 | 説明 |
---|---|
検索範囲 | 検索条件の検証対象となる範囲。今回ならA:Aで列全体を対象にしました。 |
検索条件 | 検索範囲への条件。検索範囲の1行目を設定します。今回なら「A2」です。 |
重複以外を抽出
重複を取り除いたデータが必要な場合もあります。元データを残しつつ、重複のないデータを抽出する場合にはUNIQUE関数を使います。
UNIQUE関数は、デフォルトでは行で処理(縦に並んだデータをフィルタ)します。また抽出前のデータを残さず削除する事も可能です。
=UNIQUE(検索範囲,行で処理,重複なし)
=unique(A:A)
引数 | 説明 |
---|---|
検索範囲 | 一意の要素でフィルタ処理するデータです。 |
行で処理 | 列または行でデータをフィルタ処理するかどうかを指定します。デフォルトはfalseです。 |
重複なし | 重複のないエントリのみを返すかどうかを指定します。デフォルトはfalseです。 |
まとめ
スプレッドシートのデータは重複に色付けすると見分けが付きやすいです。重複データは見つけた後にどう処理するのかが重要です。
そこでこの記事では、以下の方法を解説しました。
- 条件付き書式で重複データに色付け
- 重複データを削除
- 重複データをカウントや抽出
重複をカウントするにはCOUNTIF関数、重複を抽出するにはUNIQUE関数、どちらも覚えておくと便利ですよ。