【5分で分かる】結合演算とは | 内部結合と外部結合の違いを理解する
当ページのリンクには広告が含まれています。
✓目次
本記事の対象者
・ データサイエンティストを目指している方
・ テーブルの内部結合と外部結合の概要を知りたい方
結合演算とは
結合演算とは、複数の表を1つの票にまとめる演算のことです。
表形式で整理されたデータを1つの表に結合する上で、どのように結合するのか大きく2つの方法に分けられます。
それが、「内部結合」と「外部結合」です。
以降、それぞれについて整理したいと思います。
内部結合: 項目が一致するデータだけを結合する
内部結合とは、複数のテーブルを結合する際に結合した項目が一致するものだけを結合する方式です。
具体的には、以下の図に示すようなイメージです。
内部結合のポイントは、一致している列(カラム)を把握することです。
ここで示している「テーブルA」と「テーブルB」で一致しているカラムは、「商品コード」という名前のカラムです。
両テーブルの「商品コード」というカラムにおいて、共通するコードは、「00001」と「00002」になります。
内部結合の場合、「00001」と「00002」という商品コードのみが抽出され、1つの結合テーブルとして生成されます。
つまり、「00003」と「00004」は結合されず、結合テーブルには反映されません。
以上が内部結合になります。
外部結合: 項目が一致しないデータも結合する
外部結合とは、複数の表を1つの表に結合する際に、一致しないデータも含めて結合する方式です。
具体的には、以下の図に示すようなイメージです。
外部結合を行う場合、結合項目が一致しないデータについては、「NULL」として反映されます。
まとめ: 内部結合と外部結合を学びました
本記事では、「【5分で分かる】結合演算とは | 内部結合と外部結合」というテーマでまとめました。
以下に概要をまとめます。
- 内部結合: 項目が一致するデータだけを結合する
- 外部結合: 項目が一致しないデータも結合する
データサイエンス業務やSQLでデータを抽出する際の参考になればと思います。
なおPythonを用いて内部結合を行う方法を以下の記事でまとめていますので、合わせて読んでいいただければと思います。