【Python・OpenCV】カラー画像をグレースケールに変換する

はじめに
計算によりグレースケールに変換
OpenCVの機能を使ったグレースケール変換
変換方法の比較
おわりに
参考リンク

はじめに

カラー画像をグレースケールに変換する方法について説明します。
グレースケールは明度という 1 つのコンポーネントのみを使用して色を定義する最も単純なモデルとなります。明るさの値は、0 (黒) から 255 (白) までの値を使用して記述されます。
グレースケール画像はカラー画像より情報が少ないため、使用するメモリが少なくて済み、特に複雑な計算の場合に高速に処理することができるため、画像処理ではよく使われます。

計算によりグレースケールに変換

計算式によりカラー画像をグレースケールに変換する3つの方法を紹介します。

平均法（Average Method）

赤(R)、緑(G)、青(B)の成分値の平均値を求めて、グレースケールの明るさとします。
以下の式で表されます。

grayscale = (R + G + B) / 3

import cv2

import numpy as np

# 画像を読み込む

src = cv2.imread('image.jpg')

# 後の計算のためにfloat64の浮動小数に変換

src_f = src.astype(np.float64)

# 画像のサイズを取得(height:高さ, width:幅, channel:チャンネル数)

height, width, channel = src.shape[:3]

# ----------------------------------

# 平均法（Average Method）

# ----------------------------------

# 出力画像

avg_result = np.zeros((height, width), np.uint8)

# 平均法（Average Method）

for i in range(height):

for j in range(width):

blue = src_f[i, j, 0]

green = src_f[i, j, 1]

red = src_f[i, j, 2]

avg_result[i, j] = (red + green + blue) / 3

# 画像を保存する

cv2.imwrite('avg_result.jpg', avg_result)

import cv2 import numpy as np # 画像を読み込む src = cv2.imread('image.jpg') # 後の計算のためにfloat64の浮動小数に変換 src_f = src.astype(np.float64) # 画像のサイズを取得(height:高さ, width:幅, channel:チャンネル数) height, width, channel = src.shape[:3] # ---------------------------------- # 平均法（Average Method） # ---------------------------------- # 出力画像 avg_result = np.zeros((height, width), np.uint8) # 平均法（Average Method） for i in range(height): for j in range(width): blue = src_f[i, j, 0] green = src_f[i, j, 1] red = src_f[i, j, 2] avg_result[i, j] = (red + green + blue) / 3 # 画像を保存する cv2.imwrite('avg_result.jpg', avg_result)

import cv2
import numpy as np

# 画像を読み込む
src = cv2.imread('image.jpg')

# 後の計算のためにfloat64の浮動小数に変換
src_f = src.astype(np.float64)

# 画像のサイズを取得(height:高さ, width:幅, channel:チャンネル数)
height, width, channel = src.shape[:3]

# ----------------------------------
# 平均法（Average Method）
# ----------------------------------
# 出力画像
avg_result = np.zeros((height, width), np.uint8)

# 平均法（Average Method）
for i in range(height):
    for j in range(width):
        blue = src_f[i, j, 0]
        green = src_f[i, j, 1]
        red = src_f[i, j, 2]
        avg_result[i, j] = (red + green + blue) / 3

# 画像を保存する
cv2.imwrite('avg_result.jpg', avg_result)

平均法はシンプルな変換方法であり、画像処理の初学者にとっては理解しやすいという利点があります。しかし、色の明るさが偏っている画像ではグレースケール化する際に色の情報が失われることがあるため、正確なグレースケール画像を得ることができない場合があります。このため、色のバランスが取れている画像に適しています。また、アイコンやボタンなどのシンプルな図形をグレースケール化する場合に使用されます。

ライトネス法（Lightness Method）

赤(R)、緑(G)、青(B)の成分値の最大値と最小値を求めて、その平均値をグレースケールの明るさとします。
以下の式で表されます。

grayscale = (max(R, G, B) + min(R, G, B)) / 2

import cv2

import numpy as np

# 画像を読み込む

src = cv2.imread('image.jpg')

# 後の計算のためにfloat64の浮動小数に変換

src_f = src.astype(np.float64)

# 画像のサイズを取得(height:高さ, width:幅, channel:チャンネル数)

height, width, channel = src.shape[:3]

# ----------------------------------

# ライトネス法（Lightness Method）

# ----------------------------------

# 出力画像

lightness_result = np.zeros((height, width), np.uint8)

# ライトネス法（Lightness Method）

for i in range(height):

for j in range(width):

blue = src_f[i, j, 0]

green = src_f[i, j, 1]

red = src_f[i, j, 2]

lightness_result[i, j] = (max(blue, green, red) + min(blue, green, red)) / 2

# 画像を保存する

cv2.imwrite('lightness_result.jpg', lightness_result)

import cv2 import numpy as np # 画像を読み込む src = cv2.imread('image.jpg') # 後の計算のためにfloat64の浮動小数に変換 src_f = src.astype(np.float64) # 画像のサイズを取得(height:高さ, width:幅, channel:チャンネル数) height, width, channel = src.shape[:3] # ---------------------------------- # ライトネス法（Lightness Method） # ---------------------------------- # 出力画像 lightness_result = np.zeros((height, width), np.uint8) # ライトネス法（Lightness Method） for i in range(height): for j in range(width): blue = src_f[i, j, 0] green = src_f[i, j, 1] red = src_f[i, j, 2] lightness_result[i, j] = (max(blue, green, red) + min(blue, green, red)) / 2 # 画像を保存する cv2.imwrite('lightness_result.jpg', lightness_result)

import cv2
import numpy as np

# 画像を読み込む
src = cv2.imread('image.jpg')

# 後の計算のためにfloat64の浮動小数に変換
src_f = src.astype(np.float64)

# 画像のサイズを取得(height:高さ, width:幅, channel:チャンネル数)
height, width, channel = src.shape[:3]

# ----------------------------------
# ライトネス法（Lightness Method）
# ----------------------------------
# 出力画像
lightness_result = np.zeros((height, width), np.uint8)

# ライトネス法（Lightness Method）
for i in range(height):
    for j in range(width):
        blue = src_f[i, j, 0]
        green = src_f[i, j, 1]
        red = src_f[i, j, 2]
        lightness_result[i, j] = (max(blue, green, red) + min(blue, green, red)) / 2

# 画像を保存する
cv2.imwrite('lightness_result.jpg', lightness_result)

ライトネス法は彩度が高い画像に適しています。彩度が高い画像に対して平均法を用いると、画像が灰色になってしまう場合があるためです。そのため、色の明るさが偏っている場合でも、平均法よりも正確なグレースケール画像を得ることができます。また、写真のグレースケール化に使用されます。

ルミナンス法（Luminosity Method）

人間の目が赤(R)、緑(G)、青(B)の色に対して異なる感度を持っていることを考慮し、以下の重み係数を用いて、各成分に重みをかけて加算します。ITU-R BT.709標準に基づく式となり、XYZ色空間のYチャンネルとなります。

grayscale = 0.2126 R + 0.7152 G + 0.0722 B

import cv2

import numpy as np

# 画像を読み込む

src = cv2.imread('image.jpg')

# 後の計算のためにfloat64の浮動小数に変換

src_f = src.astype(np.float64)

# 画像のサイズを取得(height:高さ, width:幅, channel:チャンネル数)

height, width, channel = src.shape[:3]

# ----------------------------------

# ルミナンス法（Luminosity Method）

# ----------------------------------

# 出力画像

luminosity_result = np.zeros((height, width), np.uint8)

# ルミナンス法（Luminosity Method）

for i in range(height):

for j in range(width):

blue = src_f[i, j, 0]

green = src_f[i, j, 1]

red = src_f[i, j, 2]

luminosity_result[i, j] = 0.2126*red + 0.7152*green + 0.0722*blue

# 画像を保存する

cv2.imwrite('luminosity_result.jpg', luminosity_result)

import cv2 import numpy as np # 画像を読み込む src = cv2.imread('image.jpg') # 後の計算のためにfloat64の浮動小数に変換 src_f = src.astype(np.float64) # 画像のサイズを取得(height:高さ, width:幅, channel:チャンネル数) height, width, channel = src.shape[:3] # ---------------------------------- # ルミナンス法（Luminosity Method） # ---------------------------------- # 出力画像 luminosity_result = np.zeros((height, width), np.uint8) # ルミナンス法（Luminosity Method） for i in range(height): for j in range(width): blue = src_f[i, j, 0] green = src_f[i, j, 1] red = src_f[i, j, 2] luminosity_result[i, j] = 0.2126*red + 0.7152*green + 0.0722*blue # 画像を保存する cv2.imwrite('luminosity_result.jpg', luminosity_result)

import cv2
import numpy as np

# 画像を読み込む
src = cv2.imread('image.jpg')

# 後の計算のためにfloat64の浮動小数に変換
src_f = src.astype(np.float64)

# 画像のサイズを取得(height:高さ, width:幅, channel:チャンネル数)
height, width, channel = src.shape[:3]

# ----------------------------------
# ルミナンス法（Luminosity Method）
# ----------------------------------
# 出力画像
luminosity_result = np.zeros((height, width), np.uint8)

# ルミナンス法（Luminosity Method）
for i in range(height):
    for j in range(width):
        blue = src_f[i, j, 0]
        green = src_f[i, j, 1]
        red = src_f[i, j, 2]
        luminosity_result[i, j] = 0.2126*red + 0.7152*green + 0.0722*blue

# 画像を保存する
cv2.imwrite('luminosity_result.jpg', luminosity_result)

: 【Python・OpenCV】色空間(cv2.cvtColor)
はじめに PythonでOpenCVを使った色空間の扱いについて紹介します。色の３原色というのを聞いたことがあるかもしれません。3つの色を割合を変えて混ぜ合わせることで様々な色を表現するものですが、３ ...

人間の目の感度を考慮した法則(ITU-R BT.601)

ルミナンス法と同様に係数を用いる方法です。以下の式はITU-R BT.601標準に基づくものです。

grayscale = 0.299 R + 0.587 G + 0.114 B

import cv2

import numpy as np

# 画像を読み込む

src = cv2.imread('image.jpg')

# 後の計算のためにfloat64の浮動小数に変換

src_f = src.astype(np.float64)

# 画像のサイズを取得(height:高さ, width:幅, channel:チャンネル数)

height, width, channel = src.shape[:3]

# ----------------------------------

# 人間の目の感度を考慮した法則(ITU-R BT.601)

# ----------------------------------

# 出力画像

bt601_result = np.zeros((height, width), np.uint8)

# 平均法（Average Method）

for i in range(height):

for j in range(width):

blue = src_f[i, j, 0]

green = src_f[i, j, 1]

red = src_f[i, j, 2]

bt601_result[i, j] = 0.299*red + 0.587*green + 0.114*blue

# 画像を保存する

cv2.imwrite('bt601_result.jpg', bt601_result)

import cv2 import numpy as np # 画像を読み込む src = cv2.imread('image.jpg') # 後の計算のためにfloat64の浮動小数に変換 src_f = src.astype(np.float64) # 画像のサイズを取得(height:高さ, width:幅, channel:チャンネル数) height, width, channel = src.shape[:3] # ---------------------------------- # 人間の目の感度を考慮した法則(ITU-R BT.601) # ---------------------------------- # 出力画像 bt601_result = np.zeros((height, width), np.uint8) # 平均法（Average Method） for i in range(height): for j in range(width): blue = src_f[i, j, 0] green = src_f[i, j, 1] red = src_f[i, j, 2] bt601_result[i, j] = 0.299*red + 0.587*green + 0.114*blue # 画像を保存する cv2.imwrite('bt601_result.jpg', bt601_result)

import cv2
import numpy as np

# 画像を読み込む
src = cv2.imread('image.jpg')

# 後の計算のためにfloat64の浮動小数に変換
src_f = src.astype(np.float64)

# 画像のサイズを取得(height:高さ, width:幅, channel:チャンネル数)
height, width, channel = src.shape[:3]

# ----------------------------------
# 人間の目の感度を考慮した法則(ITU-R BT.601)
# ----------------------------------
# 出力画像
bt601_result = np.zeros((height, width), np.uint8)

# 平均法（Average Method）
for i in range(height):
    for j in range(width):
        blue = src_f[i, j, 0]
        green = src_f[i, j, 1]
        red = src_f[i, j, 2]
        bt601_result[i, j] = 0.299*red + 0.587*green + 0.114*blue

# 画像を保存する
cv2.imwrite('bt601_result.jpg', bt601_result)

人間の目の感度を考慮した法則は、一般的なグレースケール化の方法としてよく知られています。この変換方法は、一般的な画像に対して適しており、特定のアプリケーションに限定されることはありません。ただし、彩度が高い画像に対してはライトネス法を使用することが推奨されています。

OpenCVの機能を使ったグレースケール変換

OpenCVに実装されている、カラー画像をグレースケール画像に変換する機能を紹介します。

cv2.imread関数

画像をファイルから読み込む際に直接グレースケールに変換するにはcv2.imread関数を使うことができます。
引数のImreadModesにcv2.IMREAD_GRAYSCALEを指定します。

import cv2

# 画像読み込み

imread_result = cv2.imread('image.jpg', cv2.IMREAD_GRAYSCALE)

# 画像を保存する

cv2.imwrite('imread_result.jpg', imread_result)

import cv2 # 画像読み込み imread_result = cv2.imread('image.jpg', cv2.IMREAD_GRAYSCALE) # 画像を保存する cv2.imwrite('imread_result.jpg', imread_result)

import cv2

# 画像読み込み
imread_result = cv2.imread('image.jpg', cv2.IMREAD_GRAYSCALE)

# 画像を保存する
cv2.imwrite('imread_result.jpg', imread_result)

cv2.imread関数の詳細については下の投稿を参考にして下さい。

: 【Python・OpenCV】基礎を解説！画像の読み込み方法(cv2.imread)
はじめに PythonでOpenCVを使った画像の読み込みについて紹介します。OpenCVで画像を読み込むためのcv2.imread関数はさまざまな画像フォーマットを読み込むことができます。また、アル ...

cv2.cvtColor関数

カラー画像のデータをグレースケール画像に変換する方法としてcv2.cvtColor関数を使うことができます。
引数のColorConversionCodesにcv2.COLOR_BGR2GRAYを指定します。

import cv2

# 画像を読み込む

src = cv2.imread('image.jpg')

# ----------------------------------

# cvtColor

# ----------------------------------

# 出力画像

cvtcolor_result = cv2.cvtColor(src, cv2.COLOR_BGR2GRAY)

# 画像を保存する

cv2.imwrite('cvtcolor_result.jpg', cvtcolor_result)

import cv2 # 画像を読み込む src = cv2.imread('image.jpg') # ---------------------------------- # cvtColor # ---------------------------------- # 出力画像 cvtcolor_result = cv2.cvtColor(src, cv2.COLOR_BGR2GRAY) # 画像を保存する cv2.imwrite('cvtcolor_result.jpg', cvtcolor_result)

import cv2

# 画像を読み込む
src = cv2.imread('image.jpg')

# ----------------------------------
# cvtColor
# ----------------------------------
# 出力画像
cvtcolor_result = cv2.cvtColor(src, cv2.COLOR_BGR2GRAY)

# 画像を保存する
cv2.imwrite('cvtcolor_result.jpg', cvtcolor_result)

cv2.decolor関数

cv2.decolor関数は、下記リンクの論文に基づく変換方法となります。

Contrast Preserving Decolorization

import cv2

# 画像を読み込む

src = cv2.imread('image.jpg')

# ----------------------------------

# decolor

# ----------------------------------

# 出力画像

decolor_result, _ = cv2.decolor(src)

# 画像を保存する

cv2.imwrite('decolor_result.jpg', decolor_result)

import cv2 # 画像を読み込む src = cv2.imread('image.jpg') # ---------------------------------- # decolor # ---------------------------------- # 出力画像 decolor_result, _ = cv2.decolor(src) # 画像を保存する cv2.imwrite('decolor_result.jpg', decolor_result)

import cv2

# 画像を読み込む
src = cv2.imread('image.jpg')

# ----------------------------------
# decolor
# ----------------------------------
# 出力画像
decolor_result, _ = cv2.decolor(src)

# 画像を保存する
cv2.imwrite('decolor_result.jpg', decolor_result)