NULL値は、データが存在しない、または不明であることを示します。これを適切に処理する方法としては、`IS NULL`または`IS NOT NULL`を用いる方法があります。
UPDATE table_name SET column_name = 'value' WHERE column_name IS NULL;
重複行の削除
`sCode]
DELETE FROM table_name
WHERE row_id NOT IN (
SELECT MIN(row_id)
FROM table_name
GROUP BY column1, column2, …);
データの正規化
正規化は、冗長性を排除し、データの整合性を保つプロセスです。
UPDATE table_name SET column_name = TRIM(column_name);
手法
SQLクエリの例
NULL値の処理
UPDATE table_name SET column_name = ‘value’ WHERE column_name IS NULL;
重複行の削除
DELETE FROM table_name WHERE row_id NOT IN (SELECT MIN(row_id) FROM table_name GROUP BY column1, column2, …);
データの正規化
UPDATE table_name SET column_name = TRIM(column_name);
Table1: SQLによるデータクレンジングの手法とクエリの例
実践例
以下は、SQLでデータクレンジングを実行する一例です。
-- NULL値を0で置き換える
UPDATE sales SET revenue = 0 WHERE revenue IS NULL;
-- 重複行を削除
DELETE FROM customer
WHERE customer_id NOT IN (
SELECT MIN(customer_id)
FROM customer
GROUP BY email);
-- 文字列を正規化(大文字に変換)
UPDATE product SET product_name = UPPER(product_name);
コメント