C++でのスレッド間データ共有とスレッドローカルストレージの活用法

C++でのマルチスレッドプログラミングは、近年ますます重要性を増しています。効率的なプログラムの作成には、スレッド間のデータ共有と、スレッドごとに独立したデータの管理が欠かせません。本記事では、C++におけるスレッド間のデータ共有方法とスレッドローカルストレージ（TLS）の概念と実装について詳しく解説します。これにより、マルチスレッド環境でのデータ競合やデッドロックといった問題を避ける方法を学びます。実際のコード例や応用例を交えながら、理解を深めるための演習問題も用意していますので、最後までお付き合いください。

スレッド間データ共有の基礎

マルチスレッドプログラミングでは、複数のスレッドが同じデータにアクセスする必要がある場合があります。このようなデータ共有は、効率的な並行処理を実現するために重要です。C++では、スレッド間でデータを共有するために以下の方法があります。

グローバル変数の使用

最も単純な方法として、グローバル変数を使用してスレッド間でデータを共有することができます。しかし、グローバル変数は競合状態を引き起こす可能性があるため、適切な同期機構を使用する必要があります。

#include <iostream>
#include <thread>
#include <vector>

int shared_data = 0; // グローバル変数

void increment() {
    for (int i = 0; i < 100; ++i) {
        ++shared_data; // 競合が発生する可能性がある
    }
}

int main() {
    std::vector<std::thread> threads;

    for (int i = 0; i < 10; ++i) {
        threads.push_back(std::thread(increment));
    }

    for (auto& th : threads) {
        th.join();
    }

    std::cout << "Final value: " << shared_data << std::endl; // 期待値は1000だが異なる場合がある

    return 0;
}

共有データ構造の使用

より安全な方法として、データを共有する専用のデータ構造（例えば、スレッドセーフなキューやコンテナ）を使用します。これにより、データ競合のリスクを軽減できます。

#include <iostream>
#include <thread>
#include <vector>
#include <atomic>

std::atomic<int> shared_data(0); // スレッドセーフな共有データ

void increment() {
    for (int i = 0; i < 100; ++i) {
        shared_data.fetch_add(1, std::memory_order_relaxed);
    }
}

int main() {
    std::vector<std::thread> threads;

    for (int i = 0; i < 10; ++i) {
        threads.push_back(std::thread(increment));
    }

    for (auto& th : threads) {
        th.join();
    }

    std::cout << "Final value: " << shared_data.load() << std::endl; // 常に1000になる

    return 0;
}

これらの基本的な方法を理解することで、スレッド間のデータ共有の重要性とその基本的な実装方法を学ぶことができます。次のセクションでは、共有メモリと同期の重要性について詳しく見ていきます。

共有メモリと同期の重要性

スレッド間でデータを共有する場合、データの一貫性と整合性を保つために同期が必要です。同期を行わないと、複数のスレッドが同時に同じデータにアクセスして更新することにより、予期しない動作や競合状態が発生する可能性があります。

競合状態の例

競合状態は、複数のスレッドが同じメモリ位置に同時にアクセスする場合に発生します。以下の例は、同期を行わない場合に発生する競合状態を示しています。

#include <iostream>
#include <thread>
#include <vector>

int shared_data = 0; // 共有データ

void increment() {
    for (int i = 0; i < 100; ++i) {
        ++shared_data; // 競合が発生する可能性がある
    }
}

int main() {
    std::vector<std::thread> threads;

    for (int i = 0; i < 10; ++i) {
        threads.push_back(std::thread(increment));
    }

    for (auto& th : threads) {
        th.join();
    }

    std::cout << "Final value: " << shared_data << std::endl; // 期待値は1000だが異なる場合がある

    return 0;
}

このプログラムでは、複数のスレッドが同時に shared_data にアクセスしているため、期待される結果（1000）にならない場合があります。

ミューテックスによる同期

競合状態を防ぐために、ミューテックス（mutex）を使用してデータへのアクセスを同期します。ミューテックスは、共有データへのアクセスを制御し、同時アクセスを防ぎます。

#include <iostream>
#include <thread>
#include <vector>
#include <mutex>

int shared_data = 0; // 共有データ
std::mutex mtx; // ミューテックス

void increment() {
    for (int i = 0; i < 100; ++i) {
        std::lock_guard<std::mutex> lock(mtx); // ミューテックスによるロック
        ++shared_data;
    }
}

int main() {
    std::vector<std::thread> threads;

    for (int i = 0; i < 10; ++i) {
        threads.push_back(std::thread(increment));
    }

    for (auto& th : threads) {
        th.join();
    }

    std::cout << "Final value: " << shared_data << std::endl; // 常に1000になる

    return 0;
}

この例では、std::lock_guard を使用してミューテックスをロックし、スレッドが shared_data にアクセスする際に他のスレッドが同時にアクセスするのを防ぎます。これにより、競合状態を防ぎ、期待される結果を得ることができます。

スピンロックの使用

スピンロックは、ロックが解放されるのを待つ間、アクティブにループして待つ軽量な同期機構です。特定の状況下では、ミューテックスよりも効率的です。

#include <atomic>
#include <thread>
#include <vector>
#include <iostream>

std::atomic<bool> lock_flag(false);

void spin_lock() {
    while (lock_flag.exchange(true, std::memory_order_acquire));
}

void spin_unlock() {
    lock_flag.store(false, std::memory_order_release);
}

int shared_data = 0; // 共有データ

void increment() {
    for (int i = 0; i < 100; ++i) {
        spin_lock();
        ++shared_data;
        spin_unlock();
    }
}

int main() {
    std::vector<std::thread> threads;

    for (int i = 0; i < 10; ++i) {
        threads.push_back(std::thread(increment));
    }

    for (auto& th : threads) {
        th.join();
    }

    std::cout << "Final value: " << shared_data << std::endl; // 常に1000になる

    return 0;
}

スピンロックは、短時間の待機が予想される場合に有効です。この方法では、ミューテックスと同様にデータ競合を防ぎますが、アクティブにCPUを使用するため、使用する状況には注意が必要です。

これらの同期機構を理解することで、スレッド間でのデータ共有がより安全かつ効率的に行えるようになります。次のセクションでは、ミューテックスの詳細な使い方について説明します。

ミューテックスの使い方

ミューテックスは、スレッド間で共有データにアクセスする際に、競合状態を防ぐための主要な同期機構です。ここでは、ミューテックスの基本的な使い方と、その応用について説明します。

ミューテックスの基本

ミューテックスを使用する際は、共有データにアクセスする前にロックを取得し、アクセスが終了したらロックを解放します。C++では、std::mutex クラスを使用します。

#include <iostream>
#include <thread>
#include <vector>
#include <mutex>

int shared_data = 0; // 共有データ
std::mutex mtx; // ミューテックス

void increment() {
    for (int i = 0; i < 100; ++i) {
        mtx.lock(); // ミューテックスのロックを取得
        ++shared_data;
        mtx.unlock(); // ミューテックスのロックを解放
    }
}

int main() {
    std::vector<std::thread> threads;

    for (int i = 0; i < 10; ++i) {
        threads.push_back(std::thread(increment));
    }

    for (auto& th : threads) {
        th.join();
    }

    std::cout << "Final value: " << shared_data << std::endl; // 常に1000になる

    return 0;
}

この例では、mtx.lock() と mtx.unlock() を使用して、共有データへのアクセスを同期しています。しかし、ロックとアンロックのペアを明示的に記述するのは、エラーの原因となりやすいため、std::lock_guard を使用する方法が一般的です。

std::lock_guardを使った自動ロック解放

std::lock_guard は、スコープを抜ける際に自動的にロックを解放するRAII（Resource Acquisition Is Initialization）スタイルのクラスです。

#include <iostream>
#include <thread>
#include <vector>
#include <mutex>

int shared_data = 0; // 共有データ
std::mutex mtx; // ミューテックス

void increment() {
    for (int i = 0; i < 100; ++i) {
        std::lock_guard<std::mutex> lock(mtx); // ロックを取得し、スコープを抜けると自動的に解放
        ++shared_data;
    }
}

int main() {
    std::vector<std::thread> threads;

    for (int i = 0; i < 10; ++i) {
        threads.push_back(std::thread(increment));
    }

    for (auto& th : threads) {
        th.join();
    }

    std::cout << "Final value: " << shared_data << std::endl; // 常に1000になる

    return 0;
}

この方法では、明示的なアンロック操作が不要になるため、コードが簡潔になり、エラーの可能性が減少します。

std::unique_lockの利用

std::unique_lock は、より柔軟なロック管理を可能にするクラスです。例えば、条件変数と組み合わせて使用する際に便利です。

#include <iostream>
#include <thread>
#include <vector>
#include <mutex>

int shared_data = 0; // 共有データ
std::mutex mtx; // ミューテックス

void increment() {
    for (int i = 0; i < 100; ++i) {
        std::unique_lock<std::mutex> lock(mtx); // ロックを取得
        ++shared_data;
        // ロックを手動で解放することも可能
        lock.unlock();
        // 必要に応じて再ロックも可能
        lock.lock();
    }
}

int main() {
    std::vector<std::thread> threads;

    for (int i = 0; i < 10; ++i) {
        threads.push_back(std::thread(increment));
    }

    for (auto& th : threads) {
        th.join();
    }

    std::cout << "Final value: " << shared_data << std::endl; // 常に1000になる

    return 0;
}

std::unique_lock は、手動でロックの解放や再ロックが必要な場合に役立ちます。

デッドロックの防止

ミューテックスを使用する際に注意すべき点として、デッドロックがあります。デッドロックは、複数のスレッドが相互にロックを待ち続ける状態です。これを防ぐためのいくつかの方法があります。

一貫したロック順序を保つ：常に同じ順序でロックを取得する。
タイムアウト付きのロック取得を使用：std::unique_lock と std::condition_variable を使用して、一定時間後にロックの取得を諦める。

#include <iostream>
#include <thread>
#include <vector>
#include <mutex>
#include <chrono>

int shared_data = 0; // 共有データ
std::mutex mtx; // ミューテックス

void increment() {
    for (int i = 0; i < 100; ++i) {
        std::unique_lock<std::mutex> lock(mtx, std::try_to_lock);
        if (lock.owns_lock()) {
            ++shared_data;
        } else {
            // ロックを取得できなかった場合の処理
            std::this_thread::sleep_for(std::chrono::milliseconds(1));
        }
    }
}

int main() {
    std::vector<std::thread> threads;

    for (int i = 0; i < 10; {
        threads.push_back(std::thread(increment));
    }

    for (auto& th : threads) {
        th.join();
    }

    std::cout << "Final value: " << shared_data << std::endl; // 常に1000になる

    return 0;
}

これらの方法を理解し、適切に実装することで、スレッド間のデータ共有において安全かつ効率的なプログラムを作成することができます。次のセクションでは、スピンロックとその応用について説明します。

スピンロックとその応用

スピンロックは、ロックが解放されるまでループし続ける軽量な同期機構です。ミューテックスとは異なり、スピンロックは待機中にスレッドをブロックせず、アクティブにループして待ち続けます。これにより、短時間のロック取得待機が予想される場合に高効率となります。

スピンロックの基本的な使用法

スピンロックは、通常、低レベルの同期機構として使用され、std::atomic_flagを利用して実装されます。

#include <atomic>
#include <thread>
#include <vector>
#include <iostream>

class SpinLock {
private:
    std::atomic_flag flag = ATOMIC_FLAG_INIT;

public:
    void lock() {
        while (flag.test_and_set(std::memory_order_acquire)) {
            // ビジーウェイト: 何もしない
        }
    }

    void unlock() {
        flag.clear(std::memory_order_release);
    }
};

SpinLock spinlock;
int shared_data = 0;

void increment() {
    for (int i = 0; i < 100; ++i) {
        spinlock.lock();
        ++shared_data;
        spinlock.unlock();
    }
}

int main() {
    std::vector<std::thread> threads;

    for (int i = 0; i < 10; ++i) {
        threads.push_back(std::thread(increment));
    }

    for (auto& th : threads) {
        th.join();
    }

    std::cout << "Final value: " << shared_data << std::endl; // 常に1000になる

    return 0;
}

このコードは、std::atomic_flagを使用してスピンロックを実装し、increment関数で共有データにアクセスしています。

スピンロックの利点と欠点

スピンロックには以下の利点と欠点があります。

利点

低オーバーヘッド：スレッドのコンテキストスイッチが不要なため、短時間のロックに対して効率が良い。
簡単な実装：std::atomic_flagを用いることで容易に実装可能。

欠点

CPUリソースの浪費：ロックが解放されるまでアクティブにループするため、CPUリソースを浪費する。
スケーラビリティの低下：多数のスレッドが同時にスピンロックを待つと、スケーラビリティが低下する。

スピンロックの応用例

スピンロックは、特に短期間でロックが解放されることが予想される場面で効果的です。例えば、頻繁にアクセスされるカウンタやフラグの更新に適しています。

#include <atomic>
#include <thread>
#include <vector>
#include <iostream>

class SpinLock {
private:
    std::atomic_flag flag = ATOMIC_FLAG_INIT;

public:
    void lock() {
        while (flag.test_and_set(std::memory_order_acquire)) {
            // ビジーウェイト: 何もしない
        }
    }

    void unlock() {
        flag.clear(std::memory_order_release);
    }
};

SpinLock spinlock;
std::atomic<int> shared_counter(0);

void updateCounter() {
    for (int i = 0; i < 100; ++i) {
        spinlock.lock();
        shared_counter.fetch_add(1, std::memory_order_relaxed);
        spinlock.unlock();
    }
}

int main() {
    std::vector<std::thread> threads;

    for (int i = 0; i < 10; ++i) {
        threads.push_back(std::thread(updateCounter));
    }

    for (auto& th : threads) {
        th.join();
    }

    std::cout << "Final counter value: " << shared_counter.load() << std::endl; // 常に1000になる

    return 0;
}

この例では、スピンロックを使用して共有カウンタをスレッドセーフに更新しています。スピンロックの使用により、ロックの取得と解放が迅速に行われ、短期間でのデータアクセスが効率的になります。

これらの実装方法と利点、欠点を理解することで、適切な場面でスピンロックを効果的に使用できるようになります。次のセクションでは、スレッドローカルストレージの概念について説明します。

スレッドローカルストレージの概念

スレッドローカルストレージ（TLS）は、各スレッドが独自のデータを持つことができる仕組みです。これにより、スレッド間でデータが競合することなく、各スレッドが個別のデータを安全に操作できます。TLSは、スレッドごとに異なるデータが必要な場合や、共有データの同期が不要な場合に有効です。

スレッドローカルストレージの利点

データ競合の回避：各スレッドが独自のデータを持つため、データ競合が発生しません。
簡単な実装：同期機構を使わずにスレッドごとのデータを管理できます。
パフォーマンスの向上：データアクセスの際にロックが不要なため、パフォーマンスが向上します。

スレッドローカルストレージの使用例

C++では、thread_localキーワードを使ってスレッドローカル変数を定義します。以下の例では、各スレッドが独自のカウンタを持ち、そのカウンタをインクリメントします。

#include <iostream>
#include <thread>
#include <vector>

thread_local int local_counter = 0; // スレッドローカル変数

void increment() {
    for (int i = 0; i < 100; ++i) {
        ++local_counter;
    }
    std::cout << "Thread ID: " << std::this_thread::get_id() << " Local Counter: " << local_counter << std::endl;
}

int main() {
    std::vector<std::thread> threads;

    for (int i = 0; i < 10; ++i) {
        threads.push_back(std::thread(increment));
    }

    for (auto& th : threads) {
        th.join();
    }

    return 0;
}

このプログラムでは、local_counterは各スレッドごとに独立しているため、スレッド間でのデータ競合は発生しません。各スレッドが独自のカウンタをインクリメントし、その結果を表示します。

スレッドローカルストレージの実際の利用シーン

ログ管理：スレッドごとにログを管理し、ログメッセージの競合を防ぎます。
乱数生成：各スレッドが独自の乱数生成器を持つことで、乱数生成のスレッドセーフ性を確保します。
キャッシュ：頻繁にアクセスされるデータをスレッドローカルにキャッシュすることで、アクセス速度を向上させます。

スレッドローカルストレージの注意点

メモリ消費：各スレッドが独自のデータを持つため、スレッド数が多い場合はメモリ消費が増加します。
データの初期化とクリーンアップ：スレッドローカルデータの初期化と解放が適切に行われないと、メモリリークの原因になります。

スレッドローカルストレージは、スレッド間のデータ競合を回避し、安全かつ効率的なデータ管理を実現するための強力なツールです。次のセクションでは、スレッドローカルストレージの具体的な実装方法についてさらに詳しく見ていきます。

スレッドローカルストレージの実装

C++でスレッドローカルストレージ（TLS）を実装するには、thread_localキーワードを使用します。このキーワードを使うことで、各スレッドが独自のインスタンスを持つ変数を定義できます。以下では、具体的な実装方法をステップごとに説明します。

基本的な実装方法

まず、thread_localキーワードを使用して、スレッドローカル変数を定義します。

#include <iostream>
#include <thread>
#include <vector>

thread_local int local_counter = 0; // スレッドローカル変数

void increment() {
    for (int i = 0; i < 100; ++i) {
        ++local_counter;
    }
    std::cout << "Thread ID: " << std::this_thread::get_id() << " Local Counter: " << local_counter << std::endl;
}

int main() {
    std::vector<std::thread> threads;

    for (int i = 0; i < 10; ++i) {
        threads.push_back(std::thread(increment));
    }

    for (auto& th : threads) {
        th.join();
    }

    return 0;
}

このコードでは、local_counterは各スレッドごとに独立しており、スレッドごとのカウンタ値を表示します。

クラスメンバとしてのスレッドローカル変数

スレッドローカル変数はクラスメンバとしても定義できます。以下の例では、クラス内にスレッドローカル変数を定義し、その変数を使用します。

#include <iostream>
#include <thread>
#include <vector>

class ThreadLocalExample {
public:
    void increment() {
        for (int i = 0; i < 100; ++i) {
            ++local_counter;
        }
        std::cout << "Thread ID: " << std::this_thread::get_id() << " Local Counter: " << local_counter << std::endl;
    }

private:
    thread_local static int local_counter; // スレッドローカル変数
};

thread_local int ThreadLocalExample::local_counter = 0;

int main() {
    ThreadLocalExample example;
    std::vector<std::thread> threads;

    for (int i = 0; i < 10; ++i) {
        threads.push_back(std::thread(&ThreadLocalExample::increment, &example));
    }

    for (auto& th : threads) {
        th.join();
    }

    return 0;
}

この例では、ThreadLocalExampleクラスのメンバ変数としてスレッドローカル変数local_counterを定義し、各スレッドが独自のカウンタ値を持つようにしています。

スレッドローカルストレージの初期化と破棄

スレッドローカル変数は、スレッドが生成されるときに初期化され、スレッドが終了するときに破棄されます。以下の例では、スレッドローカル変数の初期化と破棄を確認します。

#include <iostream>
#include <thread>
#include <vector>

thread_local int* local_ptr = nullptr;

void initialize() {
    local_ptr = new int(0);
    for (int i = 0; i < 100; ++i) {
        ++(*local_ptr);
    }
    std::cout << "Thread ID: " << std::this_thread::get_id() << " Local Value: " << *local_ptr << std::endl;
    delete local_ptr; // メモリの解放
}

int main() {
    std::vector<std::thread> threads;

    for (int i = 0; i < 10; ++i) {
        threads.push_back(std::thread(initialize));
    }

    for (auto& th : threads) {
        th.join();
    }

    return 0;
}

このコードでは、スレッドごとにlocal_ptrが初期化され、スレッド終了時にメモリが解放されます。これにより、スレッドローカル変数のライフサイクルを管理できます。

実用例：スレッドローカルな乱数生成器

スレッドローカルストレージは、各スレッドが独自の乱数生成器を持つ場合に便利です。以下の例では、スレッドローカルな乱数生成器を使用してランダムな数値を生成します。

#include <iostream>
#include <thread>
#include <vector>
#include <random>

thread_local std::mt19937 generator(std::random_device{}()); // スレッドローカルな乱数生成器

void generate_random_numbers() {
    std::uniform_int_distribution<int> distribution(1, 100);
    for (int i = 0; i < 5; ++i) {
        std::cout << "Thread ID: " << std::this_thread::get_id() << " Random Number: " << distribution(generator) << std::endl;
    }
}

int main() {
    std::vector<std::thread> threads;

    for (int i = 0; i < 10; ++i) {
        threads.push_back(std::thread(generate_random_numbers));
    }

    for (auto& th : threads) {
        th.join();
    }

    return 0;
}

このプログラムでは、各スレッドが独自の乱数生成器generatorを使用してランダムな数値を生成し、それぞれのスレッドで異なる乱数を得ることができます。

スレッドローカルストレージを正しく実装することで、スレッド間のデータ競合を防ぎ、安全で効率的なマルチスレッドプログラムを構築できます。次のセクションでは、スレッドローカルストレージとグローバル変数の比較について説明します。

TLSとグローバル変数の比較

スレッドローカルストレージ（TLS）とグローバル変数は、どちらもスレッド間でデータを共有するための手法ですが、それぞれに適した利用シーンと利点・欠点があります。ここでは、TLSとグローバル変数の違いについて詳しく見ていきます。

グローバル変数の特徴

グローバル変数は、全てのスレッドからアクセス可能なデータを提供します。

利点

簡単な共有：全てのスレッドが同じデータにアクセスできるため、データ共有が容易です。
初期化が簡単：プログラムの開始時に一度だけ初期化すれば良いため、初期化が簡単です。

欠点

データ競合のリスク：複数のスレッドが同時にアクセスするため、競合状態が発生しやすいです。これを防ぐためには、適切な同期機構が必要です。
スケーラビリティの問題：スレッド数が増えると、競合が増加し、パフォーマンスが低下する可能性があります。

スレッドローカルストレージの特徴

TLSは、各スレッドが独自のデータを持つことができ、他のスレッドからはアクセスされません。

利点

データ競合がない：各スレッドが独自のデータを持つため、データ競合が発生しません。
高効率：ロックなどの同期機構が不要で、データアクセスが高速です。

欠点

メモリ使用量：各スレッドが独自のデータを持つため、スレッド数が増えるとメモリ使用量が増加します。
データの初期化と解放：スレッドごとにデータの初期化と解放が必要です。

具体的な使用例の比較

以下の例では、グローバル変数とTLSを使って同じタスクを実行し、その違いを比較します。

グローバル変数の例

#include <iostream>
#include <thread>
#include <vector>
#include <mutex>

int global_counter = 0; // グローバル変数
std::mutex mtx;

void increment_global() {
    for (int i = 0; i < 100; ++i) {
        std::lock_guard<std::mutex> lock(mtx);
        ++global_counter;
    }
}

int main() {
    std::vector<std::thread> threads;
    for (int i = 0; i < 10; ++i) {
        threads.push_back(std::thread(increment_global));
    }

    for (auto& th : threads) {
        th.join();
    }

    std::cout << "Global Counter: " << global_counter << std::endl;
    return 0;
}

この例では、global_counterは全てのスレッドで共有され、std::mutexを使って同期しています。

スレッドローカルストレージの例

#include <iostream>
#include <thread>
#include <vector>

thread_local int local_counter = 0; // スレッドローカル変数

void increment_local() {
    for (int i = 0; i < 100; ++i) {
        ++local_counter;
    }
    std::cout << "Thread ID: " << std::this_thread::get_id() << " Local Counter: " << local_counter << std::endl;
}

int main() {
    std::vector<std::thread> threads;
    for (int i = 0; i < 10; ++i) {
        threads.push_back(std::thread(increment_local));
    }

    for (auto& th : threads) {
        th.join();
    }

    return 0;
}

この例では、各スレッドが独自のlocal_counterを持ち、データ競合が発生しないため同期が不要です。

適切な選択をするために

グローバル変数を選ぶ場合：全てのスレッドが同じデータにアクセスする必要がある場合や、データの一貫性を同期機構で保証できる場合。
TLSを選ぶ場合：各スレッドが独自のデータを持ち、データ競合を避けたい場合。または、データアクセスの速度を重視する場合。

これらの違いを理解し、適切な場面で使い分けることで、スレッド間データ共有のパフォーマンスと安全性を最適化できます。次のセクションでは、デッドロックの回避方法について説明します。

デッドロックの回避方法

デッドロックは、複数のスレッドが互いにロックを取得しようとして永久に待機し続ける状態です。デッドロックを回避するためには、いくつかの戦略と注意点があります。ここでは、デッドロックの発生原因とその回避策について詳しく説明します。

デッドロックの発生条件

デッドロックが発生するためには、以下の4つの条件が同時に満たされる必要があります。

相互排他：リソースは同時に複数のスレッドによって使用されない。
占有と待機：スレッドは少なくとも1つのリソースを占有し、追加のリソースを待っている。
非可剥奪：リソースは強制的に取り上げられることがない。
循環待機：スレッドの集合が互いにリソースを待っている。

これらの条件を回避することが、デッドロック防止の鍵となります。

デッドロック回避の戦略

1. 一貫したロック順序の確立

リソースのロックを取得する順序を全てのスレッドで統一することで、循環待機条件を回避できます。以下の例では、ロック順序を統一してデッドロックを防止します。

#include <iostream>
#include <thread>
#include <mutex>

std::mutex mtx1, mtx2;

void thread_func1() {
    std::lock(mtx1, mtx2); // 複数のミューテックスを一度にロック
    std::lock_guard<std::mutex> lg1(mtx1, std::adopt_lock);
    std::lock_guard<std::mutex> lg2(mtx2, std::adopt_lock);
    // クリティカルセクション
}

void thread_func2() {
    std::lock(mtx1, mtx2); // 同じ順序でロック
    std::lock_guard<std::mutex> lg1(mtx1, std::adopt_lock);
    std::lock_guard<std::mutex> lg2(mtx2, std::adopt_lock);
    // クリティカルセクション
}

int main() {
    std::thread t1(thread_func1);
    std::thread t2(thread_func2);
    t1.join();
    t2.join();
    return 0;
}

この例では、std::lockを使って複数のミューテックスを一度にロックし、ロック順序の統一を図っています。

2. タイムアウト付きロック

std::unique_lockを使用して、一定時間ロックが取得できなければ待機をやめる方法です。

#include <iostream>
#include <thread>
#include <mutex>
#include <chrono>

std::mutex mtx;

void thread_func() {
    std::unique_lock<std::mutex> lock(mtx, std::defer_lock);
    if (lock.try_lock_for(std::chrono::milliseconds(100))) {
        // ロックが取得できた場合の処理
    } else {
        // ロックが取得できなかった場合の処理
    }
}

int main() {
    std::thread t1(thread_func);
    std::thread t2(thread_func);
    t1.join();
    t2.join();
    return 0;
}

この例では、try_lock_forを使って一定時間ロックを試み、失敗した場合は別の処理を行います。

3. デッドロック検出と回復

デッドロックが発生した場合に、それを検出し、適切な回復策を講じる方法です。これは複雑であり、オーバーヘッドが大きい場合がありますが、大規模なシステムでは有効です。

4. リソース階層の設定

リソースに優先順位を設定し、低い優先順位のリソースを取得している間は高い優先順位のリソースを取得しないようにします。これにより、循環待機を防ぐことができます。

実用例：銀行口座の送金操作

以下の例では、銀行口座間での送金操作を行い、デッドロックを防止するための一貫したロック順序を適用します。

#include <iostream>
#include <thread>
#include <mutex>

class BankAccount {
public:
    BankAccount(int balance) : balance(balance) {}

    void transfer(BankAccount& to, int amount) {
        std::unique_lock<std::mutex> lock1(mtx, std::defer_lock);
        std::unique_lock<std::mutex> lock2(to.mtx, std::defer_lock);
        std::lock(lock1, lock2); // 複数のミューテックスを一度にロック

        if (balance >= amount) {
            balance -= amount;
            to.balance += amount;
        }
    }

    int get_balance() const {
        return balance;
    }

private:
    int balance;
    std::mutex mtx;
};

int main() {
    BankAccount account1(1000);
    BankAccount account2(1000);

    std::thread t1(&BankAccount::transfer, &account1, std::ref(account2), 100);
    std::thread t2(&BankAccount::transfer, &account2, std::ref(account1), 200);

    t1.join();
    t2.join();

    std::cout << "Account 1 Balance: " << account1.get_balance() << std::endl;
    std::cout << "Account 2 Balance: " << account2.get_balance() << std::endl;

    return 0;
}

このプログラムでは、std::lockを使用して複数のミューテックスを一度にロックし、デッドロックを防止しています。

これらのデッドロック回避策を適用することで、スレッド間のデータ共有が安全かつ効率的に行えるようになります。次のセクションでは、応用例としてスレッドプールの実装を見ていきます。

応用例：スレッドプールの実装

スレッドプールは、一定数のスレッドを事前に生成し、タスクをキューに入れて実行するための仕組みです。スレッドプールの利点は、スレッドの生成と破棄のオーバーヘッドを削減し、効率的に並行処理を行うことです。ここでは、C++でのスレッドプールの実装方法について説明します。

スレッドプールの基本構造

スレッドプールの基本的な要素は以下の通りです。

タスクキュー：実行待ちのタスクを保持するキュー。
ワーカースレッド：タスクキューからタスクを取り出して実行するスレッド。
同期機構：タスクキューへのアクセスを制御するためのミューテックスや条件変数。

実装例

以下に、基本的なスレッドプールの実装例を示します。

#include <iostream>
#include <vector>
#include <thread>
#include <queue>
#include <functional>
#include <mutex>
#include <condition_variable>
#include <atomic>

class ThreadPool {
public:
    ThreadPool(size_t numThreads);
    ~ThreadPool();

    void enqueue(std::function<void()> task);

private:
    std::vector<std::thread> workers;
    std::queue<std::function<void()>> tasks;

    std::mutex mtx;
    std::condition_variable cv;
    std::atomic<bool> stop;

    void workerThread();
};

ThreadPool::ThreadPool(size_t numThreads) : stop(false) {
    for (size_t i = 0; i < numThreads; ++i) {
        workers.emplace_back([this] { this->workerThread(); });
    }
}

ThreadPool::~ThreadPool() {
    stop.store(true);
    cv.notify_all();

    for (std::thread &worker : workers) {
        if (worker.joinable()) {
            worker.join();
        }
    }
}

void ThreadPool::enqueue(std::function<void()> task) {
    {
        std::unique_lock<std::mutex> lock(mtx);
        tasks.push(std::move(task));
    }
    cv.notify_one();
}

void ThreadPool::workerThread() {
    while (!stop.load()) {
        std::function<void()> task;
        {
            std::unique_lock<std::mutex> lock(mtx);
            cv.wait(lock, [this] { return !tasks.empty() || stop.load(); });

            if (stop.load() && tasks.empty()) {
                return;
            }

            task = std::move(tasks.front());
            tasks.pop();
        }
        task();
    }
}

int main() {
    ThreadPool pool(4);

    for (int i = 0; i < 10; ++i) {
        pool.enqueue([i] {
            std::cout << "Task " << i << " is executing in thread " << std::this_thread::get_id() << std::endl;
            std::this_thread::sleep_for(std::chrono::milliseconds(100));
        });
    }

    std::this_thread::sleep_for(std::chrono::seconds(2)); // 実行終了を待つ
    return 0;
}

この例では、スレッドプールを4つのワーカースレッドで構成し、10個のタスクをキューに追加しています。各タスクは、キューから取り出され、ワーカースレッドによって実行されます。

スレッドプールの動作説明

コンストラクタ：スレッドプールのコンストラクタで、指定された数のワーカースレッドを生成し、それぞれのスレッドでworkerThread関数を実行します。
デストラクタ：スレッドプールのデストラクタで、stopフラグを設定し、全てのスレッドが終了するのを待ちます。
enqueue関数：タスクをタスクキューに追加し、条件変数を通知してワーカースレッドにタスクが追加されたことを知らせます。
workerThread関数：ワーカースレッドの関数で、タスクキューからタスクを取り出して実行します。タスクが無い場合は、条件変数を使って待機します。

スレッドプールの利点

効率性：スレッドの生成と破棄のオーバーヘッドを削減します。
スケーラビリティ：スレッド数を調整することで、様々な負荷に対応できます。
簡単なタスク管理：タスクをキューに追加するだけで、スレッド管理が簡単になります。

注意点

タスクの実行時間：長時間実行されるタスクがあると、他のタスクの実行が遅れる可能性があります。
適切なスレッド数の設定：ワーカースレッドの数を適切に設定することで、効率的な並行処理が可能になります。

このスレッドプールの実装を応用することで、効率的な並行処理が可能となり、スレッド間のデータ共有も容易になります。次のセクションでは、スレッド間データ共有とTLSに関する演習問題を提供します。

演習問題：スレッド間データ共有とTLS

以下の演習問題を通じて、スレッド間データ共有とスレッドローカルストレージ（TLS）の理解を深めましょう。各問題には、必要に応じてコードを記述して実装してください。

問題1：競合状態の検出と修正

以下のコードは、複数のスレッドが同時にグローバル変数にアクセスしてインクリメントする例です。競合状態が発生するため、期待される結果が得られません。競合状態を修正するためにミューテックスを使用してコードを修正してください。

#include <iostream>
#include <thread>
#include <vector>

int shared_counter = 0;

void increment() {
    for (int i = 0; i < 100; ++i) {
        ++shared_counter;
    }
}

int main() {
    std::vector<std::thread> threads;
    for (int i = 0; i < 10; ++i) {
        threads.push_back(std::thread(increment));
    }

    for (auto& th : threads) {
        th.join();
    }

    std::cout << "Final counter value: " << shared_counter << std::endl;
    return 0;
}

問題2：スレッドローカルストレージの利用

各スレッドが独自のカウンタを持ち、独立してインクリメントするプログラムを作成してください。スレッドローカルストレージを使用して、競合状態を避けます。

#include <iostream>
#include <thread>
#include <vector>

void increment() {
    // スレッドローカル変数を定義してください
    for (int i = 0; i < 100; ++i) {
        // カウンタをインクリメントしてください
    }
    // スレッドIDとカウンタの値を表示してください
}

int main() {
    std::vector<std::thread> threads;
    for (int i = 0; i < 10; ++i) {
        threads.push_back(std::thread(increment));
    }

    for (auto& th : threads) {
        th.join();
    }

    return 0;
}

問題3：デッドロックの発生と回避

以下のコードは、2つのスレッドが2つのミューテックスをロックする際にデッドロックが発生する例です。デッドロックを回避するために、ロックの順序を統一してコードを修正してください。

#include <iostream>
#include <thread>
#include <mutex>

std::mutex mtx1;
std::mutex mtx2;

void thread_func1() {
    std::lock_guard<std::mutex> lock1(mtx1);
    std::this_thread::sleep_for(std::chrono::milliseconds(100)); // 遅延をシミュレート
    std::lock_guard<std::mutex> lock2(mtx2);
}

void thread_func2() {
    std::lock_guard<std::mutex> lock2(mtx2);
    std::this_thread::sleep_for(std::chrono::milliseconds(100)); // 遅延をシミュレート
    std::lock_guard<std::mutex> lock1(mtx1);
}

int main() {
    std::thread t1(thread_func1);
    std::thread t2(thread_func2);

    t1.join();
    t2.join();

    std::cout << "Finished without deadlock" << std::endl;
    return 0;
}

問題4：スレッドプールの拡張

前のセクションで紹介したスレッドプールの実装を拡張し、以下の機能を追加してください。

タスクの優先度付け
スレッドプールの動的サイズ変更（スレッド数の増減）

以下のコードをベースに、これらの機能を追加してください。

#include <iostream>
#include <vector>
#include <thread>
#include <queue>
#include <functional>
#include <mutex>
#include <condition_variable>
#include <atomic>

class ThreadPool {
public:
    ThreadPool(size_t numThreads);
    ~ThreadPool();

    void enqueue(std::function<void()> task);

    // 新しい機能を追加するための関数を宣言してください

private:
    std::vector<std::thread> workers;
    std::queue<std::function<void()>> tasks;

    std::mutex mtx;
    std::condition_variable cv;
    std::atomic<bool> stop;

    void workerThread();
};

// 既存の実装

int main() {
    // スレッドプールのテスト
    return 0;
}

これらの演習問題を通じて、スレッド間データ共有とスレッドローカルストレージの実装スキルを向上させてください。次のセクションでは、本記事のまとめを行います。

まとめ

本記事では、C++におけるスレッド間データ共有とスレッドローカルストレージ（TLS）の基礎と実装方法について詳しく解説しました。以下に主要なポイントをまとめます。

スレッド間データ共有の基礎：グローバル変数や共有データ構造を使ったデータ共有の基本を学びました。
共有メモリと同期の重要性：データ競合を避けるためにミューテックスやスピンロックを使って同期を行う方法を理解しました。
ミューテックスの使い方：ミューテックスの基本的な使用方法と、自動ロック解放を行うstd::lock_guardやstd::unique_lockの利用法を学びました。
スピンロックとその応用：スピンロックの基本概念とその使用例、利点と欠点を理解しました。
スレッドローカルストレージの概念：TLSを使用してスレッドごとに独自のデータを持つ利点とその実装方法を学びました。
TLSとグローバル変数の比較：それぞれの利点と欠点、適用シーンについて比較し、適切な選択方法を理解しました。
デッドロックの回避方法：デッドロックの発生条件と、それを回避するための具体的な戦略を学びました。
応用例：スレッドプールの実装：スレッドプールの基本的な実装方法と、その利点を理解しました。
演習問題：実際にコードを書いてスレッド間データ共有とTLSの理解を深めるための問題に取り組みました。

スレッド間データ共有とTLSは、マルチスレッドプログラミングにおいて非常に重要な技術です。これらの知識を活用して、安全で効率的な並行処理プログラムを作成できるようになりましょう。