RailsモデルとActive Record基礎|バッチ処理とfind_in_batchesで大規模データを安全に処理する方法
生徒
「Railsでたくさんのデータを一気に処理したら、アプリが止まってしまいました……」
先生
「それはバッチ処理のやり方が原因かもしれません。大量データは安全に分けて扱う必要があります。」
生徒
「find_in_batchesって聞いたことはありますが、何をしているのか分かりません。」
先生
「では、箱に分けて荷物を運ぶ例えで、順番に説明していきましょう。」
1. バッチ処理とは?Railsで大量データを扱う考え方
バッチ処理とは、たくさんのデータをまとめて処理する方法のことです。 Railsでは、ユーザー全員の情報を更新したり、 古いデータを一括で整理したりする場面で使われます。
ただし、データが多い状態で一気に処理すると、 メモリを大量に使ってしまい、 アプリが遅くなったり止まったりします。 初心者の方は、 「重い荷物を一度に運ぼうとして腰を痛める」 イメージをすると分かりやすいです。
2. なぜ大量データを一気に処理してはいけないのか
RailsでModel.all.eachのような書き方をすると、
すべてのデータを一度にメモリに読み込みます。
データが少ないうちは問題ありませんが、
件数が増えると大きな負担になります。
User.all.each do |user|
user.update(active: true)
end
このコードは分かりやすいですが、 ユーザーが何万人もいる場合、 非常に危険です。 サーバーが悲鳴を上げる原因になります。
3. find_in_batchesとは?安全に分けて処理する仕組み
find_in_batchesは、
データを小さなまとまりに分けて、
順番に処理するためのRailsの仕組みです。
これは、「荷物を小さな箱に分けて、 何度も往復して運ぶ」方法に似ています。 体にもサーバーにも優しいやり方です。
User.find_in_batches(batch_size: 1000) do |users|
users.each do |user|
user.update(active: true)
end
end
この例では、ユーザーを1000件ずつ読み込み、 少しずつ処理しています。 メモリを使いすぎず、 安定した動作が期待できます。
4. find_eachとの違いも知っておこう
Railsにはfind_eachという
似た仕組みもあります。
こちらは、内部でfind_in_batchesを使いながら、
1件ずつ処理してくれます。
User.find_each do |user|
user.update(active: true)
end
初心者の方は、 「1件ずつ処理したいならfind_each」 「まとまり単位で処理したいならfind_in_batches」 と覚えておくと十分です。
5. バッチ処理で気をつけたいポイント
バッチ処理では、 途中でエラーが起きる可能性も考える必要があります。 そのため、 何件ずつ処理するかを意識し、 失敗しても被害が小さくなる設計が大切です。