RNN・LSTMとは？時系列データに強いAIをやさしく解説

「RNNって何の略?」
「なぜ文章や音声に強いの?」
「LSTMとは、何が違う?」

RNNとは、前の情報を覚えながら順番にデータを処理する、系列データに強いニューラルネットワークです。文章や音声のように「並び順に意味がある」データを得意とします。

ふつうのニューラルネットワークは、入力に答えを返したらそこで記憶がリセットされます。RNNはここが違います。この記事では、その違いを一文を読ませながら実演し、弱点と、それを補うLSTM・GRUまで、数式ゼロで見ていきます。G検定のディープラーニング対策にそのまま効きます。

1 1. RNNとは
2 2. 一文を順番に読む仕組み（隠れ状態のバトンパス）
3 3. 弱点は「遠い言葉を忘れる」こと
4 4. LSTMとGRUはどう補ったか
5 5. 試験での問われ方と、次に学ぶ順
- 5.1 次のステップ

1. RNNとは

RNN は Recurrent Neural Network の略で、日本語では再帰型ニューラルネットワークと呼ばれます。「再帰（recurrent）」とは、自分の出力をもう一度自分の入力に戻して使うこと。この折り返しの構造が、名前の由来です。

得意とするのが系列データ、つまり並び順に意味があるデータです。文章は単語の並び、音声は音の時間的な流れ、株価は日々の値の連なりで成り立ちます。並べ替えると意味が壊れる——このタイプのデータをまとめて系列データと呼びます。あなたが普段AIに任せている翻訳・文章生成・音声認識の多くが、かつてはRNNを土台にしていました。

ふつうのニューラルネットワークとの違いは、記憶の有無です。通常型は1つの入力を処理したら終わりで、前に何を見たかを覚えていません。RNNは前の処理結果を次に持ち越す。この一点が、系列データへの強さを生みます。土台の基礎はニューラルネットワークとはで押さえられます。

2. 一文を順番に読む仕組み（隠れ状態のバトンパス）

RNNの心臓部が再帰構造です。実際に「今日は天気が良い」という文をRNNに読ませてみましょう。RNNは単語を1つずつ処理し、そのつど隠れ状態という小さなメモを更新して、次の単語へ手渡します。次の図が、そのバトンパスです。

ポイントは赤い矢印です。h1がh2へ、h2がh3へと受け渡され、最後の隠れ状態には、それまで読んだ言葉の要約が詰まっている。だから「今日は天気が良いので散歩に」の続きを予測するとき、RNNは前の流れを覚えていて「行く」といった自然な語を選べます。

たとえるなら、連続ドラマを毎回欠かさず見る視聴者です。今日の回を理解できるのは、前回までの展開を覚えているから。RNNの隠れ状態も同じで、過去の話を引き継いだうえで、いま目の前の単語を解釈します。同じ仕組みを何度もくり返すので、文が長くても短くても長さに合わせて処理できます。

3. 弱点は「遠い言葉を忘れる」こと

便利な再帰構造にも弱点があります。RNNは前の情報を引き継げますが、遠く離れた情報ほど覚えておくのが苦手です。文がとても長くなると、序盤の大事な言葉が、終わりに近づくころには薄れてしまう。これを長期依存の問題と呼びます。

たとえば「私は子どものころフランスで暮らしていて、だから今でも◯◯語が話せる」という文で、空欄を埋める手がかりは文頭の「フランス」です。けれど離れすぎていると、RNNはこの結びつきを保ちきれないことがあります。

背景にあるのが勾配消失です。RNNは学習時、誤差を過去へさかのぼって伝えますが、さかのぼる回数が増えるほど信号が小さくなって消えていく。結果として、遠い過去の情報をうまく学習できなくなります。バトンパスを何十回も繰り返すうちに、最初のメモがかすれていく——そう捉えると腑に落ちます。

4. LSTMとGRUはどう補ったか

この弱点を乗り越えるために登場したのがLSTMです。LSTM は Long Short-Term Memory の略で、ゲートという仕組みを備えます。ゲートは情報を「覚える・忘れる・取り出す」を調整する門で、大事な情報は長く保ち、不要になった情報は捨てる。この選別によって、LSTMは長期依存の問題をやわらげました。

もう一つがGRU（Gated Recurrent Unit）です。LSTMと似た考え方を持ちつつ、ゲートの数を減らして構造を軽くした改良版です。3つの関係を対応表で押さえてください。

名前	特徴	長期依存は
RNN	再帰構造で系列を扱う基本形	苦手（遠い情報が薄れる）
LSTM	ゲートで記憶を選別する	やわらぐ（長く保てる）
GRU	ゲートを減らし軽くした改良版	やわらぐ・計算が速い

近年は、単語の関係を並列で読み取るTransformerが主流になり、翻訳や文章生成の中心はそちらへ移りました。ただしRNN・LSTMの考え方は、系列データを学ぶ土台として今も外せません。あなたがTransformerの「並列で処理する新しさ」を実感できるのは、RNNの「順番に処理する制約」を知っているからです。

5. 試験での問われ方と、次に学ぶ順

最後に、G検定でどう問われるかを整理します。RNN・LSTMはディープラーニングの基礎で頻出です。あなたが狙われやすい角度を、先に押さえておきましょう。

再帰構造・隠れ状態: RNNが過去情報を引き継ぐ仕組みを問う（「前の出力を次に戻す」がキーワード）
勾配消失・長期依存: RNNの弱点と原因を選ぶ（「遠い情報が学習で薄れる」）
LSTM・GRUの役割: ゲートで長期記憶を保つ改良、という位置づけを取り違えない

用語を単独で暗記すると、選択肢の言い換えに惑わされます。再帰構造→弱点（勾配消失）→改良（ゲート）という因果の一本道でつなぐと、多くの設問がほどけます。次に学ぶなら、RNNの制約を根本から外したTransformerへ進むのが自然な順路です。ここまで来れば、系列データを扱うAIの流れが一枚の地続きに見えてきます。

次のステップ

RNN・LSTMがG検定のどこに位置づくかを見たいなら、G検定の試験範囲と勉強法をまとめたガイドで出題領域の地図を先に持っておくと、系列データ系の用語が迷子になりません。

知識を得点に変えるには、G検定ディープラーニング基礎の問題集で、再帰構造や勾配消失をめぐる設問に手を動かして慣れておくのが確実です。