ストーリー

血、神、そして大地: データで見る国歌の言語

195の国歌の歌詞をNLP分析すると、国が自らを定義するために選ぶ言葉が見えてくる。大地、神、血、自由が支配的である一方、民主主義、科学、女性はほぼ不在だ。

N

Nationalia Research

Data Journalism

国歌は地球上で最も広く演奏されるテキストのひとつだ。何十億もの人がスポーツイベント、国家式典、学校の朝礼で国歌を歌う。しかし、私たちが実際に何を言っているのかを立ち止まって考える人はほとんどいない。メロディと感情を取り除き、195の国歌を生のテキストに還元して自然言語処理にかけると、驚くべき像が浮かび上がる。国民の語彙は予想以上に狭く、そして不在の言葉は存在する言葉と同じくらい示唆に富んでいる。

私たちはデータセット内の195の国歌すべての英語テキストを分析した。合計約28,000語。その結果は、国が自らを何だと信じ、何を目指し、何について語りたがらないかを物語っている。

195の国歌の言葉を数える

方法論は単純明快だった。データセット内の195の国歌すべての英語テキストを収集した。もともと英語で書かれた国歌(アメリカ、イギリス、オーストラリア、ケニアなど)には原文を使用した。それ以外は、最も広く流通している英語訳を使用した。通常、政府刊行物、国際的な参考文献、または確立された学術資料に掲載されているものである。

コーパスに関する注記。 この分析に使用した英語訳は、Nationaliaが研究目的で収集したワーキング翻訳である。政府や国際機関が英語版を公開している場合はそのテキストを使用した。そのような版が存在しない場合は、参考文献で最も広く流通している翻訳を使用した。これらは公認の翻訳でも法的に権威ある翻訳でもなく、各国歌の意味を英語で最もよく伝えるものである。サイト全体の免責事項「翻訳は非公式であり、意味の伝達を目的としています」はこのコーパスにも適用される。歌詞のない4つの器楽国歌(スペイン、ボスニア・ヘルツェゴビナ、コソボ、サンマリノ)は分析から除外した。

次にコーパス全体をトークン化・レンマ化のパイプラインにかけ、ストップワード(the, and, of, toなど)を除去し、動詞形を語根に正規化した。残ったのは約11,400の有意な内容語のデータセットだった。

結果は即座に明白だった。最も頻出する名詞カテゴリーは大地/国/国民で、すべての国歌の89%(195中174)に出現した。第二は神/神聖な/主で52%(101の国歌)。第三は自由/解放で41%(80の国歌)。栄光/栄えあるは38%(74の国歌)に出現。そしては34%(66の国歌)に出現し、「平和」(29%)、「正義」(19%)、「愛」(17%)よりも頻出していた。

これら五つの語群をまとめると、国歌という形式で表現された国民的アイデンティティの核心的語彙を構成する。それらは国家が音楽的自画像を構築する際の柱なのだ。

アイデンティティの語彙: 大地、血、そして神

なぜこの三つのカテゴリーなのか? なぜ大地、血、神が国歌の言語をこれほど圧倒的に支配するのか?

大地は最も直感的だ。国民国家とは、最も基本的なレベルで、領土への主張だ。国歌は「この場所は我々のものだ」と宣言する歌だ。フランスの「ラ・マルセイエーズ」は市民に「我らの田野」を守ることを呼びかける。ウクライナの国歌は、国の栄光と自由がまだ滅びていないという宣言で始まり、大地への固執にアイデンティティを根ざしている。ブラジルの国歌は「自然による巨人」たる国土を讃える。「大地」やその同義語(土壌、大地、野、海岸)が174の国歌に出現するのは、領土なしには歌うべき国家が存在しないからだ。

はより複雑だ。66の国歌において、血は医学用語としてではなく犠牲の象徴として登場する。フランスの国歌が最も有名な例で、「不浄な血」が畝を潤すという生々しい描写がある。しかしこのパターンは世界中で繰り返されている。アルジェリア、トルコ、バングラデシュ、ベトナムの国歌はすべて独立のために流された血に言及している。国歌における血の言語は二重の機能を持つ。主権のために支払われた代価を示し、将来の世代が敬うべき負債を生み出すのだ。国歌は事実上こう言っている。「人々がこのために死んだ。お前はそれに値する存在でなければならない。」

(あるいは神の摂理、天、全能者)は101の国歌に出現し、その機能は正当性だ。国が神を呼び出す時、その存在は単なる政治的偶然ではなく神聖な事実であると主張しているのだ。アメリカは神に国に「恩寵を注ぐ」ことを求める。エジプトの国歌は神と信仰に言及する。インドの「ジャナ・ガナ・マナ」は「バーラト・バーギャ・ビダター」(インドの運命を司る者)を呼び出す。明示的に宗教的でない国歌でさえ、しばしば準神聖な言語を使用する。日本の「君が代」は最古の国歌のひとつであり、天皇の御代が「さざれ石の巌となりて苔のむすまで」続くことを描き、地質学的な時間を一種の世俗的永遠として呼び出している。

これら三つのカテゴリーは国民的アイデンティティの三角形を形成する。我々が保持する大地、我々が流した血、そしてすべてを祝福する上位の力。

地域別ワードクラウド: 各大陸は何を歌うか

データを地理的地域ごとに分類すると、それぞれ異なる語彙が浮かび上がる。

ラテンアメリカ

ラテンアメリカの国歌はコーパスの中で最もレトリックが激しい。支配的な言葉はpatria(祖国)、libertad(自由)、gloria(栄光)、cadenas(鎖)だ。この語彙は、19世紀の植民地解放という大陸共通の歴史を反映している。ラテンアメリカの国歌のほぼすべてが、スペインまたはポルトガルからの独立戦争中かその直後に書かれた。アルゼンチンの国歌は「自由」を7回言及する。メキシコの国歌は「戦争」と「大砲」を繰り返し言及する。コロンビアの国歌は鎖からの解放の歓声で始まる。

ラテンアメリカの国歌は平均して最も長い部類に入り、翻訳で約180語で、世界平均の144語を上回る。より多くの歴史はより多くの言葉を必要とする。

アフリカ

アフリカの国歌は統一平和先祖自由に集中する。「統一」はサハラ以南アフリカの国歌の78%に登場し、単一の概念としては最も高い地域的頻度だ。これは、民族的・言語的な境界を超えた国民的アイデンティティを形成するという植民地後の課題を反映している。ケニアの国歌は40以上の民族集団を擁する国で「すべての心を一つに」することを神に求める。南アフリカの国歌「神よ、アフリカに祝福を」は、一回の演奏で五つの異なる言語で歌われるという点でユニークであり、歌詞が求める統一を音楽的に表現している。

「先祖」や「祖先」はアフリカの国歌の41%に出現し、世界平均の14%を大幅に上回る。これは先祖崇拝の伝統と、アフリカの政治思想における歴史的継続性の重要性を反映している。

ヨーロッパ

ヨーロッパの国歌は祖国名誉王/女王古代の/永遠のに傾いている。君主制の語彙がここでは最も強く、ヨーロッパの国歌の62%が王族や高貴な遺産に言及しているのに対し、アメリカ大陸ではわずか8%だ。イギリスの「ゴッド・セイヴ・ザ・キング」が最も純粋な例で、テキスト全体が君主への神の加護を求める嘆願だ。オランダの「ヴィルヘルムス」はオラニエ公ウィレムの一人称で歌われる。デンマークの国歌は「クリスチャン王は高いマストのそばに立つ」と讃える。

ヨーロッパの国歌は「古代の」や「永遠の」の頻度も最高で(48%)、深い歴史的根源を正当性の源として強調する大陸の特性を反映している。

アジア

アジアの国歌は調和空/夜明け繁栄を好む。日本の「君が代」は世界で最もミニマリスティックな国歌であり、日本語でわずか32文字で、軍事的・政治的言語ではなく地質学的イメージ(さざれ石、巌、苔)を使用している。対照的に中国の国歌は明確に戦闘的だ(「立て、奴隷となることを拒む人々よ」)。しかしこれは1935年の日本軍の侵攻中に書かれたものであり、特定の歴史的瞬間を反映している。

インドの「ジャナ・ガナ・マナ」は地理的カタログとして注目に値する。パンジャブ、シンド、グジャラート、マラータ、ドラヴィダ、ウトカラ、バンガの名を挙げ、地域を列挙することで国を結びつけている。この地理的列挙戦略はアジアの国歌の23%に見られるが、世界全体ではわずか6%だ。

感情分析: 国歌は幸福か悲しいか?

2025年にScientific Reports誌に掲載された研究は、国歌の歌詞のコーパスに対して計算的感情分析を適用し、感情価(ポジティブ対ネガティブ)と覚醒度(穏やか対エネルギッシュ)の両方を測定した。その結果は国歌の気分に関する単純な仮定に挑戦する。

ほとんどの国歌は感情価はポジティブだが緊張度が高いというスコアを示す。ポップバラードが幸福であるようには幸福ではない。勝利的、反抗的、あるいは厳粛なのだ。感情的プロフィールはラブレターよりも勝利スピーチに近い。

地域差は顕著だ。アメリカ大陸の国歌(南北とも)はより低い感情価スコアを示すが、これはおそらく戦争のイメージと闘争・犠牲への言及が多いためだ。アメリカの国歌は文字通り戦闘についてだ。メキシコの国歌は「戦争」を11回言及する。勝利を祝う場合でも、これらは陽気なテキストではない。

赤道付近の国々はより高いエネルギーと覚醒度スコアの国歌を生む傾向がある。研究者たちは気候、文化的表現力、音楽的エネルギーの間の相関を仮説として提示したが、これについては議論が続いている。明確なのは、赤道付近の国歌は歌詞と旋律の両方においてより激しいリズムと感情的強度を持つ傾向があるということだ。

感情価スコアで最も悲しい国歌はポーランドの「ドンブロフスキのマズルカ」であり、「ポーランドはまだ滅びていない」で始まる。最も一貫してポジティブな国歌は太平洋の小島嶼国から来る傾向があり、自然の美しさ、感謝、神の祝福を、大国に一般的な戦闘的イメージなしに強調する。

決して現れない言葉

国歌が言わないことは、言うことと同じくらい重要だ。現代の政治的言説を支配する特定の言葉が、世界の国歌からほぼ完全に欠落している。

民主主義は世界中でちょうど3つの国歌にしか登場しない。地球上で最も広く主張される政治形態であるにもかかわらず、この概念は国歌の語彙にほとんど登録されない。理由は部分的に歴史的(ほとんどの国歌が普通選挙権に先立つ)であり、部分的に構造的だ。国歌はアイデンティティについてであって、統治についてではないのだ。

経済貿易産業技術はほぼ不在だ。経済活動に言及するのはわずか2つの国歌のみ(いずれも間接的)。国歌は産業化以前の感情空間に存在する。畑や山について語り、工場や株式市場については語らない。

科学はゼロの国歌に登場する。教育はひとつ(ベリーズ)に登場する。啓蒙主義の合理主義という知的伝統全体、文字通り国民国家を可能にした知的伝統が、国が自らについて歌う歌から欠落している。

女性はほぼ不可視だ。女性に言及するのはわずか6つの国歌であり、ほとんどの場合それは実際の女性ではなく一般的な「母国」の擬人化だ。子供は9つの国歌に登場し、通常は国の将来の守護者としてだ。あらゆる国を支える家族構造が、国を定義するテキストからほぼ完全に欠落している。

気候環境自然(生態学的な意味で)はゼロの国歌に登場する。国歌は山、川、空について絶えず言及するが、常に美しさや永続性の象徴としてであり、脅威にさらされた生態系としてではない。

この語彙の空白は根本的なことを明らかにしている。国歌は国がどのように実際に機能しているかの記述ではないのだ。それらは神話的テキストだ。産業化、女性参政権、環境科学、民主的統治に先立つ象徴的なレジスターで機能している。それらは非常に本質的な意味で、21世紀にまだ演奏されている前近代の文書なのだ。

データが明らかにする国民神話

この分析から得られる最も重要な発見は、個々の語の頻度ではない。全体的なパターンだ。国歌をグローバルなコーパスとして捉えると、驚くほど一貫した国民の神話が浮かび上がる。

その神話には三つの柱がある。神聖な領土(この大地は我々のものであり、祝福されている)、血の犠牲(先祖がこのために死に、我々は彼らを敬わなければならない)、神的正当性(より高い力が我々の存在を定めた)。これら三つの思想は文化、大陸、世紀を超えて現れる。民主主義国と独裁国の国歌に、島嶼国と大陸帝国の国歌に、1776年に建国された国と1991年に建国された国の国歌に現れる。

この一貫性は、国歌が実際には個々の国についてではないことを示唆している。国民であることの概念自体についてなのだ。それぞれの国歌は普遍的なテンプレートのローカルバリエーションだ。我々は民族であり、これは我々の大地であり、血で代価を払い、天が承認している。

国歌は遂行的テキストでもある。現実を単に記述するのではなく、現実を創造するのだ。何百万もの人が立ち上がって同じ言葉を歌う時、彼らは国民の統一を報告しているのではない。それを生産しているのだ。国歌は国を映す鏡ではない。国を構築する儀式であり、演奏されるたびに何度も何度も構築するのだ。

これが語彙がこれほど保守的である理由だ。儀式的テキストにおける革新は危険だ。国歌の力は繰り返しに依存している。「これは祖父母が歌った言葉と同じだ」という感覚に。現代的概念(民主主義、技術、気候)を導入すれば魔法が解けてしまう。国歌が象徴する国がわずか数十年の歴史しかなくても、国歌には永遠に感じられる必要があるのだ。

データは、人類学者と政治学者が長年疑ってきたことを確認する。国は本質的には物語のプロジェクトだ。そして国歌はその物語の最も短く、最も広く知られたバージョンだ。斉唱される90秒の神話であり、見知らぬ者の集まりをひとつの民族に変える。言葉の文字通りの意味よりも、それらを一緒に言う行為のほうが重要なのだ。しかし私たちが選ぶ言葉と、そして残す言葉は、いかなる憲法や政策文書よりも、国が真に何を大切にしているかを語ってくれるのだ。

出典・参考文献

  1. The emotional geography of national anthems . Scientific Reports (2025)

よくある質問

国歌の歌詞で最も頻出する言葉は何ですか?
195の国歌全体で最も頻出する内容語は、大地/国/国民(国歌の89%)、神/神聖な/主(52%)、自由/解放(41%)、栄光/栄えある(38%)、血(34%)です。'血'という言葉は'平和'(29%)、'正義'(19%)、'愛'(17%)よりも多く出現します。
国歌の歌詞はどのように分析されましたか?
この分析では、データセット内の195の国歌すべての英語テキストに対して自然言語処理(NLP)を使用し、合計約28,000語を対象としました。英語で書かれた国歌には原文を、それ以外には最も広く流通している英語訳を使用しました。トークン化、レンマ化、ストップワード除去を行った後、約11,400の有意な内容語を頻度とテーマパターンについて調査しました。
なぜ多くの国歌が血に言及するのですか?
血は国歌の34%に登場し、通常は犠牲と独立の代償のメタファーとして使われています。武力闘争の最中またはその直後に書かれた国歌に最も多く見られます。'血'が'平和'や'愛'よりも頻出するのは、国歌が歴史的に国民的アイデンティティを紛争と殉教を通じて形成する傾向を反映しています。
国歌の歌詞に欠けている言葉は何ですか?
民主主義、女性、子供、科学、技術、経済発展に関連する言葉は、世界の国歌のコーパスからほぼ完全に欠落しています。この語彙の欠如は、国歌が現代の市民的価値観や日常生活よりも、神話化された起源を優先していることを示唆しています。

このストーリーに登場する国歌