SPONSORED

文体計量学(ぶんたいけいりょうがく)

最終更新:2026/4/25

文体計量学は、テキストの文体的な特徴を数値的に分析する学問分野である。

別名・同義語 スタイル分析文体統計学

ポイント

文学作品の作者特定や、文章の信頼性評価など、様々な応用が期待されている。統計学や計算言語学の知見を応用する。

文体計量学とは

文体計量学(Stylometry)は、テキストの文体的な特徴を定量的に分析し、その特徴に基づいてテキストの分類、著者特定、年代推定などを行う学問分野である。伝統的には文学研究において、作者の文体を比較分析するために用いられてきたが、近年ではデジタル化された大量のテキストデータを利用することで、その応用範囲が広がっている。

歴史

文体計量学の起源は19世紀に遡る。初期の研究では、単語の出現頻度や文章の長さなどの基本的な特徴が分析された。20世紀に入ると、統計学計算機科学発展に伴い、より高度な分析手法が開発されるようになった。特に、MostellerとWallaceによるヘミルトン連邦党書簡の著者特定研究は、文体計量学の古典として知られている。

分析手法

文体計量学では、様々な文体的特徴が分析対象となる。代表的な特徴としては、以下のものが挙げられる。

  • 語彙的特徴: 単語の出現頻度、特殊な単語の使用、語彙の多様性など
  • 構文的特徴: 文章の長さ、文構造の複雑さ、句読点の使用頻度など
  • 文字的特徴: 文字の出現頻度、特定の文字の組み合わせなど

これらの特徴を数値化し、統計的な手法を用いて分析することで、テキストの文体的な特徴を明らかにすることができる。

応用分野

文体計量学は、文学研究だけでなく、様々な分野で応用されている。

  • 著者特定: 匿名文書の著者を特定する
  • 年代推定: テキストが書かれた年代を推定する
  • テキスト分類: テキストを特定のカテゴリに分類する
  • 詐欺検出: 詐欺メール偽情報を検出する
  • 著作権侵害検出: 著作権侵害を検出する

近年の動向

近年では、機械学習深層学習の技術が文体計量学に応用され、より高精度な分析が可能になっている。また、ソーシャルメディアなどのオンライン上のテキストデータを分析することで、社会現象の解明や世論調査などへの応用も期待されている。

SPONSORED