文体計量学(ぶんたいけいりょうがく)
最終更新:2026/4/25
文体計量学は、テキストの文体的な特徴を数値的に分析する学問分野である。
別名・同義語 スタイル分析文体統計学
ポイント
文学作品の作者特定や、文章の信頼性評価など、様々な応用が期待されている。統計学や計算言語学の知見を応用する。
文体計量学とは
文体計量学(Stylometry)は、テキストの文体的な特徴を定量的に分析し、その特徴に基づいてテキストの分類、著者特定、年代推定などを行う学問分野である。伝統的には文学研究において、作者の文体を比較分析するために用いられてきたが、近年ではデジタル化された大量のテキストデータを利用することで、その応用範囲が広がっている。
歴史
文体計量学の起源は19世紀に遡る。初期の研究では、単語の出現頻度や文章の長さなどの基本的な特徴が分析された。20世紀に入ると、統計学や計算機科学の発展に伴い、より高度な分析手法が開発されるようになった。特に、MostellerとWallaceによるヘミルトン連邦党書簡の著者特定研究は、文体計量学の古典として知られている。
分析手法
文体計量学では、様々な文体的特徴が分析対象となる。代表的な特徴としては、以下のものが挙げられる。
これらの特徴を数値化し、統計的な手法を用いて分析することで、テキストの文体的な特徴を明らかにすることができる。
応用分野
文体計量学は、文学研究だけでなく、様々な分野で応用されている。
- 著者特定: 匿名文書の著者を特定する
- 年代推定: テキストが書かれた年代を推定する
- テキスト分類: テキストを特定のカテゴリに分類する
- 詐欺検出: 詐欺メールや偽情報を検出する
- 著作権侵害検出: 著作権侵害を検出する
近年の動向
近年では、機械学習や深層学習の技術が文体計量学に応用され、より高精度な分析が可能になっている。また、ソーシャルメディアなどのオンライン上のテキストデータを分析することで、社会現象の解明や世論調査などへの応用も期待されている。