NER(ねる)
最終更新:2026/4/25
NERは、Named Entity Recognitionの略で、テキスト中から人名、地名、組織名などの固有表現を識別する自然言語処理技術である。
別名・同義語 固有表現抽出固有表現認識
ポイント
NERは、情報抽出や質問応答システムなど、様々な自然言語処理タスクの基礎となる重要な技術である。近年では、深層学習を用いた高性能なNERモデルが開発されている。
NERとは
NER(Named Entity Recognition)は、自然言語処理(NLP)における重要なタスクの一つであり、テキストデータから特定のカテゴリに分類される固有表現(Named Entity)を抽出する技術です。固有表現とは、人名、組織名、地名、日付、金額、製品名など、具体的な事物や概念を指す言葉を指します。
NERの応用例
NERは、以下のような様々な分野で応用されています。
- 情報抽出: ニュース記事や論文などから、特定の情報を自動的に抽出する。
- 質問応答システム: 質問文に含まれる固有表現を認識し、関連する情報を検索する。
- チャットボット: ユーザーの発言に含まれる固有表現を理解し、適切な応答を生成する。
- 顧客分析: 顧客のレビューやアンケートから、製品やサービスに関する意見を分析する。
- 医療情報処理: 医療記録から、病名、症状、薬名などの情報を抽出する。
NERの技術的アプローチ
NERを実現するための技術的なアプローチは、大きく分けて以下の2つがあります。
- ルールベース: あらかじめ定義されたルールに基づいて固有表現を抽出する。この方法は、精度が高い反面、ルールの作成に手間がかかるという欠点があります。
- 機械学習ベース: 大量のテキストデータを用いて、固有表現を識別するモデルを学習する。この方法は、ルールベースに比べて柔軟性があり、未知の固有表現にも対応できるという利点があります。近年では、深層学習を用いた機械学習ベースのNERモデルが主流となっています。
NERの評価指標
NERの性能を評価するためには、以下の指標が用いられます。
- 適合率(Precision): モデルが正しく抽出した固有表現の割合。
- 再現率(Recall): 実際に存在する固有表現のうち、モデルが抽出できた割合。
- F値(F-measure): 適合率と再現率の調和平均。
これらの指標を用いて、NERモデルの性能を客観的に評価することができます。