コロケーション抽出に使われる C-value とは何か?
コロケーションの定義が割りと曖昧な気がしますが、ここでは「よく利用される連続した単語列」とします。 例えば「辞書を引く」(イディオム)、「濃いコーヒー」(形容詞+名詞)、「交通安全」(複合名詞)とかです。 以下、[1] の要約みたいなものです。1996 年の論文なので、コロケーション抽出に使われる最新指標って…