對於這些代碼,加入字典中所有與拼寫錯誤單詞語音編碼相同的單詞,以及與拼寫錯誤單詞的編輯距離小於指定閾值的單詞。
首先使用最小編輯距離算法和字符匹配算法從語料中分別獲得特定目標詞的形態學變體和縮略詞,並將其作為候選詞變體。
排序:按照編輯距離排序單詞,把每一步驟中找到的單詞放在一起。
樹編輯距離的問題是計算編輯距離和相應的修改腳本。