參與開發的第二個功能
間距查詢是接續引導查詢功能,同時也是詞夾子擷取方法(可以參閱引導查詢有關詞夾子的介紹)的實作。間距查詢讓使用者輸入一組查詢詞,可能是文本中很常出現的句子結構,或者是文本中兩個經常出現的人名,系統就會幫忙找出與兩個查詢詞同時出現在文本中的其他詞。
在實習中參與開發新版的間距查詢,相較舊版多了詞性標註和斷詞功能使用者除了可以依照查詢詞組合找到其他的相關詞和詞頻,也可以純粹用詞性或是用詞搭配詞性來查找。
下圖是舊版的間距查詢,使用者可以輸入查兩個查詢詞(或稱詞夾),然後勾選想要尋找前綴(第1夾)、中間(第2夾)、後綴(第3夾)分別要多少詞作統計,選擇完畢後按下查詢。
舊版的間距查詢就會依照使用者輸入的查詢詞、夾數,統計出結果來。結果包含找到的詞和該詞出現的頻率。
新版的間距查詢增加的功能有:
請參考 Figure 2.
按下查詢後,系統會尋找查詢詞組前面、中間、後面所出現的詞、詞性和詞頻。