taking into account word text statistics
git-svn-id: https://russianmorphology.googlecode.com/svn/trunk@25 d817d54c-26ab-11de-abc9-2f7d1455ff7a
This commit is contained in:
@ -26,12 +26,12 @@ import java.io.InputStream;
|
||||
import java.io.InputStreamReader;
|
||||
|
||||
|
||||
public class SuffixEvristicsTest {
|
||||
public class SuffixHeuristicTest {
|
||||
|
||||
@Test
|
||||
public void testShouldDefineCorretCononicalWordForm() throws IOException {
|
||||
SuffixHeuristic suffixHeuristic = new SuffixHeuristic();
|
||||
InputStream stream = this.getClass().getResourceAsStream("/org/apache/lucene/russian/morphology/analayzer/suffix-evristics-test-data.txt");
|
||||
InputStream stream = this.getClass().getResourceAsStream("/org/apache/lucene/russian/morphology/analayzer/suffix-heuristic-test-data.txt");
|
||||
BufferedReader bufferedReader = new BufferedReader(new InputStreamReader(stream, "UTF-8"));
|
||||
String s = bufferedReader.readLine();
|
||||
while (s != null) {
|
@ -4,4 +4,5 @@
|
||||
победы победа
|
||||
поэтическая поэтический
|
||||
произошло произойти
|
||||
test test
|
||||
test test
|
||||
ананасов ананас
|
@ -9,7 +9,7 @@
|
||||
заход
|
||||
на
|
||||
посадка
|
||||
все
|
||||
весь
|
||||
нормальный
|
||||
быть
|
||||
рекомендовать
|
||||
@ -25,7 +25,7 @@
|
||||
новолазаревский
|
||||
антарктида
|
||||
совершаться
|
||||
примерный
|
||||
примерно
|
||||
один
|
||||
раз
|
||||
в
|
||||
|
Reference in New Issue
Block a user