change some APIs around, bump version #, more ispell work

git-svn-id: svn+ssh://svn.abisource.com/svnroot/enchant/trunk@20830 bcba8976-2d24-0410-9c9c-aab3bd5fdfd6
author: Dom Lachowicz <domlachowicz@gmail.com> 2003-08-30 21:23:42 +0000
committer: Dom Lachowicz <domlachowicz@gmail.com> 2003-08-30 21:23:42 +0000
commit: 663b32ea011492ab90d4b069a5bbc084c29ea66e (patch)
tree: ad296276306b3934623d3110e7b5040d49973f06 /tests
parent: ddf3b84a132dac1313e4fb61b7cf75506115d042 (diff)
download: enchant-663b32ea011492ab90d4b069a5bbc084c29ea66e.tar.gz
3 files changed, 92 insertions, 38 deletions
diff --git a/tests/enchant-ispell.c b/tests/enchant-ispell.c
index 7b3bcbc..141d7cb 100644
--- a/tests/enchant-ispell.c
+++ b/tests/enchant-ispell.c
@@ -74,7 +74,7 @@ consume_line (FILE * in, GString * str)
 
 	g_string_truncate (str, 0);
 
-	while ((ch = fgetc (in)) != EOF) {
+	while (ret && (ch = fgetc (in)) != EOF) {
 		if (ch == '\r')
 			continue;
 		else {
@@ -152,6 +152,59 @@ do_mode_l (FILE * out, EnchantDict * dict, GString * word)
 	}
 }
 
+/* splits a line into a set of (word,word_position) touples */
+static GSList *
+tokenize_line (GString * line)
+{
+	GSList * tokens = NULL;
+	size_t start_pos, cur_pos;
+	char *utf = (char *) line->str;
+
+	GString * word;
+	
+	gunichar uc;
+	
+	start_pos = cur_pos = 0;
+	word = g_string_new (NULL);
+
+	while (cur_pos < line->len && *utf) {
+		uc = g_utf8_get_char (utf); 
+		
+		if (g_unichar_isalpha (uc)) {
+			g_string_append_unichar (word, uc);
+			cur_pos++;
+		}
+		else if (g_unichar_ispunct (uc)) {
+			if (uc == '\'') {
+				g_string_append_unichar (word, uc);
+				cur_pos++;
+			} else {
+				if (word->len) {
+					tokens = g_slist_append (tokens, g_string_new_len (word->str, word->len));
+					tokens = g_slist_append (tokens, GINT_TO_POINTER(start_pos));
+					g_string_truncate (word, 0);
+				}
+
+				start_pos = ++cur_pos;
+			}
+		} else {
+			if (word->len) {
+				tokens = g_slist_append (tokens, g_string_new_len (word->str, word->len));
+				tokens = g_slist_append (tokens, GINT_TO_POINTER(start_pos));
+				g_string_truncate (word, 0);
+			}
+
+			start_pos = ++cur_pos;
+		}
+
+		utf = g_utf8_next_char (utf);
+	}
+
+	g_string_free (word, TRUE);
+
+	return tokens;
+}
+
 static int
 parse_file (FILE * in, FILE * out, IspellMode_t mode)
 {
@@ -159,18 +212,14 @@ parse_file (FILE * in, FILE * out, IspellMode_t mode)
 	EnchantDict * dict;
 	
 	GString * str, * word;
-	const gchar * lang, * utf;
-	gunichar uc;
+	GSList * tokens, *token_ptr;
+	const gchar * lang;
+	size_t pos;
 
-	size_t start_pos, cur_pos;
-	
 	gboolean was_last_line = FALSE;
 
 	if (mode == MODE_A)
 		print_version (out);
-	
-	str = g_string_new (NULL);
-	word = g_string_new (NULL);
 
 	lang = g_getenv ("LANG");
 	if (!lang || !strcmp (lang, "C"))
@@ -180,49 +229,54 @@ parse_file (FILE * in, FILE * out, IspellMode_t mode)
 	dict = enchant_broker_request_dict (broker, lang);
 	if (!dict) {
 		fprintf (stderr, "Couldn't create a dictionary for %s\n", lang);
-		enchant_broker_term (broker);
+		enchant_broker_free (broker);
+		return 1;
 	}
+
+	str = g_string_new (NULL);
 	
 	while (!was_last_line) {
 		was_last_line = consume_line (in, str);
 
 		if (str->len) {
 
-			utf = (gchar *)str->str;
-			start_pos = cur_pos = 0;
-
-			while (cur_pos < str->len && *utf) {
-				uc = g_utf8_get_char (utf); 
-
-				if (g_unichar_isalpha (uc) || uc == '\'') {
-					g_string_append_unichar (word, uc);
-					cur_pos++;
-				} else {
-					if (word->len > MIN_WORD_LENGTH) {
-						if (mode == MODE_A) {
-							do_mode_a (out, dict, word, start_pos);
-						} 
-						else if (mode == MODE_L) {
-							do_mode_l (out, dict, word);
-						}
+			token_ptr = tokens = tokenize_line (str);
+			while (tokens != NULL) {
+
+				word = (GString *)tokens->data;
+				tokens = tokens->next;
+				pos = GPOINTER_TO_INT(tokens->data);
+				tokens = tokens->next;
+
+				if (word->len > MIN_WORD_LENGTH) {
+					if (mode == MODE_A) {
+						do_mode_a (out, dict, word, pos);
+					} 
+					else if (mode == MODE_L) {
+						do_mode_l (out, dict, word);
 					}
-					
-					start_pos = ++cur_pos;
-					g_string_truncate (word, 0);					
 				}
-
-				utf = g_utf8_next_char (utf);
 			}
-		}
 
+			if (token_ptr)
+				g_slist_free (token_ptr);
+			else if (mode == MODE_A)
+				fwrite ("\n", 1, 1, out);
+		} 
+		else if (mode == MODE_A && !was_last_line)
+			fwrite ("\n", 1, 1, out);
+		
 		if (mode == MODE_A)
 			fwrite ("\n", 1, 1, out);
+
+		g_string_truncate (str, 0);
 	}
 	
-	enchant_broker_release_dict (broker, dict);
-	enchant_broker_term (broker);
+	enchant_broker_free_dict (broker, dict);
+	enchant_broker_free (broker);
 
-	g_string_free (word, TRUE);
+	if (word)
+		g_string_free (word, TRUE);
 	g_string_free (str, TRUE);
 
 	return 0;
diff --git a/tests/enchant-lsmod.c b/tests/enchant-lsmod.c
index ebbee17..51c22b8 100644
--- a/tests/enchant-lsmod.c
+++ b/tests/enchant-lsmod.c
@@ -52,7 +52,7 @@ main (int argc, char **argv)
 	
 	enchant_broker_describe (broker, enumerate_dicts, NULL);
 	
-	enchant_broker_term (broker);
+	enchant_broker_free (broker);
 	
 	return 0;
 }
diff --git a/tests/test-enchant.c b/tests/test-enchant.c
index 320edc5..baabd72 100644
--- a/tests/test-enchant.c
+++ b/tests/test-enchant.c
@@ -125,10 +125,10 @@ main (int argc, char **argv)
 			run_dict_tests (dict);
 			
 			enchant_broker_describe (broker, enumerate_dicts, NULL);
-			enchant_broker_release_dict (broker, dict);
+			enchant_broker_free_dict (broker, dict);
 		}
 	
-	enchant_broker_term (broker);
+	enchant_broker_free (broker);
 	
 	return 0;
 }
author	Dom Lachowicz <domlachowicz@gmail.com>	2003-08-30 21:23:42 +0000
committer	Dom Lachowicz <domlachowicz@gmail.com>	2003-08-30 21:23:42 +0000
commit	663b32ea011492ab90d4b069a5bbc084c29ea66e (patch)
tree	ad296276306b3934623d3110e7b5040d49973f06 /tests
parent	ddf3b84a132dac1313e4fb61b7cf75506115d042 (diff)
download	enchant-663b32ea011492ab90d4b069a5bbc084c29ea66e.tar.gz