% dicts/german.README.1st 30 Apr 92 %------------------------------------------------------------ Ich moechte vorab darauf hinweisen, dass ich die in diesem Directory plazierten Woerterlisten nur gesammelt habe, selber keine spell checker benutze und daher ueber die Guete derselben nichts aussagen kann. Weiter unten folgen zwei USENet-Artikel, die Referenzen auf die urspruenglichen Sites sowie eine Qualitaets-Beurteilung geben. Insbesondere letzteren sollte *jeder* lesen, der damit arbeiten will... german-wordlist.new.Z stand in Muenchen (evtl. auch in Erlangen?!). german.ispell.Z ist offensichtlich von german-wordlist.new.Z abgeleitet worden -- wer dies tat, ist mir ebenfalls unbekannt. -- Joachim =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-= Joachim Schrod Email: schrod@iti.informatik.th-darmstadt.de Computer Science Department Technical University of Darmstadt, Germany ---------------- articles follows: From: grr@cbmvax.commodore.com (George Robbins) Corrections-By: Joachim Schrod A while back I did some searching to see what was available in terms of german language wordlists, dictionaries and teaching materials. Attached is the list of what I found. If you have internet access it is easy to retrieve the items. I had considered trying to get the collection archived as such somewhere in the US but didn't get around to it and have some doubts about the copyright status of some of the material. PLEASE DO NOT ASK ME FOR COPIES OF THIS MATERIAL - IT IS TOO LARGE TO SEND VIA MAIL AND I DON'T HAVE TIME AVAILABLE TO HANDLE REQUESTS, LET ALONE POST THIS MESSAGE. I'm not sure which of the two word lists would be be most appropriate as input to the internationalized spell checker mentioned recently. The first would be suitable as a pre-munched input to a dumb spell checker, the second better for one that was capable of generating varients. Note that I display some fixation with gender - this is because all serious language courses stress immediate association of gender tags with vocabulary aquisition. This is extremely important for fluent spoken or written German, sadly optional for reading comprehension. ********************************************************************** german-wordlist: (uni-erlangen) faui43.informatik.uni-erlangen.de [131.188.1.43] /portal/doc/dict/german-wordlist.Z [also on ftp.informatik.tu-muenchen.de, like the others -js] this has ~160K entries. German diacritical marks are transliterated in the oe and ss styles. Words tend to be duplicated with various endings appropriate to the part of speech, and there are many simple compound words, which accounts for much of this list's apparent size. germanl: (tu-muenchen) ftp.informatik.tu-muenchen.de [131.159.0.110] /pub/doc/dict/germanl.Z this has only ~27K entries, but there is much less duplication with different endings or compounding. Diacritical marks are present, with umlaut's as trailing quotes (") and eszett's as capitol S. vok/: (tu-muenchen) ftp.informatik.tu-muenchen.de [131.159.0.110] /pub/doc/dict/vok/* these appear to data suitable for input to a quiz program or printing as "flash cards". They are fairly terse and can be used in either direction. Unfortunately, there is no gender or tense information with the vocabulary items. vok/exercise.vok: 3000 general vocabulary words vok/idioms.vok: 2400 idioms and phrases vok/technik.vok: 800 technical words and phrases "teacher" (simtel-20) simtel20.army.mil education area this is a PC based shareware language teaching system which supports various languages. the version here includes two sets of german course files, additional files and support are available to registered users - see TEACHER.TXT in the .arc file for registration details. The while the program does support diacritical marks (via function keys), it is notoriously stupid about requiring exact matches, including spacing and capitalization, and doesn't support alternate "correct" answers for even the most common synonyms. The vocabulary items don't include gender. germ1-23.arc: GERMAN I: 800 German/English word combinations, 1860 verb conjugations and 160 German/English phrase combinations. germ2-23.arc: GERMAN II: 800 German/English word combinations and 2015 verb conjugation forms. ================ From: icking@gmdzi.gmd.de (Werner Icking) Subject: [dnet.and.sub.general] Re: Liste deutscher Worte / Spellchecker Date: Fri, 17 May 1991 04:55:18 GMT X-Original-Newsgroups: dnet.and.sub.general Da die Nachfrage so grosz ist, habe ich auf beide Listen [german-wordlist == Erlanger und germanl == Muenchner, -js] mal meinen NI-Spellchecker angesetzt (der KI-Spellchecker ist ja noch in Arbeit). Eine allererste Sichtung brachte bereits folgendes zu Tage: Die ***Muenchener*** Woerterliste kennt so nuetzliche Woerter wie ANBE ANLLO" ARGE PM2 PM3 PME PU Und auch der "Aasgeier" fehlt nicht (wohl aber dem Aasgeier sein Genitiv). Auch kennt es Umlaute (U"mla"uto") und Esszet: AdresSbit AdresSbusses AdresSgenerierung Adressberechnungen Adressbus Adresserweiterung Adressgenerator Adressoffsets Adressraum Adressraumerweiterung Anschlu"sS AnschlusS Anschlu"ss Anschluss wobei es aber an der Rechtschreibung hapert. Die teutschen Woerter "Padrta Paella Paintadditiv" finden sich direkt in Reihe. Und auch so beliebte Woerter wie "zusammenaddiert" oder "aufaddiert" fehlen nicht. Wenn es um Genauigkeit geht, findet man u.a. Genau Genaue Genauere Genauikeit Die **Erlangener** Woerterliste kennt AT ATP und viele weitere nuetzliche Buchstabenkombinationen. Bei "Aasgeiern Aasgeiers" fehlt der Nominativ ebenso wie den "Abenddaemmerungen" der Singular. Aehnliches gilt fuer "Bliebe Blinddaerme Blinddaermen Blinddarms Blinde" oder "Daemmerstunde Daemmerungen". So etwas braucht man zum "Buechermachen" Auch hier half die Suche nach Genauigkeit: "Genannten Genaratoren Genau" Und wenn man mal wirklich ganz genaue hinschaut, findet man genaueste genauesten genausowenig genaustem genausten genauster Dem laeszt sich fast nichts mehr "zuaddieren"! Genau Genaue Genauere Genauikeit So etwas ist als *Eingabe* fuer einen Spellchecker gut brauchbar.